北野坂備忘録

主にインストールやプログラミングのメモを載せています。

mecabの文字化け

CentOS 6.6 で mecabmecab-ipadic にいくら utf-8 だと指示しても utf-8 にならず文字化けする。

./configure –with-charset=utf-8 –enable-utf8-only

どうしても動かないときは mecab-ipadic 内の *.csv と *.def を全て utf-8 化してからインストールすればいいという話も聞いたが、そこまでするぐらいならもう他の辞書を使ってみる。

とりあえず NAIST Japanese Dictionary を採用。 

http://sourceforge.jp/projects/naist-jdic/

./configure -with-charset=utf8
で make と make install

文字化けせずに動いた。

同じ症状の人はもう諦めて NAIST Japanese Dictionary を使ったほうがいいと思う。