めも帖

「めも帖」代わりにダラダラと書いていったり、めもしたりしているだけです。

MeCabとUTF8

MeCabを動かそうとインストールしたまま放置していました。
CentOS 4.5でインストールしていたのですが、CentOS 4.5は普段UTF8。
MeCabは、EUCが基本らしいのです。すると、正しい解析結果が出てこない。
そこで、辞書をUTF8に変更するために、再コンパイル。

./configure --with-charset=utf8

これで大丈夫でした。