めも帖

「めも帖」代わりにダラダラと書いていったり、めもしたりしているだけです。

MeCabの辞書を増やす(0)

MeCabでテキストを分解し、Yahoo!APIを利用して関連するキーワードを調べてみたりするプログラムを書いてみました。どんなキーワードが一緒に検索されているのかがわかり、面白いです。
けれど、MeCabで気になることがでました。地名がうまく分解されない?ようです。おそらく、辞書に掲載されているキーワードが最低限のためなのかな?と思うので、仕方ありません。
問題は、じゃあ、どうやって辞書を増やしていくか?です。あと、辞書が増えた場合、処理速度にどんな影響が出るのか?というのも気になります。気になる箇所はありますが、まずはどうやって辞書を増やすのか?それがポイントになりそうです。