めも帖

「めも帖」代わりにダラダラと書いていったり、めもしたりしているだけです。

MeCab

MeCabの辞書を増やす(1)

下記のファイルをダウンロードしてみたんだけれど品詞は判別できない。 wget http://download.wikimedia.org/jawiki/latest/jawiki-latest-all-titles-in-ns0.gzもう少し中身があるデータを持ってきたほうがいいのかな? あと、Sennaとかもwikipediaからデー…

MeCabの辞書を増やす(0)

MeCabでテキストを分解し、Yahoo!APIを利用して関連するキーワードを調べてみたりするプログラムを書いてみました。どんなキーワードが一緒に検索されているのかがわかり、面白いです。 けれど、MeCabで気になることがでました。地名がうまく分解されない?…

MeCab extensionでユーザ辞書を利用する

ユーザ辞書を登録して、MeCab上では利用できても、MeCab extensionから利用できませんでした。 なんでだろう?と思って調べてみたらユーザ辞書をMeCab extensionで指定してみると、読み込みできない旨のエラーが表示されてパーミッションを変更したら、大丈…

MeCab extensionで抽出した単語の出現数を出してみる

MeCab extensionの使い方がイマイチわからないまま。一つ一つ見て行ったりしてみました。 なにやら重要そうというか、サンプルにやたらあるのがnodeを利用した関数群。これなに? おそらく、単語毎に細かく処理をしたりすることが出来るようにしてあるんだと…

MeCab extensionはPHP4でも動きました

なんでだ〜、と思いながら最初からやったらきっちり動きました。 ポイントは、PHP.iniにextension = mecab.soを書き忘れていたこと...。 とにかくこれで、MeCabで遊べる(いや、仕事なんですけれど)環境ができました。形態素解析について、書かれた書籍とか…

MeCab extensionのサンプルファイル

MeCab extensionのサンプルファイルをvimで開くとたたまれた箇所があります。たたまれた、という表現が正しいかどうかはわかりませんが、ここではたたまれた、としておきます。 これを開く方法がわからず、調べてた結果。 ページが見つかりませんでした » ビ…

MeCab extensionがPHP5だとすんなり動いた

PHP 5.2.1の環境でやってみた。すんなり動いた。なんで? 何か違ったか?php.iniには何もしていない。不思議。 tar xzf php_mecab-0.2.0.tgz cd php_mecab-0.2.0 phpize ./configure --with-php-config=/usr/local/php/bin/php-config --with-mecab=/usr/loc…

MeCab extensionをインストールしてみた...が、うまくいかない

PHP5の話じゃないけれど。 MeCabをPHPから利用するためにMeCab extensionというのを入れてみた tar xzf php_mecab-0.2.0.tgz cd php_mecab-0.2.0 phpize ./configure --with-php-config=/usr/local/bin/php-config --with-mecab=/usr/local/bin/mecab-config…