CentOSにMeCabをインストールする方法

正直今更な感じもするのですが、なんだかんだで毎回調べなおしちゃうのでメモ。

sudo wget https://mecab.googlecode.com/files/mecab-0.996.tar.gz
sudo tar zxfv mecab-0.996.tar.gz
cd mecab-0.996
sudo ./configure --with-charset=utf8 --enable-utf8-only
sudo make
sudo make install

本体のインストールはこれだけ。あとは辞書のインストール。IPA辞書じゃなくてUniDicを使ってみます。こちらのページでバイナリが公開されてるので落としてきて解凍したあとMeCabに「辞書はここだよー」って教えてあげるだけです。

場所に特にこだわりはないんですけど、ipadicが/usr/local/lib/mecab/dic/ipadicに置かれるので今回は同じ場所(/usr/local/lib/mecab/dic/unidic)に置いてみました。

で、mecabrcを編集。

sudo vi /usr/local/etc/mecabrc
dicdir = /usr/local/lib/mecab/dic/unidic #辞書の場所を指定

これで完了。

$ mecab
わたしまけましたわ
わたし     ワタシ     ワタシ     私     代名詞               0
まけ     マケ     マケル     負ける     動詞-一般     下一段-カ行     連用形-一般     0
まし     マシ     マス     ます     助動詞     助動詞-マス     連用形-一般
た     タ     タ     た     助動詞     助動詞-タ     終止形-一般
わ     ワ     ワ     わ     助詞-終助詞
EOS

MeCabいじってると楽しすぎてあっという間に時間が溶けます。