MeCabのPythonバインディングをインストールする

2014-08-17
このエントリーをはてなブックマークに追加

CentOSにMeCabをインストールする方法の続きなんですけど、MeCab入れたらPythonから叩くよね、ってことでバインディングもインストールしておきます。

wget https://mecab.googlecode.com/files/mecab-python-0.996.tar.gz
tar zxfv mecab-python-0.996.tar.gz
cd mecab-python-0.996
python setup.py build
python setup.py install

これだけだとimportしたときにエラーが出ます。

ImportError: libmecab.so.2: cannot open shared object file: No such file or directory

そこで、

sudo vi /etc/ld.so.conf

/usr/local/lib #この行を追加

sudo ldconfig

やっとimportできるようになります。

$ python
Python 2.7.7 (default, Jun 4 2014, 17:11:14)
[GCC 4.4.7 20120313 (Red Hat 4.4.7-4)] on linux2
Type “help”, “copyright”, “credits” or “license” for more information.
>>> import MeCab

Tags: ,

CentOSにMeCabをインストールする方法

2013-12-12
このエントリーをはてなブックマークに追加

正直今更な感じもするのですが、なんだかんだで毎回調べなおしちゃうのでメモ。

sudo wget https://mecab.googlecode.com/files/mecab-0.996.tar.gz
sudo tar zxfv mecab-0.996.tar.gz
cd mecab-0.996
sudo ./configure --with-charset=utf8 --enable-utf8-only
sudo make
sudo make install

本体のインストールはこれだけ。あとは辞書のインストール。IPA辞書じゃなくてUniDicを使ってみます。こちらのページでバイナリが公開されてるので落としてきて解凍したあとMeCabに「辞書はここだよー」って教えてあげるだけです。

場所に特にこだわりはないんですけど、ipadicが/usr/local/lib/mecab/dic/ipadicに置かれるので今回は同じ場所(/usr/local/lib/mecab/dic/unidic)に置いてみました。

で、mecabrcを編集。

sudo vi /usr/local/etc/mecabrc
dicdir = /usr/local/lib/mecab/dic/unidic #辞書の場所を指定

これで完了。

$ mecab
わたしまけましたわ
わたし     ワタシ     ワタシ     私     代名詞               0
まけ     マケ     マケル     負ける     動詞-一般     下一段-カ行     連用形-一般     0
まし     マシ     マス     ます     助動詞     助動詞-マス     連用形-一般
た     タ     タ     た     助動詞     助動詞-タ     終止形-一般
わ     ワ     ワ     わ     助詞-終助詞
EOS

MeCabいじってると楽しすぎてあっという間に時間が溶けます。