CentOSにMeCabをインストールする方法

2013-12-12
このエントリーをはてなブックマークに追加

正直今更な感じもするのですが、なんだかんだで毎回調べなおしちゃうのでメモ。

sudo wget https://mecab.googlecode.com/files/mecab-0.996.tar.gz
sudo tar zxfv mecab-0.996.tar.gz
cd mecab-0.996
sudo ./configure --with-charset=utf8 --enable-utf8-only
sudo make
sudo make install

本体のインストールはこれだけ。あとは辞書のインストール。IPA辞書じゃなくてUniDicを使ってみます。こちらのページでバイナリが公開されてるので落としてきて解凍したあとMeCabに「辞書はここだよー」って教えてあげるだけです。

場所に特にこだわりはないんですけど、ipadicが/usr/local/lib/mecab/dic/ipadicに置かれるので今回は同じ場所(/usr/local/lib/mecab/dic/unidic)に置いてみました。

で、mecabrcを編集。

sudo vi /usr/local/etc/mecabrc
dicdir = /usr/local/lib/mecab/dic/unidic #辞書の場所を指定

これで完了。

$ mecab
わたしまけましたわ
わたし     ワタシ     ワタシ     私     代名詞               0
まけ     マケ     マケル     負ける     動詞-一般     下一段-カ行     連用形-一般     0
まし     マシ     マス     ます     助動詞     助動詞-マス     連用形-一般
た     タ     タ     た     助動詞     助動詞-タ     終止形-一般
わ     ワ     ワ     わ     助詞-終助詞
EOS

MeCabいじってると楽しすぎてあっという間に時間が溶けます。

PythonでUTCとJSTの相互変換

2013-12-07
このエントリーをはてなブックマークに追加

UTCをJSTに変換するのは以前に書いたのですが、ついでにJSTをUTCにするのも書いておこうと。

# -*- encoding: utf-8 -*-

import pytz
import datetime

def main():

    _t = "2013-10-25T07:27:00Z"
    _d = datetime.datetime.strptime(_t, '%Y-%m-%dT%H:%M:%SZ')

    _z = pytz.timezone('Asia/Tokyo')
    _j = _z.fromutc(_d)
    print 'JST', _j
    print 'UTC', _j.astimezone(pytz.utc)

if __name__ == "__main__":
    main()

Python2.7です。Python3では試してないです。

Tags: