係り受け解析器cabochaのインストール
SVMとかを自前で作ったのかインストールがめちゃくちゃ簡単になったcabochaがあると聞いたので入れてみた。
http://chasen.org/~taku/blog/archives/2008/01/cabocha_060_pre.html
前準備
いれたもの
- mecab
- ipadic
- CRF++
(リンク先は現状で最新のもの)
wget http://(ry tar xvzf XXX.tar.gz cd XXX ./configure make sudo make install
ipadicでUTF8使う場合は"./configure --with-charset=utf8"する。
cygwinなどWindows環境に入れる場合は、
Mecabのconfigure時に
./configure LDFLAGS="-liconv" --with-charset=utf8
インストール時にcommon.hで
#if defined(_MSC_VER) || defined(__CYGWIN__) #define for if (0); else for /* why windows.h define such a generic macro */ #undef max #undef min #define snprintf _snprintf #endif
の部分をalgorithmなどいろいろインクルードする前に持ってこないと、"expected unqualified-id before ..."とかいう名前がコンフリクトしてるときによく起こるエラーが出るみたい。まじ、windows.hのmin,maxうざい。
さらに、CRF++のMakefileをいじってあげないとCabochaのインストールの際にlibtoolがらみのリンクエラーが発生する。いじり方はCXXLINKの最後あたりに-no-undefinedをいれてあげるだけ。
いよいよかぼちゃ
いれたもの
- cabocha
インストール法はまぁいつもどおり。tar.bz2を解凍する方法に戸惑ったけど、
bzip2 -dc ファイル名 | tar xvf -
でいけた。環境によってはtar命令のオプションだけでできるっぽいんだけど・・・。
こっちもUTF8使う時に"./configure --with-charset=utf8"する。
Macにインストールする時は"LIBS=-liconv ./configure --with-charset=utf8"にしないといけない。
完了
$ cabocha かぼちゃが簡単に入ってとても幸せ かぼちゃが---D 簡単に-D 入って---D とても-D 幸せ EOS