係り受け解析器cabochaのインストール

SVMとかを自前で作ったのかインストールがめちゃくちゃ簡単になったcabochaがあると聞いたので入れてみた。

http://chasen.org/~taku/blog/archives/2008/01/cabocha_060_pre.html

前準備

いれたもの

(リンク先は現状で最新のもの)

wget http://(ry
tar xvzf XXX.tar.gz
cd XXX
./configure
make
sudo make install

ipadicでUTF8使う場合は"./configure --with-charset=utf8"する。

cygwinなどWindows環境に入れる場合は、
Mecabのconfigure時に

./configure LDFLAGS="-liconv" --with-charset=utf8

インストール時にcommon.hで

#if defined(_MSC_VER) || defined(__CYGWIN__)
#define for if (0); else for
/* why windows.h define such a generic macro */
#undef max
#undef min
#define snprintf _snprintf
#endif

の部分をalgorithmなどいろいろインクルードする前に持ってこないと、"expected unqualified-id before ..."とかいう名前がコンフリクトしてるときによく起こるエラーが出るみたい。まじ、windows.hのmin,maxうざい。


さらに、CRF++のMakefileをいじってあげないとCabochaのインストールの際にlibtoolがらみのリンクエラーが発生する。いじり方はCXXLINKの最後あたりに-no-undefinedをいれてあげるだけ。

いよいよかぼちゃ

いれたもの

インストール法はまぁいつもどおり。tar.bz2を解凍する方法に戸惑ったけど、

bzip2 -dc ファイル名 | tar xvf -

でいけた。環境によってはtar命令のオプションだけでできるっぽいんだけど・・・。
こっちもUTF8使う時に"./configure --with-charset=utf8"する。
Macにインストールする時は"LIBS=-liconv ./configure --with-charset=utf8"にしないといけない。

完了

$ cabocha
かぼちゃが簡単に入ってとても幸せ
かぼちゃが---D
      簡単に-D
        入って---D
          とても-D
              幸せ
EOS