とある企画で分かち書きが必要になったので、MeCabをうちのサーバーにインストールしてみました。
http://mecab.sourceforge.net/
ほかにもKakasiやChasenなどのわかち書きプログラムがありますが、なんとなくMeCabにしました。わたし「もずく」すきなので(意味不明)
まず、MeCab本体のインストールから。
$ su
# cd /usr/ports/japanese/mecab
# make install
portsなので簡単インストール。
また、MeCabにはわかち書き辞書が必要なので、それもインストールしました。
IPA辞書がportsにあるので、これもportsからインストール。
# cd /usr/ports/japanese/mecab-ipadic
今回、UTF-8で扱いたいので、辞書をUTF-8でコンパイルするために、オプションを追加しました。
上記ディレクトリ(「Makefile」と同じディレクトリ)に「Makefile.local」ファイルを作成し、次のように記述します。
CONFIGURE_ARGS += --with-charset=utf8
で、make installします。
# make install
(2007/02/23追記)
最近のportsツリーではmakeの段階で文字コードを指定できるようになったようです。
# cd /usr/ports/japanese/mecab-ipadic
# make WITH_CHARSET=utf-8 install
これでご飯三杯はいけます。
ためしに動作確認してみましょう。
ターミナルのエンコードをUTF-8にセットして、入力。
$ mecab -O wakati
心理的に効果を与える色の組み合わせがあるので、それを有効活用する。
心理 的 に 効果 を 与える 色 の 組み合わせ が ある ので 、 それ を 有効 活用 する 。
おおっ、わかち書かれたw
コメントする