UbuntuでUTF-8なmecabをインストールするたった一つの冴えたやり方
「たった一つの冴えたやり方」って言葉好きです。
やり方
黙ってapt-get
使いましょう。
$ sudo apt-get install mecab mecab-ipadic-utf8
これだけです。簡単ですね?
確かめてみる
$ echo "兄さんはアホなんですか??" | mecab 兄さん 名詞,一般,*,*,*,*,兄さん,ニイサン,ニーサン は 助詞,係助詞,*,*,*,*,は,ハ,ワ アホ 名詞,一般,*,*,*,*,アホ,アホ,アホ な 助動詞,*,*,*,特殊・ダ,体言接続,だ,ナ,ナ ん 名詞,非自立,一般,*,*,*,ん,ン,ン です 助動詞,*,*,*,特殊・デス,基本形,です,デス,デス か 助詞,副助詞/並立助詞/終助詞,*,*,*,*,か,カ,カ ? 記号,一般,*,*,*,*,?,?,? ? 記号,一般,*,*,*,*,?,?,? EOS
辞書を切り替える
大佐に「3分待ってやる、EUC-JPの辞書にしろ」と言われたときのために書いておきます。
$ update-alternatives --config mecab-dictionary alternative mecab-dictionary (/var/lib/mecab/dic/debian を提供) には 3 個の選択肢があります。 選択肢 パス 優先度 状態 ------------------------------------------------------------ * 0 /var/lib/mecab/dic/ipadic-utf8 80 自動モード 1 /var/lib/mecab/dic/ipadic 70 手動モード 2 /var/lib/mecab/dic/ipadic-utf8 80 手動モード 3 /var/lib/mecab/dic/juman 30 手動モード 現在の選択 [*] を保持するには Enter、さもなければ選択肢の番号のキーを押してください: 1
これでバルスせずに済みますね。