読者です 読者をやめる 読者になる 読者になる

セカイ内存在証明

それは多分、単なる思い付き

UbuntuでUTF-8なmecabをインストールするたった一つの冴えたやり方

「たった一つの冴えたやり方」って言葉好きです。

やり方

黙ってapt-get使いましょう。

$ sudo apt-get install mecab mecab-ipadic-utf8

これだけです。簡単ですね?

確かめてみる

$ echo "兄さんはアホなんですか??" | mecab
兄さん   名詞,一般,*,*,*,*,兄さん,ニイサン,ニーサン
は 助詞,係助詞,*,*,*,*,は,ハ,ワ
アホ  名詞,一般,*,*,*,*,アホ,アホ,アホ
な 助動詞,*,*,*,特殊・ダ,体言接続,だ,ナ,ナ
ん 名詞,非自立,一般,*,*,*,ん,ン,ン
です  助動詞,*,*,*,特殊・デス,基本形,です,デス,デス
か 助詞,副助詞/並立助詞/終助詞,*,*,*,*,か,カ,カ
? 記号,一般,*,*,*,*,?,?,?
? 記号,一般,*,*,*,*,?,?,?
EOS

辞書を切り替える

大佐に「3分待ってやる、EUC-JPの辞書にしろ」と言われたときのために書いておきます。

$ update-alternatives --config mecab-dictionary
alternative mecab-dictionary (/var/lib/mecab/dic/debian を提供) には 3 個の選択肢があります。

  選択肢    パス                          優先度  状態
------------------------------------------------------------
* 0            /var/lib/mecab/dic/ipadic-utf8   80        自動モード
  1            /var/lib/mecab/dic/ipadic        70        手動モード
  2            /var/lib/mecab/dic/ipadic-utf8   80        手動モード
  3            /var/lib/mecab/dic/juman         30        手動モード

現在の選択 [*] を保持するには Enter、さもなければ選択肢の番号のキーを押してください: 1

これでバルスせずに済みますね。