1月 13, 2012
admin

形態素解析でユーザー辞書を追加する

使用している辞書では100%な解析結果とならないので、
自分で必要な辞書を作ります。

[root@wwwXXXXXX ~]# vi /home/user/user.dic
○○○,-1,-1,10,名詞,固有名詞,地域,一般,*,*,○○○,マルマルマル,マルマルマル

形式は、

表層形,左文脈ID,右文脈ID,コスト,品詞,品詞細分類1,品詞細分類2,品詞細分類3,活用形,活用型,原形,読み,発音

作成ができたら、mecabの形式に変換します。

[root@wwwXXXXXX ~]# /usr/local/libexec/mecab/mecab-dict-index -d /usr/local/lib/mecab/dic/ipadic -u user.dic -f utf8 -t utf8 user.csv

reading user.csv ... 1
emitting double-array: 100% |###########################################| 

done!

完了すると、user.dicができあがるので、mecabrcにユーザー辞書として登録します。

[root@wwwXXXXXX ~]# vi /usr/local/etc/mecabrc
userdic = /home/user/user.dic

Leave a comment