長めの固有名詞が分割されてしまう
分かち書きや形態素解析をする際、長めの固有名詞が2つに分割されてしまいます。
例)外国人 → 外国 / 人
これらをくっつけて出力する方法はありますでしょうか。
ユーザー辞書などに追加するしかないのでしょうか。
できればですが、基本的なMecabを使った以下のコードから改変したいです。
*コード*
import MeCab
m = MeCab.Tagger ("-Owakati")
print(m.parse ("外国人の生活費ランキング、トップは今年も香港 東京は2位"))
*出力*
外国 人 の 生活 費 ランキング 、 トップ は 今年 も 香港 東京 は 2 位