PythonでMeCabを使うと出力が文字化けしてしまいます。
一日中詰まっています...アドバイスいただきましたら幸いです。
Windows10 64bit版 でMeCabをUTF8指定でインストールし、anaconda3上のpython3.6.5で使用しようとしています。
一通りpathを通し、ラッパーとしてmecab-python-windows0.996をpipインストールしました。
MeCabそのものは正常に動いていて、コマンドプロンプトで以下のように入力すると文字化けせずに出力されます。
<入力>
C:\User\username>mecab
すもももももももものうち
<出力>
すもも 名詞, 一般, .*** ......
.......
一方、pythonのライブラリを使うと以下のように出力されてしまいます。
<入力>
C:\User\username>python
.>>> import MeCab
.>>> m = MeCab.Tagger()
.>>> m.parse("すもももももももものうち")
<出力>
'す\udce3\t\udc96\udcbc\ucd8c, \udc88\udcca.....
.......
import, Tagger等の段階ではエラーは出ません。
普段テキストデータを扱う際、UTF8では詰まってしまい、utf-8-sigでエンコーディングしているので、そのあたりが問題なのかなと思っていますが、どのように対処すればよいのか検討が付きません...。
少しでもアドバイスをいただけましたら大変助かります。
どうぞよろしくお願いいたします。