Python3 - MeCabで日本語文字列の名詞出現数の出し方について
環境:Python 3.5.2, MacOS Sierra
エクセルからデータを読み込んで文字列のデータを作りました。
[In]
import pandas as pd
import MeCab
import sys
df = pd.read_excel("filename.xls", sheetname=0)
df = df.dropna()
print(df)
[Out]
5 セキュリティ面において不安に感じる
17 便利
24 セキュリティが心配
28 興味があります。
63 持っていない。
66 便利だと思いますがもってない
...
998 べんりかもしれないが、あまり使いたくない
1000 便利だとおもう
MeCabを使ってこの文字データから「名詞」のみを抜き出し、さらに出現回数を以下のようなイメージでアウトプットと思っています。どなたかコードの書き方を教えて頂けませんでしょうか?
文字 出現回数
セキュリティー 154
便利 80
不安 45
興味 20
...
また、以下のコードで試して見ると、ちゃんとデータの日本語をMeCabで読み込めたので、日本語のエンコード問題はないと思います。
[In]
m = MeCab.Tagger ("-Ochasen")
for i in df:
print(m.parse (i))
[Out]
セキュリティ セキュリティ セキュリティ 名詞-一般
面 メン 面 名詞-接尾-一般
において ニオイテ において 助詞-格助詞-連語
不安 フアン 不安 名詞-形容動詞語幹
に ニ に 助詞-副詞化
感じる カンジル 感じる 動詞-自立 一段 基本形
EOS