numpy genfromtxt でutf-8ファイルを読み込む際のUnicodeDecodeErrorについて
python3.4, OSX 10.9.5, numpy 1.11.0 を用いています。
import numpy as np
data = np.genfromtxt("hoge.tsv", delimiter="\t", names=True, dtype=float, converters={1: lambda x: x.decode('utf_8')})
を行ったところ、UnicodeDecodeErrorが出ます。
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe3 in position 1: ordinal not in range(128)
hoge.tsvはutf-8できちんとコーディングできています。
一行目がヘッダー、二行目以下は小数や整数が並んでいます。
一行目のヘッダーのところにのみ日本語が用いられていて、
「日付_2015年」「性別」のようなヘッダーがついています。
ヘッダー行を抜かしたファイルを作成したところ、正しく読み込むことができました。
ここやここのように解決しようとしているのですが、解決できません。
python
import sys
sys.getdefaultencoding()
'utf-8'
とpython自体のデフォルトはutf-8であることは確認しています。
dtype=float の指定などがいけないのでしょうか?
どのようにすれば良いのでしょうか。
ご教示いただけますと幸いです。