エンコーディングされている文字コードはどのように確認できますか?
python3.xにおいて、urllib.requestモジュールを使用して、得られたデータをutf-8でデコードしたところ以下のようなエラーが発生しました。
f = urllib.request.urlopen('http://www.google.com')
text = f.read().decode("utf-8")
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
UnicodeDecodeError: 'utf-8' codec can't decode byte 0x90 in position 102: invalid start byte
つきましては以下2点をお教えください。
・エラーの原因はアクセスしたURLで得られたHTMLファイルの文字コードがUTF-8ではないからという理解であっていますか?
・アクセス先のウェブページの文字コードの確認はどのようにすれば良いのでしょうか?
よろしくお願いいたします。