Python エラー'cp932' codec can't encode character
pythonでスクレイピングをしようとしています。
元ネタ
http://qiita.com/shizuma/items/9dbcfd9ebe6b988572f6
どうしても
cp932 codec can't encode character '\u014d'in position6: ilegal multibyte
sequence
というエラーが帰ってきてしまいます。
別の記事も参考にして修正しようとしましたが、
http://qiita.com/narupo/items/663dafee9c2d20311083
i/o operation on closed file
という別のエラーが出てきてしまいます。
以下コードです。
import requests
from bs4 import BeautifulSoup
import csv
import time
base_url = 'https://en.wikipedia.org/wiki/'
url_list = ['List_of_Japanese_actors', 'List_of_Japanese_actresses']
all_names = []
for i in range(len(url_list)):
target_url = base_url + url_list[i]
target_html = requests.get(target_url).text
soup = BeautifulSoup(target_html, 'html.parser')
names = soup.select('#mw-content-text > h2 + ul > li > a')
for k, name in enumerate(names):
all_names.append(name.get_text())
time.sleep(1)
print('scraping page: ' + str(i + 1))
f = open('all_names.csv', 'w')
writer = csv.writer(f, lineterminator='\n')
writer.writerow(['name'])
for name in all_names:
writer.writerow([name])
f.close()
いろいろ試しているのですが、うまい解決策もなく質問させていただきました。
どうかよろしくお願いいたします。