pythonでのwebページのリンク抽出について
クローラーを作ろうと思い、webページのリンクを抽出するコードを欠いていたのですが、
以下の部分で "Attribute Error 'tuple' object hano attribute find"というエラーが出てしまいます。どうすれば回避できるでしょうか
補足:御助言ありがとうございます。コード全体はこのようになってます。
def get_page(page):
start_link = page.find("<a href=")
if start_link == -1:
return None, 0
start_quote = page.find('"', start_link)
end_quote = page.find('"', start_quote+1)
url = page[start_quote+1 : end_quote]
return url, end_quote
def all_get_links(page):
while True:
url, end_quote = get_page(page)
if url:
print(url)
page = page[end_quote:]
else:
break
print(all_get_links(get_page("http://www.yahoo.co.jp/")))