Python 平日土日を分けてcsvに出力したい
「食べログ」から営業時間を取得し、それを平日と土日に分けて
平日開始時刻, 平日終了時刻, 土日祝開始時刻, 土日祝日終了時刻, 定休日
というようにcsvに出力したいです。
今のところpandasを使ってcsvに出力をしようと考えています。
どうやれば上手く平日土日を判別して、またそれを区切って出力できるかがわかりません。
宜しくお願いします。
<kunifさんより>
# -*- coding: utf-8 -*-
import requests
from bs4 import BeautifulSoup
import re
newlines = re.compile(r'\n{2,}')
def scrape_info(soup_table):
"""
基本情報の抽出
"""
global newlines
soup_telnum = soup_table.find("strong", class_="rstinfo-table__tel-num")
soup_address = soup_table.find("p", class_="rstinfo-table__address")
soup_tr_list = soup_table.find_all("tr")
for soup_tr in soup_tr_list:
if soup_tr.th.string in {"店名", "営業時間"}:
item = ''
if (soup_tr.th.string == "店名"):
item = soup_tr.td.get_text().strip()
else:
item = newlines.sub("\n", soup_tr.td.get_text("\n").strip())
print(item)
print(soup_telnum.get_text())
print(soup_address.get_text())
return
def scrape_item(item_url):
"""
個別情報ページのパーシング
"""
r = requests.get(item_url)
if r.status_code != requests.codes.ok:
print(f"error:not found{item_url}")
return
soup = BeautifulSoup(r.content, 'lxml')
soup_table = soup.find("table", class_="rstinfo-table__table")
scrape_info(soup_table)
return
scrape_item('https://tabelog.com/tokyo/A1303/A130301/13182370/')