Rで結合されたHTMLテーブルデータのスクレイピング
前提・実現したいこと
rでhtmlスクレイピングをしたいのですが、結合されたテーブル内にURLが複数あります。
それをテーブルの行毎に取得したいのですが、どうにも取れません。
ネスト型のデータフレームに落とし込むのにはどうしたらよいでしょうか?
発生している問題・エラーメッセージ
doc_parse_file(con, encoding = encoding, as_html = as_html, options = options) でエラー:
Expecting a single string value: [type=character; extent=2635].
該当のソースコード
coin_ico_url <- "https://www.coingecko.com/ja/ico?show_by=ended"
coin_ico_test <- read_html(coin_ico_url, encoding = "UTF-8") %>%
+ html_nodes(xpath= '//*[contains(concat( " ", @class, " " ), concat( " ", "table-scrollable", " " ))] | //*[contains(concat( " ", @class, " " ), concat( " ", "mb-0", " " ))]') %>%
+ html_text() %>%
+ data.frame(stringsAsFactors = FALSE)