webページのソースに貼られたリンク先のhtmlファイルを取得する
やりたいことはリンクHP(下のpythonコードのurlと同じです)の背景がグレーの部分のデータをDataframeに格納することです.
背景がグレーの部分はリンク先のページに埋め込まれたhtmlファイルとなっていまして,リンクHPのソースを見ると
html
</TABLE>
<IFRAME src="/html/frm/DamFreeData2018071116325029223.html"
scrolling="AUTO" width="840" height="65%" align="center" frameborder="0"
style="border-width : 0px 0px 0px 0px;"></IFRAME>
</CENTER>
の「/html/frm/DamFreeData2018071116325029223.html」にデータのリンクが張られています.直接pandas.read_html(/html/frm/DamFreeData2018071116325029223.html)するのも1つの解決策なのですが,事情により最初に冒頭のHPに接続して,ソースのhtmlから'/html/frm/DamFreeData2018071116325029223.html'を取得したいのです.
現状は
#!/usr/bin/python
import pandas as pd
import numpy as np
url='http://163.49.30.82/cgi-bin/DspDamData.exeKIND=1&ID=609061289920060&BGNDATE=20120701&ENDDATE=20120731&KAWABOU=NO'
dfs = pd.read_html(url)
#dfs = pd.read_html(url, header=0,index_col=0)#htmlを読み込む
print(dfs)
とするとほしいデータの部分がNaNと表示されてしまいます.どなたか解決策を教えていただけないでしょうか?