我正在使用 Python 中的模块“mechanize”编写一个屏幕抓取脚本,并希望在具有 href 中 javascript:__doPostBack 的链接上使用 mechanize.click_link() 方法。 我相信我试图解析的页面正在使用 AJAX。
注意:mech 是 mechanize.Browser()。
>>> next_link.__class__.__name__
'Link'
>>> next_link
Link(base_url='http://www.citius.mj.pt/Portal/consultas/ConsultasDistribuicao.aspx', url="javascript:__doPostBack('ctl00$ContentPlaceHolder1$Pager1$lnkNext','')", text='2', tag='a', attrs=[('id', 'ctl00_ContentPlaceHolder1_Pager1_lnkNext'), ('title', 'P\xc3\xa1gina seguinte: 2'), ('href', "javascript:__doPostBack('ctl00$ContentPlaceHolder1$Pager1$lnkNext','')")])
>>> req = mech.click_link(next_link)
>>> req
<urllib2.Request instance at 0x025BEE40>
>>> req.has_data()
False
我希望在点击链接后能够检索页面源代码。