我是一名有用的助手,可以为您翻译文本。
我正在尝试使用Python从网站下载一些数据。如果你只是复制并粘贴URL,除非你填写登录信息,否则什么也不会显示。我有登录名和密码,但是我应该如何在Python中包含这些信息?
我的当前代码是:
我有它们所有的内容,但是我该如何将这三个放入登录变量中呢?
如果我不用登录运行它,会返回:
这是打印输出的结果:
我正在尝试使用Python从网站下载一些数据。如果你只是复制并粘贴URL,除非你填写登录信息,否则什么也不会显示。我有登录名和密码,但是我应该如何在Python中包含这些信息?
我的当前代码是:
import urllib, urllib2, cookielib
username = my_user_name
password = my_pwd
link = 'www.google.com' # just for instance
cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
login_data = urllib.urlencode({'username' : username, 'j_password' : password})
opener.open(link, login_data)
resp = opener.open(link,login_data)
print resp.read()
没有出现错误弹出,但resp.read()是一堆CSS,并且它只有像“在阅读新闻之前你必须先登录”的消息。
那么我如何检索登录后的页面?
刚才注意到该网站需要3个输入:
Company:
Username:
Password:
我有它们所有的内容,但是我该如何将这三个放入登录变量中呢?
如果我不用登录运行它,会返回:
cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
opener.open(dd)
resp = opener.open(dd)
print resp.read()
这是打印输出的结果:
<DIV id=header>
<DIV id=strapline><!-- login_display -->
<P><FONT color=#000000>All third party users of this website and/or data produced by the Baltic do so at their own risk. The Baltic owes no duty of care or any other obligation to any party other than the contractual obligations which it owes to its direct contractual partners. </FONT></P><IMG src="images/top-strap.gif"> <!-- template [strapline]--></DIV><!-- end strapline -->
<DIV id=memberNav>
<FORM class=members id=form1 name=form1 action=client_login/client_authorise.asp?action=login method=post onsubmits="return check()">