我正在尝试解析使用Python Requests库执行的HEAD请求的结果,但似乎无法访问响应内容。
根据文档,我应该能够从requests.Response.text访问内容。这对于GET请求在我这里可以正常工作,但是对于HEAD请求返回None。 GET请求(有效)
根据文档,我应该能够从requests.Response.text访问内容。这对于GET请求在我这里可以正常工作,但是对于HEAD请求返回None。 GET请求(有效)
import requests
response = requests.get(url)
content = response.text
内容 = <html>...</html>
HEAD请求(无内容)
import requests
response = requests.head(url)
content = response.text
内容 = 无
编辑
好的,我很快意识到从答案中得知 HEAD 请求不应该返回内容- 只有头部。但这是否意味着,要访问页面中在 <head>
标记中找到的东西,比如 <link>
和 <meta>
标签,必须获取整个文档?
<link>
和meta
标签这样的东西?还是不可能的? - Yarin<link>
和<meta>
标签只存在于HTML body中。您可以访问的唯一标题是HTTP头。你为什么要发送HEAD而不是GET呢? - phihag<meta>
标签位于文档的<head>
部分-在此页面上查看源代码。我希望只获取<head>
以减少链接抓取的时间。 - Yarin<head>
的长度,则可以在请求中包含 Range 标头,但我怀疑除非完整的 HTML 代码真的很大,否则这将加速事情的进展。 - phihag