给定网址http://www.example.com,我们能否读取页面的前N个字节?
使用wget,我们可以下载整个页面。
使用curl,有-r,0-499指定前500个字节。似乎解决了这个问题。
您还应该知道,许多HTTP/1.1服务器没有启用此功能,因此当您尝试获取范围时,您将获得整个文档。
在Python中使用urlib。类似的问题here,但根据Konstantin的评论,这是真的吗?
上次我尝试使用这种技术失败了,因为实际上不可能仅从HTTP服务器读取指定数量的数据,即您隐式地读取了所有HTTP响应,然后只读取其中的前N个字节。因此,最终您将下载整个1GB的恶意响应。
那么,我们如何在实践中从HTTP服务器读取前N个字节呢?