Python Socket发送HTTP 1.1 CONNECT请求但无有效响应

5

我希望编写一个简单的程序,尝试在443端口上与www.google.com创建https隧道。我首先尝试了以下代码:

import socket

def main():
    s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    s.connect(("www.google.com", 80))
    request = "CONNECT www.google.com:443 HTTP/1.1\n\n"
    s.send(request.encode())
    print(s.recv(4096).decode())

main()

这导致了以下结果:
HTTP/1.1 405 Method Not Allowed

Content-Type: text/html; charset=UTF-8

Referrer-Policy: no-referrer

Content-Length: 1592

Date: Wed, 16 Aug 2017 07:56:14 GMT

Connection: close



<!DOCTYPE html>
<html lang=en>
  <meta charset=utf-8>
  <meta name=viewport content="initial-scale=1, minimum-scale=1, width=device-width">
  <title>Error 405 (Method Not Allowed)!!1</title>
  <style>
    *{margin:0;padding:0}html,code{font:15px/22px arial,sans-serif}html{background:#fff;color:#222;padding:15px}body{margin:7% auto 0;max-width:390px;min-height:180px;padding:30px 0 15px}* > body{background:url(//www.google.com/images/errors/robot.png) 100% 5px no-repeat;padding-right:205px}p{margin:11px 0 22px;overflow:hidden}ins{color:#777;text-decoration:none}a img{border:0}@media screen and (max-width:772px){body{background:none;margin-top:0;max-width:none;padding-right:0}}#logo{background:url(//www.google.com/images/branding/googlelogo/1x/googlelogo_color_150x54dp.png) no-repeat;margin-left:-5px}@media only screen and (min-resolution:192dpi){#logo{background:url(//www.google.com/images/branding/googlelogo/2x/googlelogo_color_150x54dp.png) no-repeat 0% 0%/100% 100%;-moz-border-image:url(//www.google.com/images/branding/googlelogo/2x/googlelogo_color_150x54dp.png) 0}}@media only screen and (-webkit-min-device-pixel-ratio:2){#logo{background:url(//www.google.com/images/branding/googlelogo/2x/googlelogo_color_150x54dp.png) no-repeat;-webkit-background-size:100% 100%}}#logo{display:inline-block;height:54px;width:150px}
  </style>
  <a href=//www.google.com/><span id=logo aria-label=Google></span></a>
  <p><b>405.</b> <ins>That’s an error.</ins>
  <p>The request method <code>CONNECT</code> is inappropriate for the URL <code>/</code>.  <ins>That’s all we know.</ins>

这意味着服务器不允许执行此请求。因此我认为问题在于端口号。所以我将其更改为443(这是https连接的端口)。代码如下:

def main():
    s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    s.connect(("www.google.com", 443))
    request = "CONNECT www.google.com:443 HTTP/1.1\n\n"
    s.send(request.encode())
    print(s.recv(4096).decode())

main()

但它没有像应该的那样输出有效的响应,而是给了我一个空的响应。那么问题是:“为什么会这样?我如何使它正常工作?”注意:我不想使用内置的 urllib 或 urllib2 库。我想用 sockets 实现。


将此更改请求为:request = "GET www.google.com:443 HTTP/1.1\r\n\r\n" - RaminNietzsche
1个回答

6

HTTP

在你对端口80的原始连接中,你只是使用了错误的Host

import socket


def main():
    s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    s.connect(('google.com', 80))
    request = b'CONNECT google.com HTTP/1.1\n\n'
    s.send(request)
    print(s.recv(4096).decode())

main()

响应:

HTTP/1.0 200 Connection established

或者直接使用 GET 方法:

request = b'GET http://google.com HTTP/1.1\n\n'

响应与HTTPS请求相同,由于某种原因,在google.com主机上无法正常工作。

HTTPS

为了使用HTTPS连接,您应该在套接字中包含ssl隧道(不确定术语是否正确),并且在连接后立即准备好使用GET方法:

import socket
import ssl


def main():
    s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    s = ssl.wrap_socket(s)
    s.connect(('google.com', 443))
    request = b'GET google.com HTTP/1.1\n\n'
    s.send(request)
    print(s.recv(4096).decode())

main()

响应:

HTTP/1.1 302 Found
Cache-Control: private
Content-Type: text/html; charset=UTF-8
Referrer-Policy: no-referrer
Location: https://www.google.ru/?gfe_rd=cr&ei=WwCUWc66L6qB3APs7ZPABA
Content-Length: 259
Date: Wed, 16 Aug 2017 08:20:43 GMT
Alt-Svc: quic=":443"; ma=2592000; v="39,38,37,35"

<HTML><HEAD><meta http-equiv="content-type" content="text/html;charset=utf-8">
<TITLE>302 Moved</TITLE></HEAD><BODY>
<H1>302 Moved</H1>
The document has moved
<A HREF="https://www.google.ru/?gfe_rd=cr&amp;ei=WwCUWc66L6qB3APs7ZPABA">here</A>.
</BODY></HTML>

首先感谢您的回答。其次,您确定您编写的未包装代码是有效的吗?因为我尝试了解释它,但没有任何变化。 - Anastassis Kapetanakis
是的,我收到了“200连接已建立”的响应。我正在使用Python 3.6,也许这就是问题所在? - bakatrouble
我使用Python 6.2版本,并复制粘贴了第一个http代码。不幸的是,它没有任何作用!它返回了405状态码[方法不允许]。 - Anastassis Kapetanakis
6.2?你尝试发送GET请求了吗? - bakatrouble
GET请求正常工作。问题出现在CONNECT请求中。 - Anastassis Kapetanakis
为了帮助您理解我所说的内容,我正在尝试制作一个简单的代理服务器,以连接我的浏览器。 - Anastassis Kapetanakis

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接