Python有用于解析HTTP请求和响应的模块吗?

28

httplib(现在已更名为http.client)及其相关组件都拥有conn.getresponse()和HTTPResponse类,但似乎缺少conn.getrequest()的服务器端操作以及一个HTTPRequest类。

我知道BaseHTTPServer和BaseHTTPRequestHandler可以执行此功能,但它们不会将这些方法公开供模块外使用。

基本上,我想要的是将BaseHTTPRequestHandler#parse_request作为静态方法,该方法返回一个HTTPRequest对象,而不是填充成员变量。

3个回答

47

Jeff,为了启用解析,我创建了一个基本HTTP请求处理程序的九行小子类:

from BaseHTTPServer import BaseHTTPRequestHandler
from StringIO import StringIO

class HTTPRequest(BaseHTTPRequestHandler):
    def __init__(self, request_text):
        self.rfile = StringIO(request_text)
        self.raw_requestline = self.rfile.readline()
        self.error_code = self.error_message = None
        self.parse_request()

    def send_error(self, code, message):
        self.error_code = code
        self.error_message = message
现在,您可以通过实例化这个类来获取包含HTTP请求文本的字符串并进行解析:
# Simply instantiate this class with the request text

request = HTTPRequest(request_text)

print request.error_code       # None  (check this first)
print request.command          # "GET"
print request.path             # "/who/ken/trust.html"
print request.request_version  # "HTTP/1.1"
print len(request.headers)     # 3
print request.headers.keys()   # ['accept-charset', 'host', 'accept']
print request.headers['host']  # "cm.bell-labs.com"

# Parsing can result in an error code and message

request = HTTPRequest('GET\r\nHeader: Value\r\n\r\n')

print request.error_code     # 400
print request.error_message  # "Bad request syntax ('GET')"

这个结合 https://dev59.com/0G025IYBdhLWcg3wfmDw 很方便地解析你自己的 HTTPRequest。 - Joe

2

对于服务器端处理,您需要查看类似于wsgiref的东西。

WSGI标准将请求解析为一个简单的字典,其中包含所有相关的头部和元素。


2

您可能会发现WebOb很有用。像Pylons、Turbogears和Bfg这样的框架将其作为API的一部分使用。但是,它的运行基于您正在使用WSGI。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接