我正在编写我的第一个Python脚本,试图将Apache日志解析为可访问的对象,但无法使其工作。
我尝试使用这个示例(运行Python 2.7
),并只想让它与单个日志条目一起工作。
以下是我的代码:
import re
from collections import namedtuple
format_pat= re.compile(
r"(?P<host>[\d\.]+)\s"
r"(?P<identity>\S*)\s"
r"(?P<user>\S*)\s"
r"\[(?P<time>.*?)\]\s"
r'"(?P<request>.*?)"\s'
r"(?P<status>\d+)\s"
r"(?P<bytes>\S*)\s"
r'"(?P<referer>.*?)"\s'
r'"(?P<user_agent>.*?)"\s*'
)
Access = namedtuple('Access',
['host', 'identity', 'user', 'time', 'request',
'status', 'bytes', 'referer', 'user_agent'] )
# my entry
log = '2001:470:1f14:169:15f3:824f:8a61:7b59 - ABC-15414 [14/Nov/2012:09:32:31 +0100] "POST /setConnectionXml HTTP/1.1" 200 4 "-" "-" 102356'
match= format_pat.match(log)
print match
if match:
Access( **match.groupdict() )
print Access
我不确定我做错了什么,但是match
返回的是none
,而不是我希望得到的对象。
有人能给我一个提示吗?
re.match
从字符串的开头开始匹配,并在第一个正则表达式失败时返回None
。re.search
将遍历整个字符串并返回匹配项。有关更多信息,请查看文档,这可能仍然与您相关。 - msvalkon