我正在尝试从日志文件中提取访问过的唯一文件,例如"GET /socview/svspring01D.htm HTTP/1.1"*
因为我知道要提取的格式,所以我想写一个正则表达式来提取所有这些文件。我已经写了一个,但我对它不是很满意。我希望能得到一些帮助(我是编程新手)。
另外,由于我可以使用GET
作为起点,所以我不想将其提取到字典中,是否有任何方法可以做到这一点?我正在使用一个字典来计算每个文件被访问的次数。
match = re.search (r'^GET.*\.1' ,logfile)