我正在编写一个程序,将定期解析Apache日志文件以记录其访问者、带宽使用情况等。
问题在于,我不想打开已经解析过的日志并重新解析数据。例如:
line1
line2
line3
如果我解析那个文件,我会保存所有行,然后保存该偏移量。这样,当我再次解析它时,我就可以得到:line1
line2
line3 - The log will open from this point
line4
line5
第二次循环,我将获取line4和line5。希望这有意义...
我需要知道的是,我该如何完成这个操作?Python有seek()函数来指定偏移量...那么我只需要在解析完日志后获取其文件大小(以字节为单位) ,然后将其用作第二次记录时的偏移量(在seek()函数中)吗?
我似乎想不出编写代码的方法。 >.<