使用Python压缩(归档)旧日志文件

6

我正在使用Python中的标准日志记录库。例如,有RotatingFileHandler可以每天轮换日志文件。

但它只是重命名它们。如果它不仅可以重命名,还可以将旧文件放入zip(或gz,bzip等)归档文件中,那将是很好的。

有没有简单的方法来实现这一点?


子类化它并实现这个。 - BrainStorm
3个回答

7

我认为您最好的选择是扩展RotatingFileHandler,可以像下面这样做(未经测试):

import os
from logging.handlers import RotatingFileHandler


COMPRESSION_SUPPORTED = {}

try:
   import gzip
   COMPRESSION_SUPPORTED['gz'] = gzip
except ImportError:
   pass

try:
   import zipfile
   COMPRESSION_SUPPORTED['zip'] = zipfile
except ImportError:
   pass


class NewRotatingFileHandler(RotatingFileHandler):

     def __init__(self, *args, **kws):
         compress_mode = kws.pop('compress_mode')

         try:
             self.compress_cls = COMPRESSION_SUPPORTED[compress_mode]
         except KeyError:
             raise ValueError('"%s" compression method not supported.' % compress_mode)

         super(NewRotatingFileHandler, self).__init__(self, *args, **kws)

     def doRollover(self):
         super(NewRotatingFileHandler, self).doRollover()

         # Compress the old log.
         old_log = self.baseFilename + ".1"
         with open(old_log) as log:
             with self.compress_cls.open(old_log + '.gz', 'wb') as comp_log:
                 comp_log.writelines(log)

         os.remove(old_log)

看起来你的方法现在是最好的解决方案。谢谢。 - werewindle
“.1”是什么意思? - Cacheing
@Cacheing 请参阅RotatingFileHandler文档:“如果backupCount不为零,则系统将通过将扩展名“.1”,“.2”等附加到文件名来保存旧的日志文件。” - dwurf
2
这段代码无法正确处理 backupCount > 1 的情况,因为压缩文件的重命名不正确。 - Jörn Hees
1
请参考以下链接的版本,该版本处理了 backupCount > 1 的情况:https://dev59.com/GFrUa4cB1Zd3GeqPgx40#35547094 - Thomasleveil

7

采纳的答案只会归档一个文件-(basefile.log.1)。其他文件不会被归档。 这段代码将归档除基本文件之外的所有日志文件。

import os
import gzip
import logging.handlers

class NewRotatingFileHandler(logging.handlers.RotatingFileHandler):
    def __init__(self, filename, **kws):
        backupCount = kws.get('backupCount', 0)
        self.backup_count = backupCount
        logging.handlers.RotatingFileHandler.__init__(self, filename, **kws)

    def doArchive(self, old_log):
        with open(old_log) as log:
            with gzip.open(old_log + '.gz', 'wb') as comp_log:
                comp_log.writelines(log)
       os.remove(old_log)

   def doRollover(self):
      if self.stream:
          self.stream.close()
          self.stream = None
      if self.backup_count > 0:
          for i in range(self.backup_count - 1, 0, -1):
              sfn = "%s.%d.gz" % (self.baseFilename, i)
              dfn = "%s.%d.gz" % (self.baseFilename, i + 1)
              if os.path.exists(sfn):
                  if os.path.exists(dfn):
                      os.remove(dfn)
                  os.rename(sfn, dfn)
      dfn = self.baseFilename + ".1"
      if os.path.exists(dfn):
          os.remove(dfn)
      if os.path.exists(self.baseFilename):
          os.rename(self.baseFilename, dfn)
          self.doArchive(dfn)
      if not self.delay:
          self.stream = self._open()

3
您可以通过使用encoding='bz2-codec'来初始化RotatingFileHandler,自动编写压缩日志文件:
import logging
import logging.handlers as handlers

if __name__=='__main__':
    log_filename='log_rotate.bz2'
    logger = logging.getLogger(__name__)
    logger.setLevel(logging.DEBUG)
    handler = handlers.RotatingFileHandler(
        log_filename, maxBytes=20, backupCount=5, encoding='bz2-codec')
    logger.addHandler(handler)
    for i in range(20):
        logger.debug('i = %d' % i)

PS. Python3已将'bz2-codec'从有效编码集中移除,因此本解决方案仅适用于Python2。


当日志被追加时,这是否有效?我认为不会,但尚未验证。 - ron rothman

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接