Python:tarfile流

5

我想从一个tar包中读取一些文件并将其保存到一个新的tar包中。 这是我写的代码。

archive = 'dum/2164/archive.tar'

# Read input data.
input_tar = tarfile.open(archive, 'r|')
tarinfo = input_tar.next()
input_tar.close()

# Write output file.
output_tar = tarfile.open('foo.tar', 'w|')
output_tar.addfile(tarinfo)
output_tar.close()

不幸的是,输出的tarball文件无法使用:

$ tar tf foo.tar
./1QZP_A--2JED_A--not_reformatted.dat.bz2
tar: Truncated input file (needed 1548288 bytes, only 1545728 available)
tar: Error exit delayed from previous errors.

有什么办法可以在Python中实时读写tar包吗?
1个回答

5

好的,这是我成功完成它的方法。

archive = 'dum/2164/archive.tar'

# Read input data.
input_tar = tarfile.open(archive, 'r|')
tarinfo = input_tar.next()
fileobj = input_tar.extractfile(tarinfo)

# Write output file.
output_tar = tarfile.open('foo.tar', 'w|')
output_tar.addfile(tarinfo, fileobj)

input_tar.close()
output_tar.close()

3
请注意,您仍然可以使用 r|w| 模式,以便数据可以按流而非整个tar文件读取到内存/磁盘中。 - Yuval

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接