我们如何区分deflate流和deflateRaw流？

Question

我们如何区分deflate流和deflateRaw流？

node.jshttpzlib

6

一些HTTP服务器发送未经zlib标头处理的deflate原始主体（而不是实际的deflate主体）。请参见讨论：为什么现实世界中的服务器更喜欢gzip而不是deflate编码？。

在Node.js中是否可以检测它们并正确处理inflate？我的意思是除了尝试createInflate并捕获错误，然后再尝试createInflateRaw。

- bitinn

2个回答

1

理论上，不可能区分这两者。在下面的示例中，buf既是有效的原始deflate流，也是有效的zlib流。

const zlib = require('node:zlib')

const buf = Buffer.from([
    0x08, 0x1d, 0x79, 0xe2, 0x86, 0x1d, 0x79,
    ...Array(31003).fill(0),
    0x09, 0xc6, 0x0d, 0x39, 0xf2,
    ...Array(3522).fill(0),
    0x71, 0xa4, 0x02, 0x08,
])

console.log(zlib.inflateRawSync(buf))
// <Buffer 1d 79 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ... 34481 more bytes>

console.log(zlib.inflateSync(buf))
// <Buffer 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 ... 34480 more bytes>

实际上，大多数压缩器的实现在对齐到字节边界时会插入零位，因此可以通过检查第一个字节的低4位来区分，就像其他答案中所描述的那样。

- Victor

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Mark Adler · Accepted Answer

如果十六进制的第一个字节的低半字节为8，则它是一个zlib流。否则它是一个未经处理的deflate流。(假设您事先知道唯一可能的选择是有效的zlib流或有效的deflate流)。未经处理的deflate流永远不会在第一个半字节中有8，但zlib流总是会有。

背景： zlib头格式将压缩方法放在第一个字节的低半字节中。该压缩方法对于deflate总是8。原始deflate流中的位序列从字节的最低有效位开始。如果前三位是000（如8），那么表示是存储块（即未压缩块），并且它不是最后一个块。存储块将输入字节放置在字节边界上。因此，在写入000位之后，压缩器执行的下一件事情是用零位填充其余的位以到达下一个字节边界。因此，下一个位永远不会是1，因此有效的deflate流不可能使前四位为1000或第一个半字节为8。（请注意，位是从下往上读取的。）有效的deflate流的第一个（即低）半字节只能为0..5或a..d。如果看到6..9，e或f，则不是有效的deflate流。