PhantomJS生成大型PDF

6
我正在使用PhantomJS将许多(+500)网页转换为PDF文档。问题是,我得到相当大的PDF文件(约900 kb),而这些网页却相对较小 - 70 kb包含图片。为什么文件那么大?在Firefox中进行简单的“保存为PDF”操作可以生成一个200 kb的文件,这是可以接受的。我很快就会处理许多其他网页,并且文件大小可能会成为一个问题。有什么建议吗?
编辑:这里提供两个示例:从PhantomJS输出和Firefox保存为PDF输出。

2
如果可能的话,请使用专业工具如Acrobat Pro来审核您的PDF文件——它会告诉您所有字节的位置。如果不行,请发布一个在线示例链接。问题很可能是PhantomJS本身——即无法尽可能地压缩,不进行字体子集化等等。 - Jongware
我同意Jongware的观点,使用一些PDF工具来找出问题所在。我敢打赌,PhantomJS不会进行任何压缩。 - JasonS
1个回答

3
我也遇到了同样的问题。我试图在有大量数据时缩小PDF的大小。我的观察是,如果您将文本内容(例如段落、表格数据、描述等)放入任何一个标题标签(h1、h2...h6)中,则此部分内容将作为文本呈现在PDF中而不是作为图片。这将减少PDF文件大小。
我不确定为什么div、p、span标签内的内容在PDF中被视为图像而不是文本。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接