A.nnotate.com背后使用了哪些技术?

4

我想知道像A.nnotate.com、Scribd和Google Docs这样的服务是如何将pdf、.doc或任何其他文档呈现为HTML,并且注释系统是如何工作的?

1个回答

5

A.nnotate.com在服务器上使用xpdf对PDF页面进行特定缩放级别的转换为PNG图像,这些图像将在浏览器中显示。

文本高亮是通过从PDF中提取文本位置,然后在单词上方添加透明覆盖层和绝对定位的HTML DIVS来完成的。注释使用ajax gui将注释附加到突出显示的文本上。

其他格式(如MS Word、PPT等)首先使用openoffice转换为PDF,然后转换为图像和文本覆盖,与PDF相同。

我认为其他HTML文档网站也会采用类似的方式将PDF呈现为HTML(即页面图像+透明DIV上的单词叠加),另一种替代方法是将PDF嵌入字体转换为HTML5 CSS字体,并使用绝对定位的divs来定位文本(以及提取和定位图像)。


非常感谢!由于您的帮助,我能够完成我的项目。 - thinkquester

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接