以编程方式在PDF中查找和替换文本

3
我正在尝试创建一个网络脚本,使我能够修改我上传的PDF模板并重新输出它们。我已经尝试过Zend,它可以让我写入PDF,但这意味着在某些空白处留下PDF,这对于我所需的功能来说太原始了。PDFFlip也没有更好。
我们需要实现的功能是可以从PDF中删除内容以及删除和替换。我已经查看了CAM::PDF和changepagestring.pl,但我不确定它是否适合这个工作。我很难找到任何真正的使用示例,而且Perl不是我以前使用过的语言。
这是一个网络项目,但我们使用的语言是灵活的,理想情况下是PHP或ASP.NET C#。最好不要使用Java,除非没有其他选择。
我还应指出,我浏览了FoxitReader SDK,但没有找到任何有用的信息。我从未尝试过实施它,但我发现它没有提到查找和替换的功能。

不知道这本书是否好,但看起来非常有前途。http://www.pdflib.com/download/pdflib-family/pdflib-8/ - DrColossos
谢谢,昨天我仔细研究了一下,虽然它有很多功能,但似乎没有开箱即用的搜索和替换功能。可能可以将几个函数组合在一起创建一个,但由于其高昂的开箱即用价格,我的客户很快就会超出预算。完整版本比Adobe Creator贵3倍。 - Ben
您使用的输入PDF是否受您控制? - William Entriken
2个回答

2

谢谢您的回复,我知道PDF是一种显示格式,很难从中获取文本。在我做研究时,我曾在这个论坛上看到过您发布的文章。虽然它不能解决我的问题,但我会点赞,因为它很有价值。 - Ben

0
也许作为解决方案,最好使用某种更便于编辑的格式来保存和填写模板?例如,您可以将模板保存为Microsoft Word模板,然后在填写后将其导出为PDF。这个thread 可能对此有用。
PDF文件格式不太适合编辑。
或者,您可以将模板准备为包含表单字段的PDF。在这种情况下,填写表单字段是常见且众所周知的任务,有很多pdf组件可用于此。

PDF已从InDesign导出,是名片布局。我不知道您是否能够创建更容易从InDesign中填写的表单字段? - Ben

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接