使用Ghostscript从PDF中提取文本 - 未知设备:txtwrite

3
我正在尝试从PDF中提取文本。我正在使用Ghostscript,但是当我运行以下命令时: gs -dBATCH -dNOPAUSE -sDEVICE=txtwrite mypdf.pdf 会出现以下错误:
Unknown device: txtwrite
Unrecoverable error: undefined in .uninstallpagedevice
Operand stack:
             defaultdevice

有什么想法吗?txtwrite不是默认的ghostscript设备吗?
这是“gs -v”的输出。
GPL Ghostscript 8.70 (2009-07-31)

并且那个操作系统版本是 CentOS release 5.8 (Final)


1
尝试研究一下这个主题 PDF文本提取。我认为你的GS版本不支持txtwrite设备。 - valex
1个回答

8

如果我没记错,txtwrite设备是在Ghostscript 9.05中引入的(当前版本为9.06)。8.70版本实在太老了,包含不了这个设备。

请升级至更高版本。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接