在PDF文件中搜索希腊字符

7

我不知道如何在pdf中搜索希腊字母。怎么办?最好能在pdf阅读器软件包内完成。

根据我看到的论坛帖子,希腊字母不属于pdf规范中包含的标准Unicode字符。


为什么您不能检查字母是否匹配 [\u0391-\u03A9,\u03B1-\u03C9]? - A.B.Cade
当我使用xpdf中的pdftotext命令时,希腊字符会变成拉丁字符。我认为这是因为pdftotext输出的是utf-8格式,而utf-8格式不包括希腊字母链接。我应该使用哪个pdf2text输出设置才能包含希腊字符? - Chogg
1
关于您的第一条评论,您尝试过“pdftotext -enc UTF-8 input.pdf output.txt”吗? - A.B.Cade
ASCII7似乎可以解决连字错误,但无法解决希腊字母的问题。当我在emacs中查看UTF-8时,f连字和希腊字母都会出现错误。当然,我可能没有正确的emacs插件,这可能是我的问题根源。在emacs中看到希腊字母并不能真正解决我的问题。我需要一个软件包的附加组件,如pdf-exchange、qiqqa或类似的,允许搜索希腊字符。 - Chogg
我在planetpdf.com或pdfzone.com上找不到任何相关信息。 - Chogg
显示剩余2条评论
2个回答

3
我已经明白了我做错的事情,它非常基础。
我可以通过使用字符映射或切换到希腊字母键盘(例如αβγ)来搜索希腊字母。
通常会找到希腊字符。 但是许多PDF文件无法正确识别希腊字符,而是将字符近似为其他形状的乱码。 这可能取决于PDF文件的制作方式。

0

我至少成功地在 PDF 中搜索希腊字符 σ,只需进入其维基百科页面并将其复制粘贴到 Acrobat Reader 搜索窗口即可。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接