如何判断一个特定字体在PDF::API2中是否包含某个特定字符

Question

5

我在我的Perl应用程序中使用PDF::API2来嵌入OCR输出到相应的图像后面，使得生成的PDF文件可以被搜索，因为OCR输出可以使用pdftotext提取。

目前，一旦应用程序看到OCR输出中的非ASCII字符，它就会从PDF核心字体切换到TTF字体。然而，这真的很hacky，因为核心字体包括大多数西欧字符。 TTF仅对希腊语、俄语、日语等语言需要。

我如何确定特定字体是否包含特定字符（包括CMAP表，以便使用pdftotext进行提取）？

- DobbyTheElf

你有研究过 Font::TTF::Font 吗？ - tchrist

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Lee Goddard · Accepted Answer

你尝试过使用与字形相关的方法吗？ http://search.cpan.org/dist/PDF-API2/lib/PDF/API2/Resource/BaseFont.pm#GLYPH_RELATED_METHODS 如果不行，也许可以将字形渲染到另一个文档中并进行测量。