如何判断一个特定字体在PDF::API2中是否包含某个特定字符

5
我在我的Perl应用程序中使用PDF::API2来嵌入OCR输出到相应的图像后面,使得生成的PDF文件可以被搜索,因为OCR输出可以使用pdftotext提取。
目前,一旦应用程序看到OCR输出中的非ASCII字符,它就会从PDF核心字体切换到TTF字体。然而,这真的很hacky,因为核心字体包括大多数西欧字符。 TTF仅对希腊语、俄语、日语等语言需要。
我如何确定特定字体是否包含特定字符(包括CMAP表,以便使用pdftotext进行提取)?

你有研究过 Font::TTF::Font 吗? - tchrist
1个回答

2

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接