使用jodconverter和OpenOffice将doc/docx文件转换为pdf

3

我正在使用 jodconverterOpenOffice 3.3 将docx文件转换为pdf,命令如下:

java -jar jodconverter-cli-2.2.2.jar test.docx test.pdf

在尝试转换大多数语言时,它能够很好地工作,但我不能将用中文或日文编写的文档进行转换。这样做时,我得到的是乱码而不是文本:

enter image description here

我尝试安装了日语和中文OpenOffice语言包,并使用了jodconverter 3.0 beta 4,但结果相同。

测试文件

如何为这些语言添加支持?

是否有其他工具(最好是开源)可以使用?

1个回答

1

看起来我使用的OO版本存在漏洞。我通过以下方式使其正常工作:

  1. 更新到最新的OpenOffice。
  2. 下载缺失的ttf文件。
  3. 按照此指南(或此处)在Linux中安装Windows True Type字体。

为了确保字体已正确安装,请运行:

fc-list

要搜索特定的语言,请使用:lang =。例如,对于印地语:

fc-list :lang=hi

在添加了MingLiU.ttf字体和baekmuk-ttf-fonts rpm包之后,我成功地进行了转换。


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接