如何使用python-pdfkit中的from_string生成包含非ASCII字符的PDF文件

Question

如何使用python-pdfkit中的from_string生成包含非ASCII字符的PDF文件

6

我在使用Python 3.5.2、python-pdfkit以及wkhtmltox-0.12.2时，遇到了一个难题，即无法生成带有非ASCII字符的简单PDF文件。以下是我能够编写的最简单的示例：

import pdfkit
html_content = u'<p>ö</p>'
pdfkit.from_string(html_content, 'out.pdf')

这就像输出文档的样子：

- jllopezpino

3个回答

2

在选项中设置字符集也是可能的。这样，您就不必更改HTML文件——特别是如果您不是创建它的人，并且不想搞砸它。

def get_options():
    return {
        'encoding': 'UTF-8',
        'enable-local-file-access': True
    }
pdfkit.from_string(html, verbose=True, options=get_options(), configuration=_pdfkit_config)

- user2793390

如果不更改原始HTML，按照您所说的方式无法正常工作。 - Nwawel A Iroume

1

在pdfkit项目中有一个相关问题https://github.com/devongovett/pdfkit/issues/470，内容如下：

"You need to use an embedded font. The built-in fonts have a limited character set available."

这个问题的答案如何在nodejs的pdfkit中输出欧元符号给出了如何实现的线索。

- piokuc

1

我意识到有3个名为pdfkit的项目。Nodejs的那个与Python的那个没有任何关系。Python和Ruby的那些是wkhtmltopdf的接口。无论如何，感谢您的回复！ - jllopezpino

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- jllopezpino · Accepted Answer

我发现只需要在我的HTML代码中添加一个带有charset属性的元标签：

import pdfkit

html_content = """
<!DOCTYPE html>
<html>
<head>
    <meta charset="utf-8">
</head>
<body>
    <p>&euro;</p>
    <p>áéíóúñö</p>
<body>
</html>
"""

pdfkit.from_string(html_content, 'out.pdf')

实际上我花了相当长的时间去追随像这里提出的错误解决方案。如果有人感兴趣，我在我的博客上写了一个短故事。抱歉打扰了 :)