我在尝试使用 Python 2.5 更改编码时遇到了困难。
我有一个 XML 响应,我将其编码为 UTF-8:response.encode('utf-8')
。这很好,但使用此信息的程序不喜欢这种编码,我必须将其转换为其他代码页。真实的例子是,我使用 ghostscript python 模块将 pdfmark 数据嵌入 PDF 文件中 - 最终结果在 Acrobat 中出现了错误的字符。
我已经用 .encode()
和 .decode()
在 'utf-8' 和 'latin-1' 之间进行了多种组合,但我无法输出正确的结果,让我感到非常困扰。
如果我使用.encode('utf-8')
将字符串输出到文件中,然后使用 i.e. iconv.exe 将该文件从 UTF-8 转换为 CP1252(也称为 latin-1),并嵌入数据,则一切都正常。
基本上,有人可以帮助我将 UTF-8 编码为十六进制 C3 A1
的字符 á 转换为十六进制 E1
的 latin-1 吗?
s = "ALL INFORMATION IRRECOVERABLY LOST"
。我相信你会发现这种算法比你尝试的任何其他算法都要快,也更加诚实。 - tchrist