Python Unicode 转换为日语字符

Question

Python Unicode 转换为日语字符

3

我正在尝试使用Python将u'\u30c9\u30e9\u30b4\u30f3'转换为日语字符。

以下是我的示例代码：

s = u'\u30c9\u30e9\u30b4\u30f3'.encode('utf-8')
print str(s)

我遇到了这个错误 UnicodeEncodeError: 'ascii'编解码器无法对第0-3个位置的字符进行编码：该值不在128的范围内。

- Min Min

哪一行出错了？我似乎无法重现它。 - Neil

追溯（最近的调用在最后）：文件“c：/api/test.py”，第2行，在<module>中 print（s.decode（'utf-8'））文件“C：\ Python27 \ lib \ encodings \ cp437.py”，第12行，在encode中返回codecs.charmap_encode（输入，错误，encoding_map） UnicodeEncodeError：'charmap'编解码器无法对位置0-3的字符进行编码：字符映射到<undefined> - Min Min

1

https://dev59.com/KXVD5IYBdhLWcg3wWaVh - Argus Malware

这是我的测试代码，但仍然出现错误UnicodeEncodeError: 'charmap'编解码器无法对位置0-3的字符进行编码：字符映射到<undefined>。 import sys, codecs, locale print sys.stdout.encoding sys.stdout = codecs.getwriter(locale.getpreferredencoding())(sys.stdout) print sys.stdout line = u'\u30c9\u30e9\u30b4\u30f3' print type(line), len(line) sys.stdout.write(line) print line - Min Min

1

请不要在评论区发布错误消息或多行代码片段。那很难阅读。请编辑您的问题并将它们放在那里，格式正确。 - Tomalak

被注释的代码（应该在问题中进行编辑）与问题中的代码完全不同。问题代码也没有产生所声称的错误。请参见[ask]和如何创建[mcve]。 - Mark Tolonen

3个回答

2

我在Windows 10上的REPL中使用日语字符时遇到了UnicodeEncodeError错误。

我按照Mark Tolonen的建议，前往

更改系统区域设置

在区域设置中。有一个选项说

测试版：使用 Unicode UTF-8 支持全球语言。

我勾选了这个选项，并保持当前系统区域设置为英语（即不变）。
重新启动后，REPL开始正确地打印日语字符。

- vjou

0

您获得的是以字节为单位的 s。要获取日语字符，请使用 print(s.decode('utf-8'))。

- hcheung

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Mark Tolonen · Accepted Answer

这将取决于您的操作系统和配置，但通常情况下，您只需打印Unicode字符串。如果您的操作系统、默认终端编码和字体支持日语，则只需要：

>>> s = u'\u30c9\u30e9\u30b4\u30f3'
>>> print s
ドラゴン

在Linux上，这需要您的终端正确配置为（通常）UTF-8。

在Windows上，您需要一个支持UTF-8的IDE，但如果使用Windows控制台，则会出现UnicodeEncodeError，除非使用支持日语的本地化版本的Windows，或者更改系统区域设置为日语。另一个解决方法是使用win-unicode-console和安装日语控制台字体。

我上面的示例使用了随pywin32模块一起提供的PythonWin IDE，并且在附带标准Python安装的Python IDLE IDE中也可以使用。