我有一个JSON文件,其中包含以下编码的字符串:
"sender_name": "Horn\u00c3\u00adkov\u00c3\u00a1",
我尝试使用json
模块解析此文件。但是,我无法正确地解码此字符串。
在使用.load()
方法解码JSON后,我得到的是'HornÃ\xadková'
。该字符串应正确解码为'Horníková'
。
我阅读了JSON规范,并理解了\u
之后应该有4个十六进制数字,指定字符的Unicode编号。但似乎在这个JSON文件中,UTF-8编码的字节被存储为\u
序列。
这是什么类型的编码方式,如何在Python 3中正确解析它?
根据规范,这种类型的JSON文件是否有效?
json.load()
的文件时是否指定了编码? - Will Keeling