我正在尝试在Python 3中将表情符号转换为其Unicode表示。例如,我有一个表情符号,并希望得到相应的Unicode 'U+1F600'。同样,我想将'U+1F600'转换回表情符号。我已经阅读了文档并尝试了几个选项,但是Python的行为使我感到困惑。
>>> x = ''
>>> y = x.encode('utf-8')
>>> y
b'\xf0\x9f\x98\x80'
表情符号被转换为字节对象。
>>> z = y.decode('utf-8')
>>> z
''
将字节对象转换回表情符号,目前为止一切顺利。
现在,获取表情符号的 Unicode 编码:
>>> c = '\U0001F600'
>>> d = c.encode('utf-8')
>>> d
>>> b'\xf0\x9f\x98\x80'
这将再次打印出字节编码。
>>> d.decode('utf-8')
>>> ''
这将再次打印出表情符号。我真的无法弄清如何仅在Unicode和表情符号之间进行转换。