我可以帮您将一个Unicode UTF-8字符串转换成带有HTML实体的ASCII码,使用Python进行操作。
具体来说:
因为
是否有 Python 模块/函数/实体字典可以执行以下操作之一:
具体来说:
我需要明确一下:
source = u"Hello…"
wanted = "Hello…"
这不是解决方案:
as_ascii = source.encode('ascii', 'xmlcharrefreplace')
因为
as_ascii
将被设置为 Hello…
- 即使用 XML 字符引用而不是 HTML 字符引用。是否有 Python 模块/函数/实体字典可以执行以下操作之一:
- 将 Unicode 解码为带有 HTML 字符引用的 ASCII。
- 替换具有 XML 字符引用的 ASCII 字符串为适当的 HTML 字符引用。
htmlentitydefs.codepoint2name
对于第二种方法有帮助吗?htmlentitydefs.codepoint2name[8230] == "hellip"
。 - DSM