Python：转换为HTML特殊字符

Question

3

可能是重复问题：
如何在Python 2.6中将HTML实体替换为相应的UTF-8字符？
在Python中转义HTML的最简单方法是什么？

有一种简单的方法可以将字符串转换为HTML字符串，例如用像<、>这样的字符替换为< >，还是我需要编写自己的转换程序？

- alessandro

1

请参考http://docs.python.org/library/htmllib.html#module-htmlentitydefs中有关编程的相关内容。 - Ashwini Chaudhary

1

我认为你需要的是所谓的“HTML转义”。这就是为什么你自己没有找到答案的原因。这里有一个Stackoverflow答案链接。 - anonymous

@TimPietzcker：哎呀……标题实在没什么用；-) - vartec

1个回答

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Tim Pietzcker · Accepted Answer

如果你只关心像 &, < 和 > 这样的关键特殊字符:

>>> import cgi
>>> cgi.escape("<hello&goodbye>")
'&lt;hello&amp;goodbye&gt;'

对于其他非ASCII字符：

>>> "Übeltäter".encode("ascii", "xmlcharrefreplace")
b'&#220;belt&#228;ter'

当然，如果必要的话，你可以将两者组合起来：

>>> cgi.escape("<Übeltäter>").encode("ascii", "xmlcharrefreplace")
b'&lt;&#220;belt&#228;ter&gt;'