使用UTF-8转义HTML字符?

5
如果我的网站使用UTF-8编码,是否仍然需要转义HTML字符?例如,使用"&"代替"&",这样做有什么好处或坏处?最佳实践是什么?

& 是一个低阶 ASCII 字符,与 Unicode 没有任何关系。 - SLaks
3个回答

6

在HTML中,您仍然需要转义具有特殊含义的字符,如<>&,以避免解析器歧义/无效语法。这与编码无关。但是,并不需要转义每个非ASCII字符,比如将"ö"转义为&ouml;,因为它们可以在UTF-8编码中本地表示。


对于第一个问题,请参见这个问题。有关一般概念,请参见The Great Escapism(或:您需要了解的有关文本内文本工作的内容) - deceze

0

& 是无效的HTML(它是一个未终止的实体引用)。
这与Unicode无关。


0

你必须始终将 < > & 转换为实体,只有在 HTML 属性中才使用 "。

例如:

<a title="tell me &quot;more&quot;">

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接