如何在HTML关键字中使用Unicode字符?

3
HTML文档的meta部分可以包含关键字部分。
<!DOCTYPE html>
<html>
    <head>
        <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
        <meta name="description" content="under construction" />
        <meta name="keywords"
          content="..." />

在这个部分中可以使用Unicode字符吗?例如,\u00B0。如果可以,如何使用?


1
顺便提一下,<!DOCTYPE html> 是 HTML5 的文档类型声明。在 HTML5 中,声明文档字符集的首选方式是使用 <meta charset="..."> 而不是 <meta http-equiv="text/html; charset=..."> - Remy Lebeau
2个回答

7
在HTML文档中,无论是在属性值还是其他位置,您输入的所有字符都必须作为Unicode字符。如果您的文档字符编码为UTF-8(但它最好是UTF-8编码!),则可以直接输入任何字符,例如度符号(°)。如何输入取决于您的创作环境。您也可以使用字符引用(类似于“&#xb0;”)或实体引用(对于某些字符,类似于“&deg;”)。但是,\u00B0不是HTML表示法,只是一个由六个字符组成的序列。它在JavaScript中有特殊含义,但在HTML中没有。相应的HTML表示法是“&#xb0;”。搜索引擎可能会忽略关键字中的特殊字符,例如度符号。但并非一定如此;Google已被观察到在某些特殊情况下对其敏感。(目前似乎不适用于度符号。)在“<meta name=description ...>”标记中,如果搜索引擎在构建搜索结果列表页描述时使用其内容,则特殊字符可能很重要。尽管这种情况比以前发生得少了,但仍然存在。

3
因为使用Unicode作为正文内容的非英语网站也会在元数据中使用Unicode,因此可以合理地假设处理HTML元数据的重要工具能够处理UTF-8编码。
另外要注意的是,至少在历史上,keywords元标记旨在包含人们可能搜索的术语。您的示例\00B0是度数符号;在这种情况下,人们更有可能搜索单词degrees而不是符号°。由于关键字元数据的广泛滥用,许多搜索引擎(包括Google)忽略它们对于搜索排名的影响。
因此,总之,我认为使用Unicode关键字元数据是安全的。但这可能不会提高您网站上这些术语的搜索排名

W3C的建议主要关注控制码等内容,而非标准可打印字符。 - Quentin
谢谢@Quentin。我同意并已编辑我的答案以删除那部分内容。我认为其余部分仍然适用。 - Matthew Strawbridge

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接