Unicode字符的已知URI方案或URN名称空间是什么?

6

我需要使用URI引用Unicode字符。以下IANA参考文献列出了多个方案和命名空间,但没有提及Unicode字符的标识符。是否已经有类似的东西存在?

我希望能找到类似于

  • unicode://U+0394
  • urn:unicode://0394
  • http://unicode.org/unicode/0394

这是为了希腊大写字母delta Δ而设计的。

如果有人想知道,这是用于语义Web应用程序的,使用URI作为概念标识符,包括Unicode字符的概念。

3个回答

3
抱歉,一般情况下没有URL或URN可用于参考Unicode字符的权威信息。在Unicode标准中,有关单个字符的信息部分在所谓的字符数据库(大多数是特定格式的纯文本文件)中,部分在Code Charts(PDF文件)中。它们都没有提供指向单个字符的方法。此外,那里的信息并不全面:有关单个字符信息的重要说明散布在标准中。 Decodeunicode网站具有可单独寻址的项目,例如:

http://www.decodeunicode.org/en/u+0394

但它的信息内容变化很大,通常非常有限。它不是官方的,并且目前仅包含Unicode 5.0。 Fileformat.info网站更为系统化,但它也是非官方的。它基本上仅限于正式属性和可从中推导出的数据,以及从代码图表中提取的注释、在Windows中键入字符的说明,以及关于字体支持的信息 - 但这已经相当多了!例如:

http://www.fileformat.info/info/unicode/char/0394/


1

[编辑]:找到了与您需求匹配的URL:http://unicode.org/cldr/utility/character.jsp?a=1F40F

.

好的,有一个URL引用Unicode数据库上权威信息,尽管它并没有描述(如其他答案中所说)一个特定字符上的所有信息。

您可以使用以下URL指向最新的Unicode数据库。这是一个简单的现有有效Unicode字符列表。一些即将推出的字符可能会缺失(㋿),您应该期望它会发生变化。

内容如下,直接使用并不实用。
$ grep -ai kangaroo UnicodeData.txt -C 7
1F991;SQUID;So;0;ON;;;;;N;;;;;
1F992;GIRAFFE FACE;So;0;ON;;;;;N;;;;;
1F993;ZEBRA FACE;So;0;ON;;;;;N;;;;;
1F994;HEDGEHOG;So;0;ON;;;;;N;;;;;
1F995;SAUROPOD;So;0;ON;;;;;N;;;;;
1F996;T-REX;So;0;ON;;;;;N;;;;;
1F997;CRICKET;So;0;ON;;;;;N;;;;;
1F998;KANGAROO;So;0;ON;;;;;N;;;;;
1F999;LLAMA;So;0;ON;;;;;N;;;;;
1F99A;PEACOCK;So;0;ON;;;;;N;;;;;
1F99B;HIPPOPOTAMUS;So;0;ON;;;;;N;;;;;
1F99C;PARROT;So;0;ON;;;;;N;;;;;
1F99D;RACCOON;So;0;ON;;;;;N;;;;;
1F99E;LOBSTER;So;0;ON;;;;;N;;;;;
1F99F;MOSQUITO;So;0;ON;;;;;N;;;;;

你可以使用类似这样的后缀来构建一个简单的“基于哈希”的命名空间,但这绝对不是标准做法。

1
由于这也被标记为,我将尝试选择易于(且永久)解除引用并且不会被误认为是描述该字符的文档的URI:data:方案。这不仅可以指代Unicode中的字符,还可以指代任何编码以及其中的任何字符串。
尝试打开此URI应导致一个text/plain文件,其内容为单个字符。
如果系统接受IRI(许多语义Web应用程序都是如此),则可以直接包含该字符:
这映射到与上面显示的相同的URI,并且您的浏览器可以直接转换它。在这种情况下,指定UTF-8是必要的,因为对于其他编码未定义该映射。

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接