用于表示组合字符的Unicode字形是什么?

14
我的应用需要显示“孤立”的组合字符。我想使用与“官方”Unicode图表相同的格式,使用点圆占位符。例如,请参见: 组合变音符号(PDF)
快速浏览图表后,我找到了U+25CC“DOTTED CIRCLE”。那看起来不错,但是这个字符的注释是:
请注意,该字符的参考字形故意大于此标准中用于指示组合字符的点圆字形;例如,0300
这意味着U+25CC不是正确的字符。 (或者,如果是,则可能只是一个措辞不当的注释。)
因此:如果在“组合变音符号”上使用的点圆不是U+25CC,则该小家伙的正确代码是什么?
我已经尝试过:
从PDF中复制文本并检查它,但是在PDF中禁用了复制。
将其作为HTML附件发送到Gmail并查看附件,但是它会转换为U+0024(“美元符号”)。这意味着要么转换失败,要么他们只是在PDF中进行一些字体渲染游戏。

[澄清] 我意识到U+25CC看起来还不错(假设字体支持它),但听起来规范说这是错误的字符。许多Unicode字符具有类似的字形,但在语义上是不同的字符。对于大多数字体来说,“拉丁大写字母A”(U+0041)和“希腊大写字母Alpha”(U+0391)看起来相同,但它们具有不同的语义含义,不能互换。


大多数字体实际上包含一个点圆形字形,如果需要覆盖字母等,则可以使用它们。但是字形不必映射到代码点!许多字体将这些内部字形映射到Unicode的私有使用部分,这意味着它们可能在字体之间差异很大。因此,您可能可以使用低级字体访问来获取它。但是,不同的字体可能以不同的方式实现它,因此可能没有一种方法可以检索适用于所有具有该字形的字体的字形。25CC可能是最好的选择。 - hippietrail
2个回答

8
我认为没有官方的占位符字符。根据我的理解,他们任意选择了U+25CC,仅用于显示目的。然后,在图表中列出“真正”的点圆,他们将其放大了一点,以强调它在那里不被用作占位符(或者也许他们在其他图表中缩小了它;正如你所说,这个注释掉的措辞很糟糕)。
无论如何,我认为使用U+25CC作为您的占位符是没有问题的。

3

刚刚尝试了一下:创建一个空白的 .html 文件,复制文本,然后在 Firefox 中加载。显示效果符合预期(虽然我真的没想到空格+组合字符会正确显示):

<html>
<body>
<font size="24pt">
&#x25CC;&#x0300;
&#x25CC;&#x0301;
&#x25CC;&#x0302;
&#x25CC;&#x0303;
<br/>
&#x0041;&#x0300;
&#x0041;&#x0301;
&#x0041;&#x0302;
&#x0041;&#x0303;
<br/>
&#x0020;&#x0300;
&#x0020;&#x0301;
&#x0020;&#x0302;
&#x0020;&#x0303;
</font>
</body>
</html>

2
我在原问题中添加了澄清。我意识到U+25CC看起来是正确的,但根据规范,在语义上它似乎不是正确的字符。 - Dave Mateer

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接