根据你的经验,目前在BMP(基本多语言平面)之外的Unicode字符、代码点和范围中,哪些是最常见的?这些字符需要在UTF-8中占用4个字节或在UTF-16中使用代理项。
我本以为答案应该是用于名称中但未包含在最广泛CJK多字节字符集中的中日韩汉字,但在我主要工作的项目——英文维基词典上,我们发现哥特字母表到目前为止更加常见。
更新
我编写了几个软件工具来扫描整个维基百科以寻找非BMP字符,并惊奇地发现即使在日文维基百科中,哥特字母表也是最常见的。这也适用于中文维基百科,但其中还有许多汉字被使用50或70次,包括“”、“”和“”。