ICU:NFD和NFC是什么意思?

7
我找到了一个代码片段,它的作用是将任意字符串变得适合用作URL。代码如下:Any-Latin; NFD; [:Nonspacing Mark:] Remove; NFC; [:Punctuation:] Remove; Lower();我猜那些分号之间的东西应该是要执行的“命令”,但NDF和NFC具体代表什么呢?即使在官方文档中也没有找到相关的解释。

1
https://www.w3.org/TR/charmod-norm/#normalization_forms - Hans Passant
哦,谢谢;你应该把那个作为答案发出来,这样我就可以接受了。我该怎么办? - Adrian Föder
如果那个链接不能帮助你编写自己的答案,那我只能道歉了。 - Hans Passant
@HansPassant 那是一个不错的页面。 - Steven R. Loomis
@AdrianFöder,你在官方文档的哪里查找了?问这个是为了让我可以改进它。 - Steven R. Loomis
1个回答

5
请看ICU音译器和有关TR15规范化形式的链接页面,以获取完整示例。

规范化形式D(NFD) 正规分解

规范化形式C(NFC) 正规分解, 然后是正规组合

规范化形式KD(NFKD) 兼容分解

规范化形式KC(NFKC) 兼容分解, 然后是正规组合


网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接