我希望支持UTF8排序规则,以支持以下语言:
- 英文
- 波斯语
- 阿拉伯语
- 法语
- 日语
- 中文
UTF8_GENERAL_CI
是否支持所有这些语言?
是的,没错。UTF-8 是 Unicode 字符集的一种编码方式,支持世界上几乎所有的语言。
我认为唯一的区别在于对结果进行排序时可能会有不同的字母顺序(例如重音符号、分音符等)。此外,在另一种排序规则下,比较 a
和 ä
的行为可能会有所不同。
_ci
后缀表示排序和比较是大小写不敏感的。
http://www.collation-charts.org/ 对您可能会感兴趣。
UTF8_GENERAL_CI
曾经是一个不错的选择。但现在它存在一些缺点。utf8mb4_unicode
或 utf8mb4_unicode_ci
而不是 general。