我正在寻找一个样本文本Unicode文件(UTF-8),可用于测试与文本编码和解码相关的不同问题,包括:
这将有助于识别在解码、编码甚至数据库级别可能出现的不同Unicode相关问题。
- 低ASCII字符使用,例如前32个代码
- 超出BMP范围的字符
- NFC相关问题
- XML编码/解码问题
这将有助于识别在解码、编码甚至数据库级别可能出现的不同Unicode相关问题。