关联标签
104得票3回答
真正的好的、坏的UTF-8示例测试数据

我们有XSS防护过滤器来测试,但除了一个无害的示例页面之外,我找不到任何恶意或畸形的测试数据来确保我的UTF-8代码可以处理错误行为的数据。 我在哪里可以找到一些好的嗯..坏数据用于测试?或者有什么复杂的字符序列吗?

56得票2回答
非字符 U+FDD0 至 U+FDEF 的目的是什么?

为了让字节顺序标记正常工作,U+FFFE需要成为一个非字符。 在Unicode标准中,U+FFFF被描述为“作为哨兵在内部使用是有用的”。很有道理。 但我无法弄清楚,而且Unicode标准也没有真正解释,为什么非字符集包括“阿拉伯表现形式-A”中的一些随机块。这些是用来做什么的?(除了瞪眼...

26得票4回答
一个有效的Unicode字符串能包含FFFF吗?Java/CharacterIterator有问题吗?

这是java.text.CharacterIterator文档的一部分: 这个接口定义了一个文本的双向迭代协议。迭代器遍历一个有限序列的字符。previous()和next()方法用于迭代。如果...,它们将返回DONE,表示迭代器已到达序列的末尾。 static final char D...