如何检查一条消息中是否含有组合字符?

16

我还没找到任何方法来检测这些文字。我正在制作一种反垃圾邮件工具,因为它们可能会影响用户体验和产生垃圾信息,所以我认为没有必要保留它们。

我的目标是

if (getMessage().getRawContent().contains(combined character).delete();

如果有人知道一种简单的方法来检查组合字符,请发布!

如果您对我所询问的内容感到困惑,我可以进一步解释并提供更多示例(如果需要)。


这是只有我的浏览器出了问题还是问题本来就是这样的 http://imgur.com/a/zNR17?好奇怪啊 o.O - Jorge Campos
5
@JorgeCampos 我相信这是有意为之的。问题在于如何检测组合字符的滥用。 - VGR
1
@Jorge:我的也是,而且可以说:这个 hack 真是太棒了!等待承诺的更多示例。是的,我们需要它们! - statosdotcom
3
你们看过这个臭名昭著的回答吗? - VGR
@statosdotcom 你可以玩弄这个小工具(忘了是谁制作的,但不是我制作的)http://jsbin.com/erajer/edit?html 当你找到组合字符的HTML ID时,你可以创建一些极长的死亡线。它们曾经也可以用作YouTube的用户名,一个人的名字占据了一半的评论区域。 - Miss Cartoon
显示剩余3条评论
1个回答

15

有许多情况下,一个或两个连续的组合字符是完全有效的文本。我会寻找四个或更多的组合字符:

if (getMessage().getRawContent().matches(".*\\p{Mn}{4}.*"))

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接