最近一次维基百科破坏检测比赛的获胜者建议,可以通过“考虑QWERTY键盘布局检测随机键盘敲击”来提高检测效果。
例如:woijf qoeoifwjf oiiwjf oiwj pfowjfoiwjfo oiwjfoewoh
是否有已经实现这个功能的软件(最好是免费且开源)?
如果没有,是否有一个旨在实现此目标的活跃FOSS项目?
如果没有,您会如何建议实现这样的软件?
最近一次维基百科破坏检测比赛的获胜者建议,可以通过“考虑QWERTY键盘布局检测随机键盘敲击”来提高检测效果。
例如:woijf qoeoifwjf oiiwjf oiwj pfowjfoiwjfo oiwjfoewoh
是否有已经实现这个功能的软件(最好是免费且开源)?
如果没有,是否有一个旨在实现此目标的活跃FOSS项目?
如果没有,您会如何建议实现这样的软件?
根据我的经验,大多数键盘敲击都集中在主键区。检查使用的字符是否高度集中在 asdfjkl;
上是相当简单的。
asasasasasdf
可以使用连接as
、sa
、sd
和df
的语法生成。关于KISS - 运行文本通过英语拼写检查器,如果它失败了,那么可以得出结论,它可能是胡言乱语(问题是,为什么要区分快速输入的胡言乱语与随机无意义或者非常拼错的文本?)
另外,如果考虑其他键盘布局(Dvorak,任何人?)和语言,则可以运行文本通过所有可用的语言拼写检查器,然后继续(这也将提供语言自动检测)。
这不是非常有效的方法,但可以用作基准测试。
注意:
从长远来看,我想破坏分子会适应并开始破坏,例如摘自其他维基百科页面的摘录,这将最终很难自动检测到作为破坏行为(好吧,现有的文本可以进行校验和并在重复时引发标志,但如果文本来自其他来源,那么最终将很难)。