至少在很大程度上,这是我的日常工作。从您的问题中,似乎您考虑的是“机器学习”学科(而不是更广泛的“人工智能”范畴)。我认为您的直觉是正确的——机器学习算法非常适合欺诈预测/检测,因为它可以在高度非线性的领域中进行泛化,并且可以随着新数据的输入进行适应。因此,由于这两个主要特征,欺诈者很难辨别算法对预测的“规则”,因为这些规则实际上是一组复杂的软约束,并且随着算法根据新数据进行学习而随时间变化。(我建议除非您有特殊理由认为路径查找是解决问题的有用启发式方法,否则请将A*设置为一旁——我不愿说没有联系,但如果有联系,那肯定是一个不正统的联系——我从未见过路径查找应用于这种类型的问题)。
您提到的唯一关于您感兴趣的在线欺诈类型的事实是单个用户的多个帐户。毫无疑问,可以应用各种技术来解决此问题,但我会特别提到一种分析技术,因为:
(i)我实际上在您提到的场景中使用过它;
(ii)它超出了其他回答的范围,到目前为止。
该技术基于
图论。前提是:由同一用户拥有的帐户通常最好不是通过其个体行为(点击流)而是通过它们之间的关系——换句话说,通过它们的网络行为来识别。
一个例子:在线扑克中的
筹码转移。在这里,个人在扑克网站上开设多个新账户(使用虚假信息),然后为每个账户声称宣传奖金(例如,100美元的存款将获得100美元的奖金)。当然,奖金有高度限制的“取现规则”,通常需要玩一定数量的手牌,才能将奖金变成现金并从玩家账户中提取。
因此,筹码转移的目的是将这些奖金美元转化为真正的现金。一个人开了五个单独的账户(作为五个不同的人),然后再开一个“合法”的账户(使用他们的真实身份)。这六个玩家——实际上只是一个玩家——将在一个桌子上相互对抗,五个虚假账户会迅速输掉他们的筹码,输给合法账户,后者很快就会因为奖金的取现限制仅适用于最初赠送的账户,所以可以迅速取出他们的赢利;因此,取现限制被完全规避了。
这种方案的难点在于,几乎不可能在个人账户基础上检测到非法行为——*恶意勾结的不良行为源于一组共同拥有的账户之间的
互动*——换句话说,需要在
网络层面研究感兴趣的行为。
因此,
图论是一种自然的分析框架。
我所应用的技术基于卡内基梅隆大学Chau等人的学术论文,题为“
在在线拍卖者网络中检测欺诈性个性”(PDF)。
该论文所涉及的欺诈情景是:eBay上的卖家希望出售一件非常昂贵的物品(他们可能甚至没有拥有,但无论如何,都没有意图将其运送给买家),并且寻找愿意购买的买家。为了让无辜的买家愿意参与交易,欺诈卖家首先通过向一组买家销售商品来获取非常高(人为提高的)
声誉;这些买家通常是由买家控制的虚假账户。
更具体地说,本文作者结合了
两个级别(
账户级别和
网络级别)的数据,使用
信念传播算法在一个
马尔可夫随机场上进行计算。
顺便提一下,这种特征图结构被称为
二分核心,它来自一组账户,在这个组的成员之间进行了大量的交易,但在eBay社区的其他人中很少有这样的交易。