人工智能方法检测游戏作弊

Question

人工智能方法检测游戏作弊

algorithmmachine-learningartificial-intelligence

13

我的日常工作是为一款在线浏览器游戏服务，这款游戏很小，职员数量也非常少。实际上，我们大部分的员工都是志愿者。

今天我专注于一个方面，我想创建一个人工智能系统，该系统将分析我们的用户数据库并报告可能由同一用户运行的帐户，这显然违反了我们的条款和条件。这种“欺骗”是我们员工的主要时间消耗，如果我可以通过给他们一个名字的简短列表来加速这个过程，那就好了。

问题是，我对人工智能并不熟悉。我只了解非常基础的知识，但目前还没有成功实施的解决方案。我一直在阅读关于启发式搜索的信息，特别是A *搜索，我“认为”它可能适合我所寻找的内容，但我不能确定。

因此，我的问题是：是否可以使用A*搜索准确地分析两个用户帐户数据，例如用户名、密码、电子邮件、帐户之间的交互、与其他人之间的交互、登录时间、活动时间等等。如果不行，您是否知道一种系统，可以分析这么多数据，并提供两个帐户可能由同一人运行的“概率”？

- Travis Weston

1

我认为你可能想采用基于统计的方法，而不是使用A*算法。如果你有一个数据库，可以查找从相同IP登录、在相似时间内进行某些相同活动的用户。但是，如果不了解你的具体情况，很难给出具体建议。 - Albert Perrien

7

说实话，A*算法与你试图解决的问题基本没有关系。 - Rob Neuhaus

2个回答

3

如果您可以访问用户的游戏动作日志，您可以使用聚类来将玩“相似”的用户分组。一旦您有了这些群集，您可以使用IP过滤每个群集中的用户。

另一种方法可能是使用监督学习算法，如决策树、IBK等。但是，为了使其起作用，您需要一个包含已知作弊用户样本的训练集。

你可以使用Weka数据挖掘软件来查找数据中的模式。它还有一个直接连接到数据库的选项。它包括聚类、决策树、ibk和许多算法可供尝试。但是，为了解释结果，您需要对每个算法有基本的理解。

- Enrique

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- doug · Accepted Answer

至少在很大程度上，这是我的日常工作。从您的问题中，似乎您考虑的是“机器学习”学科（而不是更广泛的“人工智能”范畴）。我认为您的直觉是正确的——机器学习算法非常适合欺诈预测/检测，因为它可以在高度非线性的领域中进行泛化，并且可以随着新数据的输入进行适应。因此，由于这两个主要特征，欺诈者很难辨别算法对预测的“规则”，因为这些规则实际上是一组复杂的软约束，并且随着算法根据新数据进行学习而随时间变化。（我建议除非您有特殊理由认为路径查找是解决问题的有用启发式方法，否则请将A*设置为一旁——我不愿说没有联系，但如果有联系，那肯定是一个不正统的联系——我从未见过路径查找应用于这种类型的问题）。

您提到的唯一关于您感兴趣的在线欺诈类型的事实是单个用户的多个帐户。毫无疑问，可以应用各种技术来解决此问题，但我会特别提到一种分析技术，因为：（i）我实际上在您提到的场景中使用过它；（ii）它超出了其他回答的范围，到目前为止。

该技术基于图论。前提是：由同一用户拥有的帐户通常最好不是通过其个体行为（点击流）而是通过它们之间的关系——换句话说，通过它们的网络行为来识别。

一个例子：在线扑克中的筹码转移。在这里，个人在扑克网站上开设多个新账户（使用虚假信息），然后为每个账户声称宣传奖金（例如，100美元的存款将获得100美元的奖金）。当然，奖金有高度限制的“取现规则”，通常需要玩一定数量的手牌，才能将奖金变成现金并从玩家账户中提取。

因此，筹码转移的目的是将这些奖金美元转化为真正的现金。一个人开了五个单独的账户（作为五个不同的人），然后再开一个“合法”的账户（使用他们的真实身份）。这六个玩家——实际上只是一个玩家——将在一个桌子上相互对抗，五个虚假账户会迅速输掉他们的筹码，输给合法账户，后者很快就会因为奖金的取现限制仅适用于最初赠送的账户，所以可以迅速取出他们的赢利；因此，取现限制被完全规避了。

这种方案的难点在于，几乎不可能在个人账户基础上检测到非法行为——*恶意勾结的不良行为源于一组共同拥有的账户之间的互动*——换句话说，需要在网络层面研究感兴趣的行为。

因此，图论是一种自然的分析框架。

我所应用的技术基于卡内基梅隆大学Chau等人的学术论文，题为“在在线拍卖者网络中检测欺诈性个性”（PDF）。

该论文所涉及的欺诈情景是：eBay上的卖家希望出售一件非常昂贵的物品（他们可能甚至没有拥有，但无论如何，都没有意图将其运送给买家），并且寻找愿意购买的买家。为了让无辜的买家愿意参与交易，欺诈卖家首先通过向一组买家销售商品来获取非常高（人为提高的）声誉；这些买家通常是由买家控制的虚假账户。

更具体地说，本文作者结合了两个级别（账户级别和网络级别）的数据，使用信念传播算法在一个马尔可夫随机场上进行计算。

顺便提一下，这种特征图结构被称为二分核心，它来自一组账户，在这个组的成员之间进行了大量的交易，但在eBay社区的其他人中很少有这样的交易。