如何对这种人工智能进行建模？

Question

7

当我玩this游戏时，我想知道控制侦探或罪犯的人工智能是如何工作的。

对于懒人来说，这个游戏的目标很简单：

我可以思考一个针对罪犯的人工智能，它只是一棵极小化极大树，试图选择最大化侦探寻找他所需步数的动作（这似乎是一个很好的指标），但我无法想出任何足够聪明的东西来帮助合作并尝试通过观察罪犯使用的车票猜测罪犯可能在哪里。

这只是为了好玩，但你有什么酷炫的想法可以设计出相当聪明的东西吗？

- Jack

http://sourceforge.net/projects/scotland-yard/ - Carl Norum

谢谢您提供的链接，我已经看了那个实现：正如评论所述，逃亡AI的问题在于它选择的是“最佳”移动方式，而不是更聪明的移动方式。这只是根据距离度量得出的最佳移动方式，它并没有考虑像回溯移动一样的技巧（也许是为了在侦探之间潜行而不仅仅是远离他们）。 - Jack

4个回答

1

你询问的是如何建模，而不是如何高效地解决问题：

这可以很容易地建模为部分可观察马尔可夫决策过程（维基链接）。这适用于侦探和罪犯。POMDP是一个非常通用的模型。

- ziggystar

0

我想象一种蒙特卡罗实现可能是一个很好的选择，即模拟成千上万个组合，并选择大多数情况下以最佳结果结束的那个。由于罪犯必须在5回合内可见，分支因子应该保持在良好的控制范围内，尽管MC也被证明是高分支因子游戏中非常好的技术，例如围棋。

- tsiki

0

为了让侦探之间形成团队合作，您需要将他们建模为一个团队而不是个体。Minimax仍然是一种好方法，但（遗憾的是）您的分支因子将会飙升。

与其逐个检查所有侦探并为每个侦探选择最佳方案，不如计算出他们可能做出的每种移动排列。如果团队合作有助于这个游戏，那么Minimax将倾向于侦探们共同工作的排列。

我不确定是否实际可行，24步骤中5名侦探可能需要太多的工作量，但尝试一下也是很有趣的，这不就是重点吗？

- Daniel

网页内容由stack overflow 提供, 点击上面的

可以查看英文原文，
原文链接

- Chris Pitman · Accepted Answer

我喜欢这个游戏，我认为对于侦探，您需要建模罪犯在每个位置的概率。偶尔您会知道罪犯的确切位置，然后可以考虑他所采取的移动来确定他可能在哪些地方。

一旦您得到了这个结果，我不太确定如何优化侦探的移动。您可以将侦探移动以减少可能性的集合，有效地圈住罪犯。但我确定还需要一些更高层次的策略，涉及门票和避免用完门票。