历史体育比赛数据中检测趋势的编程技术

3

摘要

我一直在使用研究历史澳式足球比赛结果,并关注贝塔菲尔(Betfair)的赔率,以查看是否有机会更好地预测未来的比赛结果。 我迄今为止的进展在下面的背景中有更详细的介绍。

现在,我想进一步研究数据挖掘/模式匹配/算法技术,可能可以实现。 我有一些使用动态模型(Extend)和在Excel中使用Solver进行优化的经验,但除了术语本身之外,我对数据挖掘并不熟悉。

是否有可行的数据挖掘编程技术可供我在VBA中部署进行分析?

(我意识到这个问题可能被某些人视为边缘问题,但我认为Stack Overflow比如Math更适合此问题 - 我渴望了解我可以在VBA中应用的潜在编程选项/算法)

我强烈倾向于使用VBA \ VBscript来处理此问题,因为这是我的编程背景,但如果其他选项显着更好,我也可以考虑。
背景
我已经将过去几年的澳式足球数据提取到Excel中。这些数据给我:
1.每个季度的结果 (例如WWWL表示第一三个季度领先的1号队在输掉比赛前,DLLL表示第一季度末两支队伍并列,然后第二支队伍领先比赛的其余时间)。 2.相同的信息被重新分组成半场结果 3.主场和客场队伍(队伍1是主场,队伍2是客场) 4.比赛日体育场 5.年月
然后,我将其与其他数据集匹配,例如
1.按周的联赛排名(完成) 2.体育场是否为露天或封闭式(完成) 3.比赛前的博彩赔率(待办) 4.露天体育场的天气情况(待办)
然后使用PivotTables(也许是PowerPivot)进行切片和骰子操作,以查询这些数据,寻找游戏机会,例如:
  • 是否有某些团队更经常从一开始就领先(WWWW),并且“四分之一”胜利的赔率(WWWW)与普通胜利相比不成比例,因此应该普通胜利,支持 WWWW)
  • 寻找主场和客场表现的显著差异(即主场优势或主场支持是否导致3/4时间比分的逆转)
  • 比较室内和室外体育场的结果(消除天气影响)
  • 长距离旅行一周是否会影响下一周的结果
  • 是否有某些团队更经常产生某些得分模式,而不是标准联赛结果
  • 排名较低的团队是否更有可能在整个比赛中领先于反败为胜击败排名较高的团队

我知道这并没有解决你的问题,但我相信它可能会有所帮助。当我学习数据挖掘课程时,我们使用了Weka(http://www.cs.waikato.ac.nz/ml/weka/)-- 它拥有许多用于数据分析的算法,你可以直接从中使用它们,或者将它们适应到你的Java代码中(如果你恰好知道如何编写Java..) :) - Nobita
1
当然,您可以在VBA中完成这些操作。但是,由于科学界没有人使用Excel,因此您需要自己完成这些操作。流行的工具包括R、Matlab和Weka(它是一个Java应用程序)。 - Has QUIT--Anony-Mousse
@Anony-Mousse 根据我的帖子,我会考虑除了Excel之外的其他工具,但我的主要兴趣是如何分析我的数据集中的趋势、异常等方面的建议。 - brettdj
仍在 tinkering bonCodigo,更多是为了乐趣而不是金钱。但很开心 :) - brettdj
@brettdj能否和我分享一下您的电子邮件以进行商务联系呢?:) 谢谢。我的邮箱是bonCodigo@gmail.com - bonCodigo
显示剩余2条评论
2个回答

2
请查看 RapidMiner,它有许多内置工具可以探索您的数据。假设您对计算机工具有一定的能力,请同时查看机器学习工具 Weka。如果您注释了数据,则可以在数据上训练算法并查看哪个算法最准确地预测了获胜者。
例如,A 队与 B 队比赛,您基本上必须在 csv 文件中表示比赛的流程,并在同一行上添加任何其他统计信息,然后在最后一个标签中说明哪个团队获胜。说明哪个团队获胜是用于训练的部分。

谢谢Steve - 我会研究一下(+1你的回复)。我会再等一段时间,看看是否有更多的回复。 - brettdj

1

这篇文章有点晚了,但我想在过程中加入我的两分钱。

从我(相当广泛的)在像Betfair这样的市场上运行预测算法的工作中,我的结论是预测事件发生的概率(回购)或不发生的概率(放弃)没有用。问题在于,即使您可以清楚地确定具有高准确性概率的趋势,由于市场赔率,您仍然无法从预测中获利。实际上,市场赔率本身将告诉您事件发生的隐含概率。

隐含概率%=(1/(赔率-1))

例如:如果Back-Draw为4.1,则有效意味着32.25%的平局机会。

要有效地从Betfair获利,需要查看市场赔率的差异,而不是查看事件发生的概率。例如:由于赔率的快速市场变动,可能存在(短暂的)情况,其中跨市场赔率被倾斜以提供> 100%的回报。这不会发生在主要比赛中,而是在低交易量的比赛中。


如果您正在为此目的训练神经网络(人工智能),请确保将该交易的赔率和盈亏作为因素考虑在内;否则,您可能会遇到这样的情况:您可能能够准确预测结果,但仍然会亏钱。祝好运! - jlee88my

网页内容由stack overflow 提供, 点击上面的
可以查看英文原文,
原文链接