• 主页 > 知识问答
  • 2018世界杯冠军预测:机器学习看好巴西,统计方法支持德国

    2018年世界杯即将拉开帷幕,谁将夺得最终冠军?机器学习预测巴西会获胜,而统计方法则预测德国会获胜。

    三天后,2018年俄罗斯世界杯开幕。第一场比赛是东道主俄罗斯对阵沙特阿拉伯,将于6月14日开赛。

    每届世界杯最受关注的赛事无疑是决赛。 2014年上届巴西世界杯,东道主巴西队意外爆冷,仅获得第四名,无缘决赛。今年的世界杯,不少机构/研究人员都给出了预测:德国将与巴西争夺冠军,巴西队获胜的机会更大。

    根据各种预测和民意调查,冠军几乎肯定会在巴西、德国和阿根廷之间争夺。虽然看到激烈的竞争很有趣,但似乎没有什么惊喜。

    机器学习和大数据方法越来越多地被用来预测比赛结果。不仅是世界杯,不仅是比赛成绩,球队组成、战术选择和球员训练都开始看到机器学习的运用。对于球迷和观众来说,人工智能也将推出参与/观看体育赛事的新体验。

    机器学习预测结果:巴西夺冠

    肯尼亚投资银行成吉思资本投资银行的投资银行分析师杰拉尔德·穆里基(Gerald Muriuki)近日在Medium上宣布,他利用机器学习预测了2018年国际足联的结果——巴西将夺冠。

    这一结果与微软人工智能和数据科学专家 Sorin Peste 的预测一致。

    冠军足球建模_足球建模_建模足球冠军名单

    事实上,预测世界杯冠军是一个典型的机器学习问题。你首先预测每场比赛的获胜者,然后预测小组赛、半决赛和决赛的获胜者。在此过程中,您需要执行数据集成、特征建模和结果预测。因此,很多机器学习或者数据科学家都做了类似的项目。

    Muriuki 和 Peste 都根据足球比赛的历史数据构建了机器学习模型,模拟了比赛,并预测了这些比赛的结果。我们分别来看一下。

    使用逻辑回归进行预测

    Muriuki 使用了来自 Kaggle 的两个数据集,其中包含 1872 年至 2017 年国际足球比赛的结果。他首先分析了两个数据集,做了一些特征工程,选择了与 2018 年世界杯最相关的特征进行预测,然后进行了一些数据增强。

    对于模型选择,Muriuki 使用逻辑回归(一种分类器算法)。逻辑回归通过使用逻辑函数估计概率来衡量分类因变量与一个或多个自变量之间的关系。简而言之,给定一组相关数据,逻辑回归可以预测结果(在世界杯的情况下,是胜利还是失败)。

    以下是他的模型对前几场比赛的预测:俄罗斯对阵沙特阿拉伯,俄罗斯获胜;乌拉圭对阵埃及,乌拉圭获胜;伊朗对阵摩洛哥,平局。 4天后,您可以验证结果是否正确。

    16强赛结果如下:

    640?wx_fmt=jpeg

    冠军足球建模_建模足球冠军名单_足球建模

    四分之一决赛将在葡萄牙对阵巴西、德国对阵阿根廷之间进行。

    640?wx_fmt=jpeg

    最终,巴西对阵德国,巴西获胜。

    640?wx_fmt=jpeg

    使用随机森林进行预测

    另一方面,微软人工智能和数据科学专家Sorin Peste的预测过程则更加完整。在数据选取上,除了历年世界杯成绩外,佩斯特还使用了欧洲杯、奥运会等大型赛事的数据,以及这些赛事的胜率分布。

    此外,佩斯特还考虑了比赛的地点,即是主场、客场还是与双方无关的中立场地,以及比赛是否“友好”。打友谊赛的目的不是为了取胜,而是为了观察对手。玩家和策略。

    对于模型选择,Peste 使用随机森林(深度 500),该算法根据提供给它的特征生成多个决策树,并且每棵树对每个新输入向量的结果进行“投票”。随机森林速度快、相当准确,并且提供泛化误差的无偏估计,因此不需要交叉验证。

    下图显示了迭代1000次后的结果,巴西获胜,阿根廷第二。

    统计方式:德国坦克险胜巴西

    当然,除了机器学习之外,还有很多利用大数据方法的预测。 KDnuggets上的一位热心球迷用统计方法预测德国队将夺冠。他的步骤如下:

    收集信息:

    FIFA世界排名:这是所有211支国家足球队的排名系统。使用积分系统,积分基于所有国际足联认可的国际比赛的结果。然而,这不是最好的系统并且有很多缺点。

    Elo 评级:该系统最初是为国际象棋联合会 FIDE 开发的,用于对国际象棋棋手进行评级。其复杂矩阵根据比赛类型分配分数,并考虑双方之间的净胜球差异。它与FIFA的主要区别在于它还统计友谊赛的场次。

    TransferMarkt 球队价值:这家位于德国的网站提供足球各个方面的信息,包括每位知名球员的估计市场价值。他们列出了参赛国家及其团队价值观。

    冠军足球建模_足球建模_建模足球冠军名单

    投注赔率:使用投注比较网站 OddsChecker 获取每个国家/地区最丰厚的赔率。

    TransferMarkt 的数据以欧元为单位,而 FIFA 和 Elo 有自己的评级系统,投注赔率以点数为单位。作者对每个系统进行了标准化,以使它们具有可比性。在统计学中,标准分数(也称为 z 分数/值、正常分数或标准化值)是值与平均值不同的标准差数。

    640?wx_fmt=jpeg

    2018年世界杯,四大热门预测来源

    640?wx_fmt=jpeg

    KDnuggets 预测 z 分数

    如果KDnuggets的预测正确,世界杯小组赛的结果将如下:

    640?wx_fmt=jpeg

    结果得出一些有趣的结论:

    民意调查:德国、巴西、阿根廷最受欢迎

    除了KDnuggets的预测之外,世界杯之前还有很多其他的预测:

    《每日电讯报》对每支球队进行了广泛的分析,最后进行了一项民意调查,要求读者预测获胜者,结果如下:

    640?wx_fmt=jpeg

    此外,据中新社报道,俄罗斯彼尔姆国立研究大学学生维克托·扎科帕洛建立了一个神经网络,可以预测2018年世界杯冠军得主。神经网络分析计算各种参数并得出结论。世界杯前三名的球队将是德国队、巴西队和阿根廷队。

    四年前,巴西主场1:7不敌德国队,创下自1920年0:6输给乌拉圭以来的世界杯最大失利纪录,震惊全国。最终,德国队夺得了当年的世界杯冠军。

    今年的俄罗斯世界杯,不少机构预测巴西和德国将上演冠军争夺战。巴西能否雪耻,德国能否成功卫冕?我们拭目以待。

    版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请联系本站,一经查实,本站将立刻删除。如若转载,请注明出处:http://www.szcyfjx.com/html/tiyuwenda/9425.html

    加载中~

    相关推荐

    加载中~