这篇文章的数据是1930年世界杯开赛到2014年所有球队的进球数据,中间有好几届因为一战停赛,所以2014年正好有20届。
以下是本文的主要结论:
有几个问题需要说明:
1、由于历史悠久,很多国家都改过名字,比如苏联、西德。考虑到俄罗斯和苏联的国力不对等,我没有将它们合并为一个国家。让他过去。
2.世界杯决赛没有平局。我用点球大战的比分作为最终比分。毕竟点球也是实力。
3、1938年至1950年,世界杯因二战连续12年停办。愿世界不再有战争。
下面是正文
概念解释
目标:
球队在各局的最终比分,包括点球和加时赛。
失球数:
对手局的最终比分,包括点球和加时赛。
进攻能力:
进球越多,进攻能力越强。以所有球队在往届比赛中的平均每场进球数作为基准能力,某支球队的平均进球数与所有球队的平均进球数的比值越大,则意味着该队的平均进攻能力越强。
防御能力:
失球越多,防守能力越弱。以所有球队在往届比赛中的平均每场进球数作为基准能力,某支球队的平均失球数与所有球队平均失球数的比值越大,则说明该队平均得分高于所有球队。防御能力越弱。
20届2500球巴西占1/10
统计胜负双方总进球数。从1930年到2014年,共打进2500球(含点球大战),其中巴西打进232球,接近总数的1/10。排名前十的国家有1222粒进球,占总数的近一半。
巴西虽然进球最多,但失球也最多。毕竟,他几乎每一节都能打到最后。
与进球相反,球队对手的进球数就是球队失球数。如果算上失球数TOP 10的球队,巴西依然位列第一18年世界杯比赛结果比分表,但与其他球队相比,失球数却相差甚远。不像进球数那么多。总体来说,巴西队的防守还是强了一些。
32强攻防能力
既然有了之前的得分数据,不管国家主权变化、球员体能等因素如何,我们都可以通过数据计算来推算出每支球队的攻防能力。
第20届世界杯共86支球队进行了836场比赛,共打进2500球,平均每队每场打进1.5球(2500/836/2=1.495)。
根据86支球队每场比赛的表现,可以计算出每支球队的平均进球数。根据前面进攻/防守能力的概念,我们可以得到每支球队的进攻/防守能力。
经过这么多年的世界杯,一共有86支球队。全部分析起来太麻烦了。我们只分析进入2018年世界杯小组赛阶段的32支球队。冰岛和巴拿马今年首次进入世界杯。没有以前比赛的数据。我给了他们平均值(1.5)。
进攻能力前五基本无可争议,不看球都知道。但是排名第六的丹麦为什么这么强?
翻看源数据,发现1986年丹麦6-1小组赛战胜乌拉圭,2002年2-0战胜法国,这两个国家实力都挺强的,因为乌拉圭进入小组赛的次数更多杯子。第一届世界杯4-2击败阿根廷,1950年2-2西班牙,1954年2-1巴西,4-2英格兰,直到2014年英格兰和意大利2-1和1-0。
毕竟只是统计而已,一战成名这种东西太容易影响排名了。
防御能力的列表似乎有点可笑。不懂球,所以不知道对不对。可以找到回溯源数据。塞尔维亚2010年进过一次世界杯,打了三场,输了两场(澳大利亚2-1,加纳1-0),然后赢了德国(1-0)。平均失球数很低。保卫德国后,实力立马大增。不知道克罗地亚,不过之前的比分还是很硬的。他们赢了8场比赛打进18球,而对手只进了5球;在输掉的8场比赛中,他们的对手总共进了12球。他们防守巴西、阿根廷、法国!
本次小组赛各队胜率及比分预测
数学中存在泊松分布。该模型可以根据两队的平均能力计算出两队比赛结果的概率。
我们先来看看这个泊松分布的概念。
> 泊松分布
让我给你举个例子:
假设您正在公共汽车站等公共汽车。虽然公交车站牌上写着公交车平均每5分钟一班,但如果你在公交车站等5分钟,你可能会等1辆或3辆公交车。当然,如果运气不好,公交车不来也不少见。
这里,1辆、3辆或0辆的概率符合一定的分布规律,即泊松分布。根据这个分布,一旦我们知道一辆车平均多久到达一次,我们就可以计算出 1、3 和 0 的概率。
它有一个计算公式,你可以百度一下,但我就不展示了,免得你看了头疼。
要使用泊松分布,我们需要知道均值。对于比赛来说,如果我们要计算A队和B队得分的概率分布,我们需要知道两队在本场比赛中平均能进多少球,从而计算出他们得分的概率。
前面我们计算了球队的进攻能力和防守能力。我们用A队的进攻能力×B队的防守能力×平均进球数得到A队本场比赛的平均进球数。同样,B的进攻能力×A的防守能力×平均进球数就是B的进球数。
有了这两个平均值,我们就可以得到32强的49场比赛中各种比分出现的概率。
此外18年世界杯比赛结果比分表,这场世界级比赛的进球数在0到4之间,很少有进球超过4球。
我只列出了小组赛进0-4球的概率,计算结果如下:
我在表格中标出了每支球队得分概率最高的颜色,从而预测了每场比赛的最终结果。
由于本文的分析对象是历届世界杯的比分数据,时间跨度超过80年,必然存在诸多不准确之处。