模拟新闻
纯干货:如何简单、正确地理解RRI 2.0系统
peter930302 发表于 2018.08.25 21:58:30 | 阅读: 3440 | 评论: 0
本帖最后由 peter930302 于 2018-8-27 00:43 编辑
RRi是SRFC车手中心的一个主要功能。有些同学可能看到RRI的变动情况表,会对其内容和“稳定系数”有一些疑问。本文将会带你正确地了解RRI 2.0版。首先请记住:RRI的能力值是一个范围值。
理解RRI的计算原理:
初始化:将初始能力值定义为1500±350。
下面我们以GTR1994同学为主例讲解。
!?
GTR1994的初始能力值为1500±350。在大约1年半没有比赛的情况下,稳定系数也会升到350(约300个计算周期,10次计算为一个周期,一场30人比赛为3个周期)。
Step1. 计算新的标准差RD。随着时间的流逝,玩家的水平会发生变化,因此上一轮周期得出的分数的不确定性会增加,因此这一周期的第一步计算就是略微增大标准差RD,但最大不超过350。
进行了N场比赛之后,他的能力值变为2000±100。他后面的数十场比赛都没跑,因此他能力值中的稳定系数会更高,变为2000±150。
Step2. 更新评分中的均值r,这里的计算很复杂,大致精神就是根据一场比赛内所有比赛车手的比赛结果,以及其它车手的(r, RD)进行计算,得出新的分数。同样其它车手的分数越高,自己名次更好也会加得越多,其它车手的评分不确定性(RD)越高,那么自己分数的调整幅度就越低。
长期没跑的GTR1994很幸运,他和能力值为1700±60~120左右的9名车手比赛并获得了第一。他的RRI进行了9次计算,能力值有小幅增加。如果比赛有20个人比赛则会最终计算19次。
相比而言,某潘妮同学就没那么幸运了,他的能力值是1900±120,他获得了第五,赢了5名1700的车手,输给了GTR1994和三名1700的车手,他的能力值要降到1800~1850左右。
如果某潘妮同学的稳定系数很高,如1900±160,那他的RRI可能掉的更多。如果有更多人比赛(每10人算作一组),那么某潘妮同学的稳定系数会更低。
Step3. 根据一场比赛内所有对战的结果再次调整你的RD值,比赛的场次越多,RD会变得相对越小。另外这个数值的变动和对手的r值以及RD值也都有关系。
GTR1994在这场比赛中因为和另外9个稳定系数在60~120的车手对战,在一系列计算后,他的稳定系数缩小到90~120左右。
退赛情况:
很遗憾,GTR1994在这场比赛中退赛了。退赛的话是分情况的:
1. 当在前3圈内退赛时视为该场比赛无效,RRI不进行计算,稳定系数RD继续随时间略微升高。
GTR1994在第二圈退赛,他的RRI能力值部分不变。
2. 当从第四圈起,总赛程未过75%时退赛,RRI的能力值和稳定系数均进行计算,但能力值变化的最终结果减半。
GTR1994在第四圈退赛,他的RRI能力值部分按照赛后名次计算,但是变化减半。他的最大扣分可能会是300分(150x2),根据比赛情况,他在最后一位可能要扣200分,但是他没跑完75%,最终只扣100分。
3. 当在75%赛程之后退赛,按照实际完赛情况计算能力值和稳定系数。
GTR1994在倒数第二圈退赛,他的RRI能力值部分按照赛后名次计算,计算出来扣200分即扣200分。
想要详细理解Elo和Glicko的计算过程可以查看下面的两个链接:
Elo评分系统(RRI 1.0)
Glicko评分系统(RRI 2.0)
对RRI进行分析前一些需要了解的概念
注:从本节开始内容都为《高中数学选修2-3》第二章的内容,如果已经学习则可以略过。
频率分布直方图
频率分布直方图是统计学中表示频率分布的图形,能清楚显示各组频数分布情况又易于显示各组之间频数的差别。它主要是为了将我们获取的数据直观、形象地表示出来,让我们能够更好了解数据的分布情况。
横轴:表示样本数据的连续可取数值,按数据的最小值和最大值把样本数据分为m组
纵轴:表示频率除以组距(落在各组样本数据的个数称为频数,频数除以样本总个数为频率)的值
以频率和组距的商为高、组距为底的矩形在直角坐标系上来表示,由此画成的统计图叫做频率分布直方图。
这是一张RRI 2.0测试时期得出的SRFC车手RRI频率分布直方图。频率分布直方图能清楚显示各组频数分布情况又易于显示各组之间频数的差别。
要了解更多内容,请点击此处
总体密度曲线
这是一张细化过的SRFC车手RRI频率分布直方图。如果样本容量无限增大,分组的组距无限减小,曲线中所表示的频率分布就越接近于总体在各个小组内所取值的个数与总数比值(频率)的大小。
这条光滑的曲线就叫做总体密度曲线。
利用正态分布来分析RRI
在总体密度曲线中,若随机变量 X 服从一个位置参数为 μ 、尺度参数为 σ 的概率分布,且其概率密度函数为
则这个随机变量就称为正态随机变量,正态随机变量服从的分布就称为正态分布,记作 ,读作 X 服从 ,或 X 服从正态分布。
图形特征
集中性:正态曲线的高峰位于正中央,即均数所在的位置。
对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。
均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。
曲线与横轴间的面积总等于1,相当于概率密度函数的函数从正无穷到负无穷积分的概率为1,即频率的总和为100%。
注:从此处开始,《高中数学选修2-3》第二章的内容已经结束,请继续观看。
正态分布与RRI的关系
上文所述,也是多次提到的,RRI是一个描述范围的值,不管是Elo系统还是Glicko系统,我们都能看到“正态分布”模型贯穿于其中,同时我们可以发现“正态分布”与另外两者的描述有相似之处:
正态分布:N(μ,σ2)
Glicko:(r, RD)
Elo: r,(即(r,K))
我们可以近似地认为,Glicko与 Elo 的评分描述方式与正态分布类似,可以用下面的形式来表述(该图选自Elo系统介绍):
简单解读SRFC的RRI系统
应用于个人分析
RRI 2.0系统下,一位车手的RRI应表达为(r,RD)或 r±RD。而应用在画图中能够描述为下面的形式:
我们可以看到上下约2倍稳定系数的情况能够涵盖95.6%的参赛表现情况,所以RRI 2.0系统将RRI波动限制在了最大为上下2倍稳定系数值。
应用于整体分析
这是一张RRI 2.0目前情况(8月25日)的数据图。
为什么这张图的顶峰严重向左偏移呢?
部分玩家通常在前几场表现不是很好,造成低RRI的情况,此后发生放弃在SRFC进行比赛,或放弃这款平台等情况。
这是在去掉了参加比赛次数少于12的车手的情况,由于样本大幅减少,所以各个数据差距可能较大,不过可以看到依然基本符合正态分布。
为什么是12次呢?因为此数值以下发生大量参赛次数累积的情况。
分析信息
我们知道,RRI是一个范围值,现在我们向RRI 2.0测试期间的数据添加一项某人同期的RRI数据。
已知该同学的RRI为1839±92.24,其99%可能的参赛表现情况都在约1550-2150的区间中。
如果该同学下一场比赛发挥失常,他可能会被平均水平在1700左右的车手追击并超越。
如果该同学下一场比赛发挥超常,他可能能够和平均水平在2000左右的少数车手进行对抗。
在RRI 2.0系统中,以下情况将会升高稳定系数(越小越好):
1.长期未参赛
2.参加人数较少的比赛
3.参加车手整体稳定系数较高的比赛
4.前三圈退赛(视为未参赛)
延伸内容
这张图描述的是自注册起在2018年还在参赛的车手(包括2018年注册的车手),能够看出:
1.有更多的在下部集中的车手,这部分车手因为频繁参赛,其RRI值能够更加准确地描述。
2.通常分数较高的车手比赛更少,这可能是因为隐退或全胜导致系统认为其稳定系数需要升高。
3.在低于1500的区间有更多车手的稳定系数变高,这可能是因为不愿意参赛或放弃参赛所导致的。
注意事项
RRI一般用来衡量短期的参赛表现,比较适合用来计算车手的水平区间,但不代表车手长期范围的水平。
希望各位同学能够举一反三。