返回列表 回复 发帖 免费斗地主赢30元充值卡

ISML2010常规赛 分析+数据 (08.25 更新了各种比分纪录)

本帖最后由 bfraider 于 2010-8-25 22:52 编辑

各赛期分析贴链接
海蓝宝石(秋山澪) http://www.chisml.org.cn/thread-3038-1-1.html
黄宝石(逢坂大河) http://www.chisml.org.cn/thread-3039-1-1.html
紫水晶(长门有希) http://www.chisml.org.cn/thread-3047-1-1.html
蓝宝石(夏娜)      http://www.chisml.org.cn/thread-3055-1-1.html
绿宝石(夏娜)      http://www.chisml.org.cn/thread-3059-1-1.html
红宝石(御坂美琴) http://www.chisml.org.cn/thread-3065-1-1.html
钻石(夏娜)        http://www.chisml.org.cn/thread-3071-1-1.html

补充:赛季里的各种比分纪录
最大票差TOP3
1.海蓝宝石3 秋山澪 3991:949 平泽忧,票差3042
2.海蓝宝石3 夏娜 4186:1160 原村和,票差3026
3.黄宝石3 长门有希 3967:996 福路美穗子,票差2971

最大倍杀TOP3
1.红宝石5 中野梓 3418:745 原村和,4.59倍
2.海蓝宝石3 秋山澪 3991:949 平泽忧,4.21倍
3.红宝石3 秋山澪 3390:807 原村和,4.20倍

最小票差
1.钻石5 金色之暗 2098:2096 高町奈叶,票差2
2.蓝宝石5 古河渚 2069:2065 C.C.,票差4
3.钻石1 古河渚 2182:2172 泉此方,票差10

最大票和
1.钻石7 桂雏菊 3482:3400 秋山澪,票和6882
2.钻石7 中野梓 3729:3027 凉宫春日,票和6756
3.海蓝宝石7 夏娜 3883:2842 Saber,票和6725

最大得票
1.海蓝宝石7 露易丝 4285:1729 福路美穗子
2.海蓝宝石3 夏娜 4186:1160 原村和
3.海蓝宝石7 佐天泪子 4110:1708 原村和

最小得票
1.红宝石5 中野梓 3418:745 原村和
2.绿宝石3 长门有希 3151:766 原村和
3.绿宝石6 三千院凪 3221:774 原村和


部分角色的战力走势图
第一集团(1-10):有潜在能力争冠的群体,真正意义上的lv1

第二集团(11-20):最终战力排名第11-20位的角色

第三集团(21-30):曾经有能力对第二集团造成威胁的10位选手


不知道该写啥,先空着,以后慢慢补

补个从紫水晶期开始所有我预测错误的所谓冷门汇总.
附件: 你需要登录才可以下载或查看附件。   免费斗地主赢30元充值卡
1

评分次数

  • Lovecc

本帖最后由 bfraider 于 2010-8-25 18:29 编辑

我的绝大多数分析都是基于模型,所以胡扯些有关模型的,欢迎高人讨论与指正.
世萌之所以可以”被预测”,是因为满足以下几条特性:
1.散票样本足够大
2.循环轮数足够多,使得模型有足够的机会来对误差进行修正
3.角色的被喜欢度与被投率近似于正比.

为什么说满足以上三条之后萌战可以被统计了呢,原因在我看来如下:
1.从萌的角度来说,特定时间点上,不同参赛角色在投票者中的受欢迎程度是存在一个确定值的,但这个值我们无法量化
2.因此,如果参赛选手的受欢迎程度与被投率成正比,并且参与投票的人足够多,那么我们就可以用被投率将受欢迎程度体现出来
3.一场比赛只能体现出对阵双方的受欢迎程度比例,因此我们需要足够多的轮次来将所有这些参赛选手的被投率统一化.此外,单轮比赛的被投率也不一定能客观反映受欢迎程度,但多轮比赛可以.

很显然,并不是所有萌战都能预测,即使可以预测,预测结果也总会有或大或小的偏差,原因有以下几点:
1.散票基数不够大.导致这种现象的原因,有可能是总投票人数过少,也可能是伪票或者厨的票力过大.譬如日萌,基本属于无法预测的类型,所以大家来一起口胡看热闹也不错.模型从某种程度上确实降低了娱乐性.
2.投票者的喜好本身在随着时间的变化而变化.这种喜好的变化如果趋势比较缓慢,对于预测的影响可以忽略,但如果趋势过于凶猛,会使得模型无法在一轮或两轮时间内跟上变化,导致预测偏差
3.所谓的内战发生时,被投率会过多偏向于主角或者戏份更重的角色,简单来说,就是优势方过多吸收了同时喜欢双方的投票者的票,破坏了被投率与被喜欢率成正比的前提.btw,从数据上来看,钉宫四萌之间的确算是内战--
4.被投者实力悬殊过大时,被投率会偏向弱势方.对此我没有确定的解释,随便猜一下的话,就当是同情票吧.
5.散票本身也可能形成某种有趋向性的行为,比如说对竞争对手的anti.这种anti的产生可能是逐步地,也会被模型所统计进来,但却可能是随着竞争对手的出局而突然消失.模型此时无法跟上节奏,于是导致对该目标的预测误差.

当一场比赛的结果与预期出现偏差时,模型必须对此作出相应的调整.
不同模型之间的差异就在于调整的力度与算法.有的模型更看重当前场次比赛的结果,有的模型更看重过去一段时间内的趋势.
看重当场结果的,会更加快速地适应剧烈的变化,譬如开赛前几轮从0开始时的混沌阶段,以及发生在今年绿宝石期和红宝石期部分角色的剧烈波动.Zorya和遨游星际的模型属于此类,每场的积分变化完全由这场比赛的结果来决定.
但这种模型在走势平稳的时期精确度不如看重趋势的模型,譬如钻石期.我的模型属于后者,所以在钻石期的预测结果差强人意.但是,由于在计算战力的算法上的确与ELO模型有差距,所以总体上精度还是低一些.

于是尝试了在ELO的算法基础上加入对过去7场偏差趋势的推算,发现确实可以让后期结果更趋近于真实值.当然,代价是在前14轮精度有所降低.
明年我或许会用这个算法来算吧,不过今年就暂且还是用现在的--
板凳也拿走了......
依利雅最后时刻果断逆了凛= =
某只说我应该有个签名...
膜拜楼主计算帝建模帝……期待能有更精准的模型诞生啊
5# Vv4474


这是我拿Zorya的模型和我的模型融合了一下,整了个新算法后得到的结果--
格子里的值是各个赛期的平均偏差,第一行数据是Zorya模型(帮他去掉了内战偏差后的)数据,第二行是我现在的,第三行是这个新的,暂时没使用.
附件: 你需要登录才可以下载或查看附件。   免费斗地主赢30元充值卡
模型上看后期准确度上升还是能够看出来的啊~
就是样本不够大,明年可以在试试……黑叔加油
膜拜各位数据帝分析帝,顶个。。。
9楼……吗!
数据什么的,最无聊了!
黑叔真勤奋啊……精华了啊……
轻音黑什么的最喜欢了
--------------------------------------------------
返回列表