TI7小组赛英雄数据报告

　　作为数据师何求知在微博以数据视角给大家揭开了小组赛期间的面纱，原文如下：

　　TI期间写一篇能给中国军团提供些许价值的数据分析报告，真的太难了。

　　去年有幸见过一次太后，太后问我：TI赛程紧凑，每一只队伍都在快速的变化，TI前练的英雄也不拿了，制定的战术也不用了，选手们凭借自己的游戏理解随机应变、快速调整，数据分析能提供什么帮助呢？——当时我还不是正经的数据分析师，无知者无畏。于是假装正经、侃侃而谈，从机器学习侃到深度神经网络，又从BP预测扯到选手的个人能力模型。最后我不知道是否说服了太后，但至少把自己给说服了...

　　这半年我作为一名商业数据分析师，托公司的福，参与了一些逼格很高的项目。掌握了几个行业巨头公司使用海量数据的姿势之后，再回头看DOTA2，反而变得更不自信了。To be honest，DOTA2这款游戏实在太复杂（数据分析的难度远超篮球、足球等传统体育和一般的商业数据分析），就我个人而言，“教”职业选手打TI7这件事我是做不到的，但“帮”职业选手打TI7本文愿意一试。

　　DOTA2复杂的原因之一，在于一名选手可以使用多名英雄。不同的英雄干的事情不一样，评价指标也会不一样。举例，B神能玩敌法也能玩VS（等数十名英雄），而梅西就不太可能担任守门员。DOTA2比赛的BP（英雄选择和禁用）有多复杂呢？——仅小组赛第一天，40场比赛就上场了93名英雄。上图展示了上场英雄的协作关系，复杂到根本没法看。

　　我们把图精简一下，只展示15名核心英雄（按加权度排序）：

　　无向图边的权重表示英雄的协作次数，比如第一天最热门的组合：女王+蝙蝠，一共出现了5次。

　　结点的大小表示英雄的出场次数，小组赛第一天出场最多的是：虚空假面、蝙蝠、小牛。

　　从图中还可以看出，当前版本BP阶段博弈的关键点在于三号位（三号位是整个BP网络的“纽带”英雄）。

　　为什么很多人玩了10年DOTA，可就是玩不腻？——两个字，变化！选手们酣战了一天之后，发现虚空假面不行！船长不行！暗影萨满也不行！于是在小组赛第二天的40场比赛中，掏出了（许多次）发条技师和军团指挥官。

　　小组赛第三天，唯一不变的是变化。看游戏录像总结了经验教训之后，选手们恍然大悟：原来铁男可以放，军团是坑货！帕克、沙王成为小组赛第三天的新宠。

　　DOTA2一共有113名英雄，要求选手们在高强度的比赛节奏中，抽出时间分析对手、分析自己，制定优秀的BP方案，确实太困难。所以我写了这篇文章，帮中国军团梳理一下小组赛144场比赛的英雄数据。（从现在开始，下文出现的每一张图，强烈建议选手们保存到手机中~）

　　先看下图“最惨英雄搭配”：

　　英雄的头越大，表示坑队友的次数越多（净胜场越小）。其中最坑的是铁男，出场31次，获胜7次，战败24次，净胜场为-17。

　　边的权重越大，表示两名英雄互坑的次数越多。其中帕克+沙王的组合，净胜场是-8，相爱相杀，坑的飞起。

　　图中只展示了净胜场<=-3的英雄组合，也就是说，除了偶然性，可能还有其他的原因造成了英雄之间的“不合适”。这个原因，相信职业选手们会有更准确的理解。（毕竟我看DOTA2比赛的时候是10000分，但亲自打DOTA2只有4000分，所以我给自己的定位是：仅展示图片，解释图片的工作留给选手和教练）

　　英雄之间有“最佳损友”，也有“模范夫妻”。下图展示了配合默契的英雄组合：

　　英雄的头越大，越厉害（净胜场越高）。其中小强和小牛最万金油。

　　边的权重越大，表示两位英雄合作越愉快。比如小组赛最佳搭配是小牛+狼人，净胜场为7场。（经常看比赛的同学，对右上方出现的毒狗+露娜组合也不会太陌生）

　　图中只展示了净胜场>=3的英雄组合。（注：图中的三角形也是很有用的。）

　　患有密集恐惧症的朋友，你们还挺得住吗？再来一张英雄克制关系图：

　　英雄的头越大，表示吃的人越多（净胜场越高）。 目前为止，小强是最大赢家。

　　箭头的指向表示吃人关系，权重表示净吃人次数。比如小强对面沙王的时候，净胜场为7。

　　图中只展示了吃人次数>=4的克制关系。（注：这张图我觉得很有意思，DOTA2玩家可以从每一条边中找到很多故事~）

　　我觉得这张图是最厉害的。

　　最后两张图分别展示了英雄场均总金钱与场均致命控制（时长）、场均致命伤害（量）的关系。说明几点：

　　致命控制（只计入full disabled类型的控制，如眩晕）、致命伤害都是我自己定义的指标，分别表示英雄在一局游戏的击杀和助攻活动中，贡献的控制和伤害总量。与官方提供的赛后统计相比，我认为它们是衡量英雄贡献更为准确的指标。以后有时间，会写文章详细说明。

　　知道“英雄拿多少钱才能在战斗中贡献多少控制”这个事情后，选手们就能选择更适合的英雄，制定更优的作战方案。举例，小强和小牛两名英雄能在占用资源不多的条件下，贡献充足的控制，很可能是他们制霸小组赛的原因之一。

　　图中只展示了出场次数>=5的英雄数据且场均控制时长大于5秒的英雄。

　　后续还需要优化不用类型的控制权重。比如小娜迦大招期间己方无法攻击、虚空假面大招期间队友无法攻击、潮汐大招期间己方可以攻击，三者控制效果不同，权重也应该不同。（目前没来得及做这个事情，请选手们自行把握）

　　图中只展示了出场次数>=5的英雄数据且场均致命伤害大于8000的英雄。（注：数据是静态的，但英雄每场比赛的队友、对手、局势都在变化。所以数据是框架是指引是假设，细节则需要职业选手对比赛录像进行深入、具体的分析。）

　　作为一名热爱DOTA2的初级数据分析师，能做的我都做了。接下来和大家一起数鸭子，中国军团加油！