看了今年ti的朋友们都知道Dendi在今年ti的舞台上和AI中路solo影魔中败北,比赛的结局可能在不少人的意料之中,毕竟这是一场敢于在全球直播中表演的中单对决,只有足以匹敌职业选手水平的AI,才能站在这个全球DOTA2玩家共同瞩目的舞台正中;但整个比赛过程,几乎出乎了所有玩家和职业选手的意料:由人工智能操控的SF并非完全依靠绝对精准的数值计算,而是有所取舍地掌握并运用了拉扯兵线、吸引/取消仇恨、越兵线压制、打断大药,甚至骗补刀消耗这些游戏中的技巧。

前段时间我们知道在机器人AlphaGo击败人类职业围棋选手、战胜围棋世界冠军,其实当时在ti的舞台上也曾想过这种可能,但毕竟dota需要计算的东西太多和围棋并不一样,当Dendi败下阵来时我其实是意外的,那么我们来看看AI是如何击败顶级职业选手Dendi的。

打开网易新闻 查看更多图片

中单第二局,上一把输掉的Dendi在出兵后选择故意放兵,用进塔策略快速消耗第一波小兵,从而把第二波兵控制在己方坡上的策略,同时也在试探这个人工智能会如何应对。而卡兵出门的人工智能在第一波地方小兵进入一塔视野范围之后,第一时间选择放兵阻止对方进塔。虽然这一举动没能成功阻止Dendi的妙招,但人工智能依然依靠操作和意识,将第二波小兵留在了优势地形,并一步步积累优势,赢得了这场人与人工智能比赛的胜利。这个名叫OPEN AI的超级人工智能的实际表现,征服了众多玩家和职业选手。

OPEN AI

 而在OPEN AI击败了Dendi之后,马斯克在推特上这样说道:“OpenAI第一次在电竞比赛上完胜世界顶级选手,这可比象棋围棋复杂多了”。OpenAI这家非盈利性质的人工智能研究公司成立于2015年,而埃隆马斯克是正是它的联席主席之一。

在2016年12月,OpenAI发布了一个名叫“Universe”的AGI测试训练平台,这个平台的最终目的,是让人工智能像人一样使用计算机。在类型众多、数量庞大的测试项目中,游戏占了相当一个比重,从ATARI2600到近年的网页游戏,甚至其中还包括我们人人都熟知的《GTA5》。

但回到Ti7上的中单SF对决,一些对这个AI的评价依然抱有争议:人工智能与职业选手获取信息的方式、量级是否相等?人工智能的反应速度、实际操作是否被限制在于人类相同的范围以内?

逐步走向成熟的DOTA2人工智能

虽然OpenAI训练《DOTA2》人工智能进行中单对抗只有两个星期,但并不意味着这样短的时间内人工智能就能读懂游戏。早在今年上半年,OpenAI项目组就开始让人工智能学习《DOTA2》,经过强化训练后,它在3月1日学会了用小黑放神牛的风筝,并在4月份开始对抗真人玩家。

《DOTA2》天梯玩家都有一个叫MMR的分数,这个分数一定程度上体现出玩家在团队PVP对战的实际水平,例如Arteezy是万分大神,Sumail8300分,dendi7300分。有数据显示,超过7500分的玩家数量仅占0.01%,有58%的玩家地狱3000分,15%的玩家低于1500分。进入5月份,人工智能已经能在真人对抗中迎战1500分的玩家了。

今年6月初,人工智能第一次击败了1500分玩家,并在月底把大部分3000分局的胜场掌握在自己手中。随着训练不断进行,人工智能终于在7月初勉强拿下了一场7500分局的胜利。7月底,才开始OpenAI口中的那“两个星期”的训练周期。

打开网易新闻 查看更多图片

8月7日,人工智能依次以3:0、2:1和3:0分别击败了6200分的Blitz、8500分级的Pajkatt和8900分的CC&C。两天后,人工智能又击败了万分大神Arteezy,当时这些选手一致认为,Sumail能够找出击败它的方法。

在这几天当中,人工智能扔在不断自我学习和进化。8月9日,Sumail以2:1的分数战胜了人工智能,但一天以后,就吃了个0:6的大鸭蛋。

在这一阶段,一些奇招是可以打败人工智能的。Pajkatt赢得那场,他通过快速合成魔棒,并适当配合仙灵之火的瞬间回复方式,击败了人工智能。而经过高达1000场线上测试后,OpenAI发现了几个人工智能的漏洞:把兵线反复后拉到塔与塔之间,小兵清干净后人工智能会被塔砸死;毒球+魂泪可以在开局制造非常大的移速优势,并可以快速拿到一血;出门学一级影压,一些6000-7000分的玩家可以通过短时间内的连续影压带走对方。

当然,OpenAI的训练绝非完全自主的,这些特殊战术在之后都被放入了人工智能的训练单当中。经过一定训练后,人工智能甚至在遇到信使勾引的情况下,合理判断是击杀还是放弃。在自我学习和人工补足的协同下,最终使我们在Ti现场亲眼目睹了那场比赛。

5V5还有多远?

在战胜Dendi后,OpenAI表达了希望能在明年表演一场职业队伍VS人工智能的5V5比赛。当然,这场比赛的根基,才刚刚开始搭建。《DOTA2》每天有100万场公开匹配局,每局的录像都会在Valve服务器储存两个星期,OpenAI团队如今收集了超过580万场超过45分钟的高端局录像,让人工智能不断模仿和学习。

来源:游民星空