20+顶尖高校同时开打王者荣耀!实际上是一场科研battle,你能信?
金磊 假装发自 王者峡谷
量子位 报道 | 公众号 QbitAI不是吧,不是吧
一群学霸聚集在一起,竟然是为了打王者荣耀?!
但毕竟是一帮学霸们的聚会,果然连打游戏的姿势都那么与众不同:
他们竟然要用王者荣耀搞科研!
(妥妥的是有种诸葛亮黄金分割率的味道了)
这到底是怎么一回事?
在王者荣耀里搞科研
要想搞清楚这件事,就需要先来颠覆一下你对王者荣耀的认知友友们,其实它不单单是一款游戏那么简单:
更准确来说,王者荣耀背后是一个AI 开放研究平台,它背靠腾讯各方面资源优势,为学术研究和算法开发开放的研究与应用探索平台还是一个极具科研价值的游戏环境
开悟但搞科研嘛,算法算力数据场景,可以说是缺一不可
于是开悟就放话了:
比如王者荣耀提供了游戏测试环境脱敏游戏数据集,还有游戏核心集群等资源各路英雄豪杰,我这儿啥都有!
腾讯AI Lab则把搭建好的算法计算平台评估工具亮了出来;算力的支持则是由腾讯云计算提供
于是乎,来自各大顶尖高校的学霸们,就华山论剑般地汇聚于此至于各家高手们的论剑之道,就是在限定时间和资源内,训练出最优模型,并把它部署到AI服务器当中
在提交系统之后,学霸们就相当于炼出了他们各自的王者荣耀英雄
这不,同样是貂蝉,在修炼完不同功法后,便展开了一场激烈的博弈
在1级狭路相逢之际,便来了个同归于尽注:动图来自2021高校联赛AI表演赛
虽说都只是智能体,但在这波battle中,她们很好地发挥了自身的基本功:
每个基本功背后,都是智能体在审时度势后的最佳决策作战中
预测敌方走位
已击杀,阵亡
而在双方复活之后,策略之间的博弈就变得更加紧凑和激烈
毕竟常言道:一招棋错,满盘皆输
蓝方貂蝉在入场发觉自己经济较低,果断选择发展我方经济
但同时也没有做到过分猥琐发育,还是该出手时就出手发起进攻持续进攻注:动图来自2021高校联赛AI表演赛
而在后期的决策博弈更是精彩:
很是有种人类玩家的感觉了战略撤退进攻防御塔返回基地追击地方
不仅如此,智能体在紧张的战斗决策同时,还兼顾了出装策略
大家都知道,出完血书(血族之书)的貂蝉,战斗中的续航能力会得到大幅提升
为此,蓝方貂蝉第二个法术大件果断选择梦魇之牙,以此来克制红方貂蝉的回血注:动图来自2021高校联赛AI表演赛
红蓝貂蝉在交手八百回合之后,终于迎来了决战紫禁之巅的时刻
在红方水晶之下,两位貂蝉纷纷喊出花开了,怒放吧开启大招,完成最后的较量
最终,以双方纷纷倒地,由蓝方小兵推倒红方水晶结束战斗
这就是学霸们在王者荣耀里搞科研的结果展示
而更具体一点来说,就是在特定的环境中,对多智能体之间的博弈展开研究,属于强化学习领域范畴
它的难点之一,就在于智能体的每一个决策与动作,都会对全局产生非常复杂的变化,是有种牵一发而动全身的感觉了
而在刚才的例子中,只是展示了学霸们在1V1场景中的科研成果,但其实他们还会有3V3的战斗
这种场景对于智能体的挑战就更高了,因为每个智能体仅能获取局部的观测信息,但无法得知其他队友或敌人的信息
这就对合作与竞争完成特定任务背后的算法,提出了高难度的要求
果然,学霸们打个游戏都是如此烧脑
不过讲真,如此名场面还真不是什么新鲜事
游戏中搞科研,并不是第一次
其实刚才学霸们的科研展示,就是去年中科大和电子科大,在第一届腾讯开悟AI大赛上演的一场决斗这场比赛可以说是扩大了社会各界对AI+游戏的认知
但说实话,在游戏里搞科研这件事,国内外早就有所行动了
例如早在2017年,OpenAI修炼的智能体,就单挑苦练了半辈子Dota的人类玩家Dendi,最终AI大获全胜时隔一年(2018年),OpenAI再次派出OpenAI Five,以5V5模式对战人类顶级阵容
结果,又是以AI100%胜率告终比赛当时这样的结果简直是出乎观众的意料之外,就连马斯克在比赛前被问及谁会赢,都非常自信地回复到人类与此相关的技术论文也早就有所公布而除了在Dota2这种5V5团队竞技类型游戏外,AI+游戏在其他类型的游戏中也有所渗透
例如DeepMind从2017年开始,也频繁曝出在星际争霸2这款游戏中碾压人类顶级玩家的消息DeepMind在这方面的科研研究AlphaStar,其背后的相关技术论文,更是登上了顶刊Nature而在国内,对于AI+游戏的科研也是如火如荼地进行中
例如早在2018年开始,腾讯AI Lab便在王者荣耀中持续发力,并与游戏团队打造出了策略协作型AI王者绝悟
要知道,类似于这样的5V5 团队竞技游戏,单是玩家的动作状态空间便高达1020000
这个数字远远大于围棋及其他简单游戏,甚至超过整个宇宙的原子总数(1080)
在这三年期间,腾讯AI Lab在与之相关的研究,更是频频登上了AAAINeurIPS 等 AI 顶级会议(相关链接附在文末,感兴趣的读者可深入研究)
而就在前不久的世界人工智能大会中,王者绝悟更是以全英雄达到职业电竞水平亮相
在与人类顶级选手的较量中,更是以绝对的胜率惊艳四座值得一提的是,正是由于腾讯AI Lab在AI+游戏领域的技术沉淀,才能够在将其能力打包输送给高校的学霸们,也就是我们刚才提到的开悟AI开放研究平台
至此,或许你有一个大大的疑问:
直接上答案有的!而且意义非凡在游戏里搞科学研究,对我们现实生活有什么意义吗?
游戏,会是下一个AI里程碑的诞生地吗?
是的,这就是业界目前普遍认同的一种看法:这种说法并不是空穴来风下一个AI里程碑可能会在复杂策略游戏中诞生
首先,AI+游戏所涉足的大领域,便是强化学习
一般来说,强化学习是用于描述和解决智能体在与环境的交互过程中,通过学习策略以达成回报最大化或实现特定目标的问题
而一些复杂的强化学习算法,更是在一定程度上具备了解决复杂问题的通用智能
但要通过训练,让智能体炼就如此能力,正如我们刚才说到的,算法数据算力场景,这四样缺一不可
尤其是场景和数据,需要够复杂够具备不确定性,才能更好的贴近真实世界中人类决策时面对的环境
游戏场景,恰恰就是符合这些高要求的阵地
因此,长远来看,AI+游戏研究将是攻克通用人工智能(AGI)的关键一步
而之于现实意义,以近几年大火的自动驾驶为例
在这一领域中,随着技术的不断发展,自动驾驶逐步地从感知层向决策层过渡
这是因为自动驾驶车辆在面临突发不确定性问题时,需要作出精准的决策,来避免意外的发生可以把一辆自动驾驶汽车想象为一个游戏中的智能体,当它在现实生活中运行时,所要面对的问题复杂度之高,就不言而喻了
这就离不开通过强化学习方法的大量训练,让自动驾驶这个智能体的应变能力,能够无限接近甚至超越人类
但要练就这身功夫,在真实生活场景中训练定然是不现实的,而游戏,就成了一个非常好的训练场
自动驾驶只是应用场景的案例之一,更多的还包括城市/空中交通管理多机器人协调能源分配等问题
而腾讯AI Lab之所以打造开悟,也是基于上述情况的考量,不过他想要的做的却更多:
尤其是高校在这方面的研究,更是硬性条件上面临着较为严峻的挑战推动多智能体强化学习的发展
但开放开悟,仅仅是腾讯AI Lab为了完成这一目标的举措之一
据了解,开悟还携手高校合作开发课程,进一步普及多智能体强化学习教育
例如在今年8月,腾讯就宣布与四所国内一流高校(北京大学电子科技大学清华大学中国科学技术大学),共建教学内容和课程体系改革项目
据悉,这些顶尖高校将分别构建一门至少20学时的多智能体及强化学习平台的专业课程,理论授课知识点包括但不限于机器学习强化学习多智能体决策等相关的知识点
除此之外,腾讯开悟还联合高校成立了人工智能科教联盟,并携手高校科研院所产业园区投资机构组建人工智能科创联合体
正如王者荣耀执行制作人腾讯天美L1总经理黄蓝枭总结的那样:
读到这里,你想不想围观清北等高校的学霸们,如何不仅打了游戏,还顺便把科研也一块搞了?我们开放了王者荣耀核心机制,提供标准接口核心算法脱敏的测试数据评估工具和计算集群等,给高校老师和同学们进行多智能体的机器学习算法研究学习成果交流,对算法成果反复迭代升级期待这些研究成果能够落地其他产业环境,为工业机器人救灾机器人等提供助力
请继续关注开悟平台及赛事动向
传送门
开悟官网地址:https://aiarena.tencent.com/aiarena/zh/index
绝悟相关论文地址:
Mastering Complex Control in MOBA Games with Deep Reinforcement Learning:
https://arxiv.org/abs/1912.09729
Hierarchical Macro Strategy Model for MOBA Game AI:
https://arxiv.org/abs/1812.07887
Supervised Learning Achieves Human-Level Performance in MOBA Games: A Case Study of Honor of Kings:
https://arxiv.org/abs/2011.12582
完
本文系网易新闻网易号特色内容激励计划签约账号量子位原创内容,未经账号授权,禁止随意转载智能汽车交流群招募中!
欢迎关注智能汽车自动驾驶的小伙伴们加入社群,与行业大咖交流切磋,不错过智能汽车行业发展&技术进展加好友请务必备注您的姓名-公司-职位 哦~点这里关注我,记得标星哦~
一键三连分享点赞和在看
科技前沿进展日日相见~
关注 量子位
微信扫一扫关注公众号