微信号:cyberlawrc

介绍:【腾讯研究院 ★ Tencent Research Institute】 网聚智慧,连接世界!网罗互联网前沿理念、传递互联网发展声音、汇集互联网研究成果、推动互联网法治进程.

AI超会团!策略协作型AI“绝悟”首次露面KPL总决赛惊艳全场!

2018-12-26 18:00 腾讯研究院

在刚刚结束的2018KPL秋季赛总决赛上(12月22日),腾讯AI Lab与王者荣耀及王者荣耀职业联赛共同探索的前沿研究项目——策略协作型AI“绝悟”首次露面,接受前KPL职业选手和职业解说组成的人类战队(平均水平超过99%玩家)的5V5水平测试,并取得胜利。

AI“绝悟”亮相,惊艳总决赛

在这场比赛中AI战队使用了达摩、阿轲、干将莫邪、典韦、张飞对阵人类战队的花木兰、赵云、小乔、项羽、牛魔。

比赛前期,AI战队的表现和人类战队相比确实缺少了几分灵动,被打出0-5的劣势,让很多观众一度产生“人工智能也不过如此的感觉”。但接下来AI战队的表现是真的惊艳到了大家。

AI“绝悟”操作亮点

AI达摩红buff处的一次漂亮的蹲点,直接用大招将赵云推上墙然后跟闪现秒杀出乎了所有人的预料,也展现了AI的意识和智慧。在引得现场观众一阵惊呼的同时却又让他们感觉到一点点眼熟,这操作我们好像在BA.一诺身上见过。没错,TS.暖阳也有过这样的操作!

AI干将莫邪配合AI达摩精准秒杀,同时被敌方项羽牛魔两人近身竟有条不紊逃生,极其亮眼。那种潇洒和随性哪有一点人机的感觉?AI这是师从Hero.久诚?

但最让人惊讶的是,AI真的超级会打团,依靠着优秀的团队协作配合最终一点一点扳回劣势,逆风翻盘赢得了比赛。这也再次说明王者荣耀强调的是团队协作配合,通过团队共同的努力取得最后的胜利正是王者荣耀最大的魅力!

在逆风翻盘打团获胜后,这个策略协作型AI“绝悟”也激起了众多观众与玩家的好奇:“绝悟”AI是如何训练成长的?它的技术背景是怎么样,为什么王者荣耀会来合作探索这样一个领域?绝悟AI会应用在哪里?

AI“绝悟”的训练与成长

“绝悟”首先通过监督学习方法,深度模仿 KPL 职业玩家的数据;其次,会进行大量自我对战,每天的训练强度最高能达到人类150年的训练量。

算法上,模仿人类的决策方法,综合考虑小地图信息、己方视野和英雄属性等多个维度特征,让它兼具大局观与微操,决定在游戏的什么时间该去哪里(去上、中、下路或野区等、单人或配合队友站位),要做什么(游走杀人Gank、带兵线、支援或反野),及具体微操怎么做(确定各自站位和角色、组合技能并释放)。

并在此基础上还研发出多个具有针对性的强化学习训练模型,通过奖惩机制鼓励“绝悟”做有益团队的行为,有效提升了团战中的协作能力。

AI“绝悟”的技术背景

策略协作型 AI 是攻克 AI 终极研究难题——通用人工智能(Artificial General Intelligence,下称 AGI )的关键一步。AGI 代表研发能在通用系统中执行多种复杂命令,达到或超越人类水平的 AI ,从担任中国国家围棋队训练专用 AI 的“绝艺”,到寓意拥有“绝佳领悟能力”的“绝悟”。

不断让 AI 从0到1去学习进化,并发展出一套合理的行为模式,这中间的经验、方法与结论,长期来看,有望在大范围内,对医疗、制造、无人驾驶、农业、智慧城市管理等领域带来更深远影响。

而想要探索攻克策略协作型AI,需要一个合适的训练场景。王者荣耀是一款多人在线战术竞技(MOBA)类游戏,对战在两个团队(每队5名玩家)展开,地图包括上、中、下三条路线,以先推倒对方水晶防御塔为胜利判定标准。

对战中,在庞大且有不完备信息的地图上,10位参与者要在策略规划、英雄选择、技能应用、路径探索及团队协作上面临大量、不间断、即时的选择,形成了极为复杂的局面,预计有高达10的20000次方种操作可能性。

若 AI 能在如此复杂的环境中,学会跟人一样实时感知、分析、理解、推理、决策到行动,就可能在多变、复杂的真实环境中发挥更大作用。因此业界认为下一个 AI 里程碑,可能会在复杂策略游戏中诞生。

AI“绝悟”的应用

在KPL赛场上,我们的电竞职业选手也需要手眼脑协调、即时策略决策、团队协作精神及大量刻苦训练。策略协作型AI“绝悟”的出现,可以帮助这些职业选手进行更专业化、数据化的训练。借助在算法和数据方面的优势,为他们提供数据、战略与协作类实时分析与建议。

值得强调的是:策略协作型AI“绝悟”目前只会应用在电竞领域,而不是游戏内,召唤师们不会在正式服的任何PVP对局中遇到“绝悟”。

策略协作型AI“绝悟”的出现,不仅仅只是2018年王者荣耀职业联赛(KPL)秋季赛总决赛的惊鸿一瞥。这标志着腾讯AI Lab与王者荣耀共同开启了对“AI+电竞”的全新探索,向“通用人工智能”这一AI终极命题进一步迈进。

— — | END | — —

我好看吗?
 
腾讯研究院 更多文章 2018年互联网法律政策趋势十大关键词 国际网上青少年保护之经验分享——Stephen Balkam(国际家庭在线安全协会创始人) 数据时代下,社会经济发展的新范式及新机遇 | AI&Society成都站回顾 程华:从消费互联网看中国的产业互联网发展 | 企鹅经济学 计算社会经济学:行为数据驱动预测性管理 | 周涛
猜您喜欢 东芝倒塌实录:核电梦碎、财报造假、掌门人内斗 廖雪峰无门槛讲述分布式+高并发的那些事 第一届护网杯线下决赛awd之shell多解 QCon 2017 限免论坛,七牛云邀你共探深度学习场景实践 如果软件测试是门艺术,软件测试工程师就是艺术家 -- 浅析ZStack是如何做智能软件测试