继《Dota2》和《星海争霸》后,人类又一款竞技游戏败给AI

2020-07-30 浏览量:784
继《Dota2》和《星海争霸》后,人类又一款竞技游戏败给AI

很多竞技射击游戏中,都能看到名为「夺旗」玩法。这源于西方传统运动,玩家分成两支队伍,目标是把对方基地的旗帜带回自己基地,同时要保护自己旗子不被抢走。

规则看似简单,可比起强调击杀得分的玩法,夺旗对团队配合和战术执行会要求更高,这往往需要几名玩家在进攻和防守间取得平衡点。

但这依旧没有难倒开发 AlphaGo 的 DeepMind 实验室。据 Arstechnica 报导,5 月 30 日《Science》期刊有一篇新论文,称新设计的 AI 程式已能在《雷神之锤 III 竞技场》展现和人类一样的行动模式,还能在夺旗游戏战胜人类队伍。

这也是继《星海争霸 II》和《Dota 2》后,DeepMind 又攻破的複杂竞技游戏。

想让 AI 玩好竞技射击类游戏,难点是什幺?

《AlphaGo》影片中,DeepMind 创始人 Demis Hassabis 曾简单说明让 AI 理解围棋玩法的难点。

他说,相比西洋棋,围棋每颗棋子都有更多可走的路径,最终整个棋局变化数目,比全宇宙的原子总数还多。

DeepMind 实验室的挑战,就在于发明效仿人类直觉的进阶演算法,最终让它们像人类一样决策,展开行动。

换成第一人称射击游戏的夺旗,AI 需要有更快的即时决策能力,比如思考什幺时间点做什幺事才正确?如果两队的比数差较大,又该如何协调队友,採取什幺策略才能扳回分数?

为了解决这个问题,DeepMind 实验室建立一套新的双层学习系统。

继《Dota2》和《星海争霸》后,人类又一款竞技游戏败给AI

在内层,DeepMind 会让 AI 专注竞技比赛的核心目标,也就是赢得胜利,基于这点,AI 会再为整个游戏建立数个次级目标,寻求取胜的最短路径,比如跟随队友,或在敌人基地附近游走。

这有一些具象化的东西,比如训练过程中,DeepMind 团队採取「优胜劣汰」,让 AI 淘汰每一轮模拟赛表现最差的方案,然后再把最优秀方案的突出部分取出来,反覆改进决策树。

外层部分,根据内层的决策情况来调整其他模组。比如说当内层认为防守战术是现在最好的选择,外层就会提升 AI 对四周环境的视觉感知能力,这样当敌人靠近基地时,AI 便能更快射杀。

继《Dota2》和《星海争霸》后,人类又一款竞技游戏败给AI

这幺看下来,DeepMind 开发的这套 AI 还是和人类很相似,内层就像人类「大脑」,主要负责战术策略;外层可当作人类的「眼睛和双手」,负责执行。

确定模型后,接下来就是一遍又一遍训练了。这次 DeepMind 团队投入约 3 週时间,让 AI 进行 45 万局游戏,相当于人类玩家花 4 年积累的时数,效率惊人。

继《Dota2》和《星海争霸》后,人类又一款竞技游戏败给AI

进行到约 10 万场训练时,AI 队伍已达普通人类玩家的水準;20 万局训练后,AI 队伍已能击败职业玩家,且优势逐渐扩大。

另外,研究人员还在训练期间发现一些其他惊喜。比如 AI 会从神经网路分出一部分神经元,专门用于确认队友是否拿到旗子。

团队还使用随机生成的地图场景,为的就是不让 AI 靠地图取胜。

AI 之所以强,不仅因为战术,还有神操作

AI 游戏玩赢人类,靠的是什幺?DeepMind 曾表示,这是基于强化学习演算法下的战术执行。

但也有不少人认为,AI 在竞技游戏的真正优势是超高手速和操作效率,且很多是人类玩家无法做到的。

原因很简单,我们玩电脑游戏时需要用到滑鼠、键盘和摇桿,人类每次操作,都得先让大脑意识回馈到手指,然后再传到游戏。

但人类选手面对的 AI 并不是机器人,它们没有实体,所以下达指令时并不需要借助摇桿等工具,这等于砍掉了中间流程,自然能获得双倍效率。

继《Dota2》和《星海争霸》后,人类又一款竞技游戏败给AI

这在实际游戏也可体现。今年初《星海争霸》AI 对抗赛,职业选手每分钟平均运算元为 250~500 左右,而 AI 可飙到 1,000+,且大部分都是有效操作,意味着 AI 可在极短时间下达更多複杂指令。

本次《雷神之锤 III 竞技场》比赛,据统计,人类的反应时间只有 AI 一半,且后者射击精準度可达 80%,人类只有 50%。

之后,哪怕 DeepMind 称已将 AI 的回应时间调整至与人类相似,人类战队依旧只能保证约 30% 胜率,证明在战术执行和决策部分,AI 依旧拥有优势。

这其实也没办法,单从训练量来说,DeepMind 的 AI 两週内玩的局数,积累了大约 200 年的游戏时间。

难怪有人评价,这种比赛毫无意义,因为 AI 本身就是外挂般的存在。

但人类也并非毫无优势,比如射击游戏的远距离狙击场景,职业玩家会展现出更好的视觉能力。

所幸,我们暂时不用担心碰到这幺强的 AI 对手。毕竟,如果 AI 太聪明,看破你一切招数,玩家会心生明显的受挫感,玩游戏变成自虐,就不用指望卖出去了。

此外,比起游戏,现实世界还有很多值得 AI 投入的领域,《纽约时报》就评论,这些 AI 技能可运用在仓储管理机器人,还有自动驾驶系统等。

在 DeepMind 眼中,电子游戏仅是敲门砖,AI 真正需要掌握的是独立理解世界的能力,以及达成目标的手段,就算换成现实世界,也可以帮助人类。

相关文章