游戏百科:在雷神之锤3CTF踢屁股的人工智能正在学习如何玩其余的游戏

时间:2021-08-20 14:04:00 来源:

游戏百科:在雷神之锤3CTF踢屁股的人工智能正在学习如何玩其余的游戏

DeepMind AI对电子游戏有着真正的诀窍。它在旧的Atari街机经典中处理得很好,它在星际争霸2中踢屁股,并且它在Quake 3 Arena夺旗上放下了锤子。而且它正在变得越来越好:正如在去年的研究基础上更新的DeepMind博客文章中所详述的那样,人工智能的CTF小组正在迅速学习如何玩其他游戏。

“强化学习(RL)在日益复杂的单一代理环境和双人回合制游戏中取得了巨大成功。然而,现实世界中包含多个代理,每个代理都独立学习和行动以与其他代理商合作和竞争,”完整的研究论文摘要状态。“我们使用锦标赛风格的评估来证明代理人可以在三维多人第一人称视频游戏中获得人类级别的表现,在夺旗模式中使用Quake 3 Arena,仅使用像素和得分作为输入的游戏点。”

结果不言自明。人工智能的“FTW特工”在地图上播放人类,双方此前曾见过的平均每人比平均多出16个旗帜;人类宣称胜利的唯一时间是他们与AI对抗另一方的两个AI。在一项针对AI团队的两个“专业游戏测试人员充分沟通”的单独研究中,情况并没有好转。“即使经过12个小时的练习,人类游戏测试人员也只能赢得25%(6.3%的抽奖率)游戏对代理团队,”该报称。

结果表明,人工智能可以学习在“丰富的多智能体环境中”使用竞争和合作元素进行复杂的游戏,仅使用“像素和游戏点作为输入”,并且“表明受过训练的代理人能够与永远合作 - 在队友之前,比如人类。“

毫无疑问,这有助于在电子游戏中发展更好的计算机控制对手,但更重要的是,研究人员在结论中表示,他们的结果为各种其他可能性打开了大门:“所提出的培训人群培训框架,每个人都有自己的学到的奖励,对游戏结构做出最小的假设,因此可以适用于各种多智能体系统中的可扩展和稳定的学习。“

基于DeepMind博客文章,这似乎正在发生的事情。“自从最初发布这些结果以来,我们已经成功地将这些方法扩展到Quake III Arena的完整游戏,其中包括专业播放的地图,除了夺旗之外更多的多人游戏模式,以及更多小工具和拾音器,”它说。“初步结果表明,代理商可以竞争性地玩多种游戏模式和多种地图,并开始挑战我们的人类研究人员在测试赛中的技能。”

事实上,在这项工作中开发的想法“构成了我们在星际争霸2中工作的AlphaStar代理人的基础,”研究人员说。

“总的来说,这项工作突出了多智能体培训推动人工智能发展的潜力:利用多智能体培训提供的自然课程,并迫使强大的药剂开发,甚至可以与人类合作。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如有侵权行为,请第一时间联系我们修改或删除,多谢。

相关阅读

精彩阅读

加入我们 | 联系我们 | 广告服务

Copyright © 游戏评论网 All Rights Reserved 版权所有

返回顶部