DeepMind首次在所有57款雅达利游戏上超越人类玩家.docx
《DeepMind首次在所有57款雅达利游戏上超越人类玩家.docx》由会员分享,可在线阅读,更多相关《DeepMind首次在所有57款雅达利游戏上超越人类玩家.docx(6页珍藏版)》请在第一文库网上搜索。
1、DeepMind首次在所有57款雅达利游戏上超越人类玩家挑战雅达利游戏,一直是DeepMind的研究日常。当地时间3月31日,这家全球最受瞩目的人工智能公司在自己的官方博客上宣布了挑战的最新进展:在57款雅达利游戏中全面超越人类,在该领域里是第一次。57款雅达利游戏DeepMind在最新发布的预印本论文和博客中表示,他们构建了一个名为Agent57的智能体,该智能体在街机学习环境(ArCade1earningEnvironment,A1E)数据集所有57个雅达利游戏中实现了超越人类的表现。如果Agent57真如DeepMind所描述的那样优秀,那么它将为构建更加强大的AI决策模型奠定基础。想象
2、一下,人工智能不仅可以自动完成平凡、重复性的任务(比如数据输入),还可以自动推理环境。这对于那些希望实现自动化以提高生产力的企业而言,可能就是福音。为什么选择雅达利游戏让单个智能体完成尽可能多的任务是DeepMind一直以来的研究目标,也被该公司视为迈向通用人工智能的必经之路。而利用游戏来评估智能体性能是强化学习研究中的一个普遍做法。游戏中的环境是对真实环境的一种模拟,通常来说,智能体在游戏中能够应对的环境越复杂,它在真实环境中的适应能力也会越强。这次DeepMind挑战的街机学习环境中包含57款雅达利游戏,可以为强化学习智能体提供各种复杂挑战,因此被视为评估智能体通用能力的理想试验场。选择雅
3、达利游戏作为挑战目标的原因主要有3点。首先,雅达利游戏足够多样化,可以评估智能体的泛化性能;其次,它足够有趣,可以模拟在真实环境中可能遇到的情况;第三,雅达利游戏是由独立的组织构建,可以避免实验偏见。早在2012年,DeePMind开发DeePQ-Network(DQN)来挑战雅达利57中游戏。DQN是雅达利2600游戏众多挑战者中第一个达到人类控制水平的智能体。期间尽管取得了进步,但经过改进后的DQN始终没有克服四款比较难的游戏:MontezumasRevengePitfai1So1aris和Skiing0此次新发布的Agent57改变了这一局面。Agent57如何实现超越人类DeepMin
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- DeepMind 首次 所有 57 款雅达利 游戏 超越 人类 玩家
