DeepMind用新AI超越自己：提速200倍，在所有雅达利游戏上胜过人类

清一色 • 2023年5月6日 03:22 • 人工智能 • 阅读 19323

Agent57，是DeepMind在2020年搞的一个智能体，史上首次在所有57个雅达利游戏中超过了人类基准表现。

Agent57，是DeepMind在2020年搞的一个智能体，史上首次在所有57个雅达利游戏中超过了人类基准表现。

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。

DeepMind又对雅达利游戏下手了！

这次，他们最新推出的智能体MEME，在效果不变的前提下，比两年前的Agent57提速了200倍！

Agent57，是DeepMind在2020年搞的一个智能体，史上首次在所有57个雅达利游戏中超过了人类基准表现。

但它有一个致命缺陷是效率低：需要近800亿帧的数据训练才能实现。

现在，MEME的出现完美解决了这一问题。

有网友看完表示：这就是真正的样本高效吧。

话不多说，赶紧来一睹为快吧。

新的智能体：MEME

Agent57，作为首个在所有雅达利游戏中超越人类基准表现的智能体，性能上已足够先进。

但问题是，要想达到这一目标，背后需要780亿帧的庞大的经验训练，这在时间和成本上都是一笔大开支。

因此，以Agent57为起点，DeepMind采用了一系列不同的策略，来实现训练效率上的提升。

他们调查了在减少数据制度时遇到的一系列不稳定因素和瓶颈，并提出了有效的解决方案，最后建立一个更加强大和高效的智能体：MEME。

新的MEME智能体主要针对Agent57的4个方面进行改善，分别是：

A.实现与罕见事件相关的学习信号的快速传播；

B.在不同的价值尺度下稳定学习；

C.改进神经网络结构；

D.在快速变化的政策下使更新更加稳健。

为了达到这四个目标，DeepMind采取了以下方法，与上述四点相对应。

A1.用在线网络进行引导；

A2.有公差的目标计算；

B1.损失和优先权归一化；

B2.交叉混合训练；

C1.无归一化的躯干网络；

C2.带有综合损失的共享躯干；

D.通过策略提炼的鲁棒行为。

这些方法旨在提高Agent57的数据效率，但这种效率的提高不能以牺牲终端性能为代价。

因此，为了检验经过上述步骤的智能体MEME的效率和性能，研究团队分别在2亿、10亿、200亿、900亿帧环境进行了训练。

通过下图可以直观的看出，新智能体MEME在3.9亿帧时就超过了人类基准，比Agent57快了两个数量级，并且在将参数量从90B减少到1B的情况下，取得了类似的最终表现。

可以说相比Agent57而言，MEME既提升了效率，又保持了性能。

研究团队

MEME的研究团队来自DeepMind。

其中三位Adrià Puigdomènech Badia、Steven Kapturowski、Charles Blundell也是之前Agent57的论文作者。

值得一提的是，Steven Kapturowski在两篇论文中都是一作。

他毕业于美国科罗拉多大学博尔德分校，曾在苹果、微软、Glassdoor等公司工作过，现在是DeepMind的一名高级研究工程师。

DeepMind用新AI超越自己：提速200倍，在所有雅达利游戏上胜过人类

©本文为清一色官方代发，观点仅代表作者本人，与清一色无关。清一色对文中陈述、观点判断保持中立，不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。本文不作为投资理财建议，请读者仅作参考，并请自行承担全部责任。文中部分文字/图片/视频/音频等来源于网络，如侵犯到著作权人的权利，请与我们联系（微信/QQ:1074760229）。转载请注明出处：清一色财经

赞 (0)

打赏

微信扫码打赏

支付宝扫码打赏

清一色管理团队

0 0

这几个Python数据可视化探索实例，拿走不谢！

上一篇 2023年5月6日 03:22

怎么创建 JavaScript 自定义事件

下一篇 2023年5月6日 03:23

人工智能

世界首个AI程序员Devin视频竟造假？博主逐帧解析，Devin代码任务完成很糟糕

43.0K000

清一色
2024年4月15日
人工智能

AIGC算力全景与趋势报告发布！一文解读AIGC算力构成、产业链条，还有五新趋势判断

38.4K000

清一色
2023年7月20日
人工智能

常见的降维技术比较：能否在不丢失信息的情况下降低数据维度

14.1K000

清一色
2023年5月5日
人工智能

MIT博士毕业，「太极」作者胡渊鸣回国创业，专注图形编程

28.6K000

清一色
2023年5月5日
人工智能

用ChatGPT搞定12 种编程语言：看看它如何表现

7.8K000

清一色
2023年5月5日
人工智能

仿和牛的3D打印肉，动物干细胞「生长」而成，你会吃么？

10.3K000

清一色
2023年5月4日

发表评论

登录后才能评论

联系我们

在线咨询：

手机：13798586780

QQ/微信：1074760229

QQ群：551893940

工作时间：工作日9:00-18:00，节假日休息

关注微信