在上周的 Dota 2 人机最终决战中,OpenAI Five 迎战世界冠军 OG,在一场三局两胜比赛中连赢两局,成为第一个在电子竞技游戏中击败世界冠军的人工智能。
近日,OpenAI 在其博客中发布了关于其 OpenAI Five 的更多技术解读,并透露下一步的目标,文章编译如下(经过基于愿意的删改):
OpenAI Five 和 DeepMind 的 AlphaStar 之前曾私下击败过优秀的职业选手,但在直播比赛中都输掉了比赛。本场比赛也是 AI 第一次在直播中击败了电子竞技专家。
(来源:OpenAI )
在大赛期间,展示了一场 OpenAI Five 与人类组队的对局。这场比赛一边是 Blitz 和 Sheever 以及由 OpenAI Five 控制的 3 个 AI,另一边则是 ODPixel 和 Capitalist 和 3 个 AI。
OpenAI Five 与人类合作的能力为人类与未来人工智能互动的提供了一个值得期待的场景,即人工智能系统与人类协作并增强人类体验。几位参与人机组队对局的选手报告说,他们感受到了 AI 队友的支撑,他们从与这些先进的 AI 系统中学到了很多东西,而且就整局比赛来说也是一种有趣的体验。
请注意,这相当于一种零样本(zero-shot)迁移学习——训练时对局双方均为 AI 控制,但却可以泛化(generalize)在与人类组队协作的场景上。事实上,OpenAI 考虑举办 AI 与人类协作的比赛,本以为需要为此专门训练。
下一步:“竞技场”解密OpenAI 推出了 OpenAI Five “竞技场”(https://arena.openai.com/),于 4 月 18 日星期四太平洋标准时间下午 6 点开放,并于 4 月 21 日星期日太平洋标准时间晚上 11:59 关闭。
作为一项开放实验,这个允许任何人在对抗或者合作模式下与 OpenAI Five 对局游戏。OpenAI 的 1v1 机器人可以通过聪明的策略来利用 ; 但不知道 OpenAI Five 在多大程度上也是如此,OpenAI 期待玩家社区能够帮助找到答案。
(来源:OpenAI )
接下来,OpenAI 在审查 OpenAI Five Arena 的结果之后,将发布对 OpenAI Five 的更多技术分析。
之后,OpenAI 将继续使用 OpenAI 中的 Dota 2 环境,这一环境给强化学习带来大量的进展,Dota 2 将继续帮助推进可行的方案——无论是通过较少的数据还是真正的人类-AI 合作实现更大的突破。
相关文章
猜你喜欢