> 自媒体 > AI人工智能 > 经过7万小时训练,OpenAI宣布做出了最强的《我的世界》AI
经过7万小时训练,OpenAI宣布做出了最强的《我的世界》AI
来源:游研社
2023-09-22
206
管理

视频是种潜力巨大的培训资源。

Open AI最近公布了一项他们在人工智能领域的最新成果——最擅长玩《我的世界》的AI。

厉害到什么程度?无论是建造地堡、金字塔这些复杂的建筑,跟游戏里的恶龙战斗,亦或是“白手起家”,制造出稀有的钻石工具都不在话下,这些任务即使是交给熟练的人类玩家来做,往往也需要数十分钟的流程以及上万个点击操作。

而该AI在经过训练后,则可以在没有任何外力辅助的情况下自主完成这一系列事件,这是此前其他AI都无法做到的。根据Open AI的介绍,能够实现这一成果,依靠的是在模仿学习(imitation learning)技术上的新突破。

在这项技术中,AI会被训练成通过观察并模仿人类的行为来完成相应的任务,此前很多效果都运用到了类似的原理,比如控制机械手臂或者驾驶汽车。

既然AI需要观察模仿,那么就势必需要一定量的素材,而单就“熟练操作《我的世界》”而言,各大视频网站上的学习素材其实已经非常多,完全能够满足AI的学习需要。

但问题是,还需要另一项额外的工作,即“让AI准确理解视频里的内容”。

《我的世界》是一款没有明确目标的游戏,虽然网上素材繁多,可并不能直接拿来当作学习资料,因为视频里的每个动作和操作,其实都需要人类为其贴上“标签”,也就是做出相应的注释,才能AI明白操作的含义。

如果每个动作都需要人工注释,那效率自然会降低,为了解决这个问题,研究人员想出了一项新方法——训练能够自动为视频操作贴标签的AI。

他们先是召集了一批志愿者玩家来操作游戏,并保留了玩家们的按键记录,在得到2000个小时的游戏数据后,研究人员训练了一个新的模型,并人工将按键操作与游戏里的效果一一对应,比如在什么情况下点击鼠标会让人物挥动斧头。

下一步便是用这个模型来处理网上海量的《我的世界》视频,为他们贴上让AI能够理解的标签。根据公布的数据,为了得到理想的效果,科研人员提供的视频素材长达70000个小时。

而这确实也获得了一定的成果,比如像开头说的那样,AI已经学会了如何自己制作钻石工具。而Open AI的负责人Bowen Baker表示:“我们觉得《我的世界》是一个很好的研究领域。”

由于《我的世界》没有明确的输赢且自由度极高,所以研究人员可以训练AI执行更多复杂的任务,而他们认为这些工作最终可以反哺到现实——如果AI能在游戏里设计一张桌子,那么在现实里没准也行。

0
点赞
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与华威派无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
凡本网注明 “来源:XXX(非华威派)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。
QQ:2443165046 邮箱:info@goodmaoning.com
关于作者
冷冷的太阳(普通会员)
点击领取今天的签到奖励!
签到排行
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索