上周Google已经向一些公司开放了其多模态大模型Gemini的功能,面对 Google的步步紧逼,OpenAI 显然坐不住了,他们正在将多模态功能整合到GPT-4模型中,以推出类似于 Gemini 的多模态大模型。
多模态功能最早在三月份 OpenAI GPT-4发布会上首次亮相,OpenAI 主要展示了了其在视觉理解方面的能力。比如用户画个网站草图,多模态模型会根据草图生成网页代码。不过自从展示后 OpenAI 并没有非常具体的时间表来将该产品推向市场。
据The Information 报道,为了应对Google Gemini 的威胁,OpenAI正在加紧训练代号为“Gobi的”打多模态大模型,并会在 Gemini 推出前发布,抢占市场。之所以 OpenAI 花了较长时间来打磨多模态模型,是因为他们担心这些新的视觉功能可能被不法分子滥用,比如用于自动破解验证码或面部识别。不过他们似乎已经解决了这个问题。
至于Gobi是否就是传说中的GPT-5,目前尚无确切消息。根据 DeepMind 的创始人之一 Mustafa Suleyman 的猜测,OpenAI 可能正在秘密训练GPT-5,但这还没有得到确认。
相关文章
猜你喜欢