封面新闻记者 燕磊 边雪
当地时间3月14日,OpenAI公开发布大型多模态模型GPT-4,与ChatGPT所用的模型相比,GPT-4不仅能够处理图像内容,且回复的准确性有所提高。目前,GPT-4没有免费版本,仅向ChatGPT Plus的付费订阅用户及企业和开发者开放。
一个能够理解照片的人工智能
据OpenAI官方介绍,GPT-4支持输入的内容不再仅限于文字,而且支持图像内容的输入,成为一个能够理解照片的人工智能。
GPT-4最后还表示:“这些只是几个例子,但可能性是无穷的!”
值得一提的是,除了普通图片,GPT-4还能处理更复杂的图像信息,包括表格、考试题目截图、论文截图、漫画等,例如根据专业论文直接给出论文摘要和要点。
OpenAI称,公司花费6个月的时间,利用对抗性测试程序和ChatGPT的经验教训迭代调整GPT-4,从而在真实性、可操纵性和拒绝超出设定范围方面取得了有史以来最好的结果,“至少对我们而言,GPT-4训练运行前所未有地稳定,成为首个能够提前准确预测其训练性能的大型模型。”
未来,也许ChatGPT不仅仅是支持图像的输入,可能支持视频的输出。
“它并不完美,但你也一样”
OpenAI官方表示,GPT-4由于其广泛的通用知识和解决问题的能力,可以更准确地解决难题。
GPT-4比以往任何时候都更具创造力和协作性。它可以生成、编辑和迭代用户的创意和技术写作任务,例如创作歌曲、编写剧本或学习用户的写作风格。
GPT-4在高级推理能力上超越ChatGPT。在律师模拟考试中,ChatGPT背后的GPT-3.5排名在倒数10%左右,而GPT-4考到了前10%左右。
此外,GPT-4的长度限制提升到32K tokens,即能处理超过25000个单词的文本,并且可以使用长格式内容创建、扩展对话、文档搜索和分析等。
“为了明确这些风险的具体情况,我们聘请了50多位来自人工智能对接风险、网络安全、生物风险、信任和安全以及国际安全等领域的专家对该模型进行对抗性测试。”
OpenAI表示,这些领域专家的反馈和数据为缓解和改进模型提供了依据,比如他们已经收集了额外的数据,以提高GPT-4拒绝有关如何合成危险化学品的请求的能力。
【如果您有新闻线索,欢迎向我们报料,一经采纳有费用酬谢。报料微信关注:ihxdsb,报料QQ:3386405712】
相关文章
猜你喜欢