OpenAI发布了GPT-4,这是为ChatGPT提供动力的下一代大型语言模型。经过数月的猜测,这部备受期待的“大制作”终于上映了。目前,GPT-4可以通过ChatGPT (ChatGPT的订阅路径)进行尝试。还有一个访问API的等待列表。
OpenAI首席执行官Sam Altman在推特上宣布了GPT-4,并发布了一个GPT-4研究博客文章的链接,并警告道:“第一次使用时令人印象深刻。但它仍然有缺陷,仍然有限,” Altman很谨慎,不过更强大的ChatGPT让人兴奋不已。以下是一些新功能的概述:
GPT-4可以理解图形
GPT-4现在是一个多模态系统,可以接受图像作为输入来执行生成字幕、对图像进行分类和分析图像上下文(包括幽默)等任务。
它在一个图片中发现了幽默:一部iPhone用VGA电缆而不是Lightning电缆连接充电。当被问及为什么这张图片很有趣时,GPT-4正确地识别了图片中的物体,并回答说:“这张图片中的幽默来自于将一个过时的大VGA连接器插入一个现代化智能手机的小充电端口。”(可能许多不熟悉技术的人都不能理解其中的荒谬:-)
这个来自GPT-4研究论文的例子表明,该模型可以理解图像的内容和上下文。
有一点需要注意:GPT-4的图像模式仍处于研究模式,尚未向公众开放,即使是订阅ChatGPT 的人也无法使用。为了准备更广泛的图像输入功能,它已经与Be My Eyes合作,这是一款移动应用程序,将盲人和低视力者与600多万视力志愿者联系起来,志愿者可以通过实时视频通话帮助盲人实现无障碍通行。GPT-4正在为应用程序上的“虚拟志愿者”模式提供动力,OpenAI声称该模式通常可以产生与人类志愿者相同水平的视觉细节和帮助。
新系统具有更长的工作记忆和更广泛的通用知识
GPT-4现在可以处理25000个单词的文本,允许长格式内容创建和长文档搜索、分析等用例。它的工作记忆也更长,约为64000个单词,即约50页。因此它可以记住并回顾早些时候对话中的事情。旧版本的ChatGPT只能记住8000字或四到五页的内容。
OpenAI表示,GPT-4在多个领域具有更广泛的通用知识,可以以比GPT-3.5更高的分数通过律师考试。另外GPT-4在创意和技术写作任务方面更具协作性,并指出它比GPT-3.5可靠、有创意,能够处理更细微的指令。
GPT-4可以像苏格拉底一样指导你
用户现在可以通过系统提示消息来指示人工智能的风格。API用户可以自定义个性体验,使其像海盗或导师一样说话,而不是经典的ChatGPT的固定个性。就像这样的提示指令:“你是一个总是以苏格拉底式回答的导师。你永远不会给学生答案,但总是试着问正确的问题,帮助他们学会自己思考。你应该总是根据学生的兴趣和知识调整你的问题,把问题分解成更简单的部分,直到问题达到适合他们的水平。”
OpenAI声称GPT-4更安全、更准确
OpenAI表示,它花了六个多月的时间,通过部署ChatGPT及其他LLM的经验教训和进步,加强了GPT-4的安全性和一致性。为此,该公司声称,GPT-4现在提供事实回应的可能性增加了40%,对被禁止内容的请求做出回应的可能性减少了82%。
在OpenAI的内部对抗性事实评估中,GPT-4的得分比GPT-3.5高40%。
该公司列举了几个新的和改进的训练方法的例子。Open AI表示,其训练的GPT-4使用了更多的人类反馈,包括从ChatGPT用户那里收集的反馈,这有助于建立一个更强大的监控框架。该公司还聘请了50多名具有偏见、安全、地缘政治和行业知识的专家进行早期反馈和对抗性测试,降低网络安全和生物风险等高风险领域的模型行为。
该系统仍然存在问题
GPT-4中仍然存在的局限性,包括混乱、社会偏见和不准确性。该公司还警告说,用该模型编写的计算机代码可能不可信,因为目前还没有官方方法来验证它是不是恶意代码。
一些有趣的新用例
除了前面提到的Be My Eyes的用例外,OpenAI还与其他组织合作。现在可以通过GPT-4支持的对话助理,西班牙语用户与法语用户可以直接聊天,很快就会有更多的语言支持。还可以访问一项名为“解释我的答案”的功能,该功能可以打破语言规则来纠正错误。在线辅导网站Khan Academy也在使用GPT-4为其Khanmigo虚拟辅导助理提供支持。
如何申请
ChatGPT 用户可以访问GPT-4,使用上限将根据需求和系统性能进行调整,随着未来几个月GPT-4的扩展和优化,预计将受到严重的容量限制。该公司还表示,可能会为超级用户开设新的订阅通道,并为非用户推出数量有限的GPT-4查询体验。开发人员可以加入API的等待名单(点击阅读原文)。
相关文章
猜你喜欢