GPT-4终于出现!!!!科技格局将彻底改变,有多少职业将被替代?
OpenAI发布了一个强大的新图像和文本理解 AI 模型 GPT-4,该公司称其为“扩大深度学习努力的最新里程碑”。
GPT-4 今天可通过ChatGPT Plus (有使用上限)提供给 OpenAI 的付费用户,开发人员可以在等候名单上注册以访问该 API。
定价为每 1,000 个“提示”标记(约 750 个单词)0.03 美元和每 1,000 个“完成”标记(同样,约 750 个单词)0.06 美元。令牌代表原始文本;例如,“fantastic”这个词将被拆分为“fan”、“tas”和“tic”等标记。Prompt tokens 是输入 GPT-4 的单词部分,而 completion tokens 是由 GPT-4生成的内容。
事实证明,GPT-4 一直隐藏在众目睽睽之下。微软今天证实,其与 OpenAI 共同开发的聊天机器人技术Bing Chat正在 GPT-4 上运行。
其他早期采用者包括 Stripe,它使用GPT-4 扫描商业网站并向客户支持人员提供摘要。Duolingo将 GPT-4构建到新的语言学习订阅层中。摩根士丹利正在创建一个由 GPT-4 驱动的系统,该系统将从公司文件中检索信息并将其提供给金融分析师。
GPT-4 可以生成文本并接受图像和文本输入——这是对其前身GPT-3.5的改进,GPT-3.5 仅接受文本——并且在各种专业和学术基准测试中的表现达到“人类水平”。例如,GPT-4 通过模拟律师考试,分数在应试者的前 10% 左右;相比之下,GPT-3.5 的得分在倒数 10% 左右。
据该公司称,OpenAI 花了六个月的时间使用内部对抗性测试程序和 ChatGPT 的经验教训“迭代调整”GPT-4,从而在真实性、可控性和拒绝超出护栏方面取得了“有史以来最好的结果”。与之前的 GPT 模型一样,GPT-4 是使用公开数据(包括来自公共网页)以及 OpenAI 许可的数据进行训练的。
OpenAI 与微软合作,在 Azure 云中从头开始开发了一台“超级计算机”,用于训练 GPT-4。
“在随意的谈话中,GPT-3.5 和 GPT-4 之间的区别可能很微妙,”OpenAI 在宣布 GPT-4 的博客文章中写道。“当任务的复杂性达到足够的阈值时,差异就会出现——GPT-4 比 GPT-3.5 更可靠、更有创意,并且能够处理更细微的指令。”
毫无疑问,GPT-4 更有趣的方面之一是它能够理解图像和文本。GPT-4 可以对相对复杂的图像进行说明甚至解释,例如从插入电源的 iPhone 的图片中识别闪电电缆适配器。
图像理解能力目前还没有提供给所有 OpenAI 客户——OpenAI 正在与一个合作伙伴 Be My Eyes 一起测试它。在 GPT-4 的支持下,Be My Eyes 的新虚拟志愿者功能可以回答有关发送给它的图像的问题。
通往 GPT-4 的道路很长,OpenAI——以及一般的 AI 语言模型——在最近几个月迅速成为主流之前,在几年内缓慢地建立了势头。
描述 GPT 的原始研究论文发表于 2018 年,GPT-2 于 2019 年公布,GPT-3 于 2020 年公布。这些模型是在巨大的文本数据集上训练的,其中大部分是从互联网上抓取的,用于挖掘统计模式。然后使用这些模式来预测哪个词跟在另一个词之后。这是一个描述起来相对简单的机制,但最终结果是灵活的系统,可以生成、总结和改写写作,以及执行其他基于文本的任务,如翻译或生成代码。
“例如,如果用户发送他们冰箱内部的图片,虚拟志愿者不仅能够正确识别里面的东西,还能推断和分析可以用这些成分准备什么。该工具还可以为这些成分提供一些食谱,并发送有关如何制作它们的分步指南。”
GPT-4 的一个更有意义的改进可能是上述的可操纵性工具。借助 GPT-4,OpenAI 引入了一种新的 API 功能,即“系统”消息,它允许开发人员通过描述特定方向来规定风格和任务。系统消息也将在未来出现在 ChatGPT 中,本质上是为 AI 的下一次交互设定基调和边界的指令。
例如,一条系统消息可能是这样的:“你是一位总是以苏格拉底式方式回应的导师。你永远不会给学生答案,但总是试着问正确的问题来帮助他们学会独立思考。你应该始终根据学生的兴趣和知识调整你的问题,将问题分解成更简单的部分,直到它处于适合他们的水平。”
不过,即使有系统消息和其他升级,OpenAI 也承认 GPT-4 远非完美。它仍然“幻觉”事实并犯推理错误,有时还非常自信。在 OpenAI 引用的一个例子中,GPT-4 将猫王描述为“演员之子”——这是一个明显的失误。
OpenAI 写道:“GPT-4 通常缺乏对绝大多数数据切断后(2021 年 9 月)发生的事件的了解,并且没有从中吸取经验教训。” “它有时会出现简单的推理错误,这些错误似乎与跨多个领域的能力不相称,或者在接受用户明显的虚假陈述时过于轻信。有时它会像人类一样在难题上失败,例如在它生成的代码中引入安全漏洞。”
不过,OpenAI 确实指出,它在特定领域做出了改进;一方面,GPT-4 不太可能拒绝关于如何合成危险化学品的请求。该公司表示,与 GPT-3.5 相比,GPT-4 总体上响应“不允许”内容请求的可能性降低了 82%,并且根据 OpenAI 的政策响应敏感请求——例如医疗建议和任何与自我伤害有关的请求 29 % 更频繁。
相关文章
猜你喜欢