用户:这张图有什么好笑的?一个面板一个面板地描述它。
GPT-4:该图显示了带有三个面板的“Lightning Cable”适配器的包装。
面板 1:带有 VGA 连接器(一种大的蓝色 15 针连接器,通常用于计算机显示器)的智能手机已插入其充电端口。
面板 2:“Lightning Cable”适配器的包装,上面有 VGA 连接器的图片。
面板 3:VGA 连接器特写,末端有一个小型闪电连接器(用于为 iPhone 和其他 Apple 设备充电)。
这张图片中的幽默来自将过时的大型 VGA 连接器插入小型现代智能手机充电端口的荒谬做法。
GPT-4还能看得懂图表,还能帮你分析!
GPT-4 的高级推理能力超越了 ChatGPT。
在下面这个例子中如果要进行这种多角度的复杂推理,ChatGPT最后给出了一个错误的答案。
我们花费了6个月的时间来使GPT-4更加安全和一致。在我们的内部评估中,相比于GPT-3.5,GPT-4回应不允许的内容的可能性降低了82%,更有可能产生事实性回应,提高了40%。这里是想告诉大家,安全级别提高了,想通过调教它,让它 “越狱” 说一些不该说的话越来越难了。
通过人类反馈进行训练
我们加入了更多的人类反馈,包括ChatGPT用户提交的反馈,以改善GPT-4的行为。我们还与50多名专家合作,提前获得AI安全和安全领域的反馈意见。
来自实际使用的持续改进
我们将从之前模型的实际使用中得出的经验教训应用于GPT-4的安全研究和监控系统中。与ChatGPT一样,随着更多人使用,我们将定期更新和改进GPT-4。
GPT-4辅助的安全研究
GPT-4的高级推理和指令遵循能力加快了我们的安全工作。我们使用GPT-4帮助创建模型微调的训练数据,并在训练、评估和监控中迭代分类器。
虽然越狱越来越难了,但是OpenAI对于大家调教和自定义GPT的性格也做了很好的迭代。下面这张图是官方展示的GPT-4的页面,可以看到这里有一个新的 system 的输入框,就是输入AI的身份属性的。
这个模型的输出可能存在各种偏差 OpenAI 在这方面已经取得了进展,但还有更多工作要做。OpenAI 的目标是使人工智能系统具有合理的默认行为,反映广泛用户的价值观,允许在广泛范围内对这些系统进行定制,并征求公众对这些范围的意见。
GPT-4 还是缺乏对其数据截止日期(2021年9月)之后发生的事件的了解,并且不会从其经验中学习。它有时会出现简单的推理错误,这些错误似乎不符合跨越如此多个领域的能力,或者在接受用户明显错误的陈述时过于轻信。有时,它可能像人类一样在解决难题时失败,例如在其生成的代码中引入安全漏洞。
GPT-4在其预测中也可能会自信地出现错误,并且不会在可能犯错时仔细检查工作。有趣的是,基础预训练模型高度校准(其对答案的预测置信度通常与正确的概率相匹配)。然而,通过我们当前的后期训练过程,校准会降低。
基于 GPT-4 的产品
官方给了6个加入了 GPT-4的产品,借此我们可以看到它的广阔应用空间。
Duolingo
一款语言学习类APP,Duolingo 把 GPT-4接入产品,进行角色扮演,让人工智能跟用户去对话,纠正语法错误,并且把这一功能融入产品的游戏化。
Be My Eyes
这是一款为视力障碍人士提供的产品,其实一直以来大部分的盲人类产品都只能识别文字。现在他们可以借助 GPT-4的图像识别分析来看这个世界。
摩根士丹利
作为财富管理领域的领导者,摩根士丹利维护着一个内容库,其中包含数十万页的知识,涵盖投资策略、市场研究和评论以及分析师见解。大量的信息分布在许多内部网站上,主要是 PDF 格式,需要顾问浏览大量信息以找到特定问题的答案。这样的搜索可能既费时又麻烦。
借助 OpenAI 的 GPT-4,摩根士丹利正在改变其财富管理人员查找相关信息的方式。
可汗学院
用来探索 GPT-4在教育中的应用,对特定学生差异化教育,抹平教育资源带来的差距。
可汗学院是一家非营利组织,其使命是为任何地方的任何人提供免费的世界一流教育。该组织为所有年龄段的学生提供数以千计的数学、科学和人文课程。
但是每个学生都是独一无二的,他们对概念和技能的掌握也各不相同——相差很多。有些人可能会轻而易举地学会,而另一些人则需要手把手的帮助。当疫情扰乱了无数的教育系统时,这种差距只会加深。
“考虑到每个人的不同需求,让他们不断进步是一项挑战,”可汗学院的首席学习官 Kristen DiCerbo 说。“他们都处于不同的层次,他们都有不同的差距,他们都需要不同的东西来前进,这是我们长期以来一直试图解决的问题。”
今天,可汗学院宣布将使用 GPT-4 为 Khanmigo 提供支持,Khanmigo 是一种人工智能助手,既可以作为学生的虚拟导师,也可以作为教师的课堂助手。
最后,越来越不OPEN的OpenAI
OpenAI在介绍 GPT-4 的 98 页论文自豪地宣称他们 “没有” 披露他们训练集的内容。虽然这并不意外,但是这让大家开始对他们宣称的对安全性的顾虑开始怀疑,这种非常不开放的大模型真的会一直站在巅峰么?永远都没有挑战者么?
目前在语言大模型领域,OpenAI的 GPT-4 无疑是最强的,但是未来呢?会不会出现一个类似在AI绘画领域的 stable diffusion 来打破这个垄断的局面?
让我们在接下来的一年里拭目以待。
温馨提示:虽然我们每天都有推送,但最近有读者表示因平台推送规则调整,有时候看不到我们的文章~
*文章观点仅供参考,不代表本机构立场。
相关文章
猜你喜欢