GPT-4“王炸”发布：专业和学术水平接近人类，做个网站只用了1秒-华威派

> 自媒体 > AI人工智能 > GPT-4“王炸”发布：专业和学术水平接近人类，做个网站只用了1秒

GPT-4“王炸”发布：专业和学术水平接近人类，做个网站只用了1秒

来源：澎湃新闻

2023-04-29

146

管理

GPT-4可对论文进行解读来源：OpenAI官网

与此前的模型相比，GPT-4的准确性有所提高。OpenAI称，该公司花费6个月的时间，利用对抗性测试程序和ChatGPT的经验教训迭代调整GPT-4，从而在真实性、可操纵性和拒绝超出设定范围方面取得了有史以来最好的结果，“至少对我们而言，GPT-4训练运行前所未有地稳定，成为首个能够提前准确预测其训练性能的大型模型。”

OpenAI称，在公司内部的对抗性真实性评估中，GPT-4的得分比最新的GPT-3.5高40%，相应的“不允许内容请求的倾向”降低了 82%，根据政策响应敏感请求（如医疗建议和自我伤害）的频率提高了29%。

不仅是英语，该模型在多种语言方面均表现出优越性。OpenAI称，在测试的26种语言中，GPT-4在24种语言方面的表现均优于GPT-3.5等其他大语言模型的英语语言性能。其中GPT-4的中文能够达到80.1%的准确性，而GPT-3.5的英文准确性仅为70.1%，GPT-4英文准确性提高到了85.5%。

来源：OpenAI官网

不过，与早期的GPT模型一样，GPT-4仍然存在一定的局限性。

OpenAI称，它并不完全可靠，可能会出现推理错误，“GPT-4缺乏对绝大多数数据切断后（2021年9月）发生的事件的了解，并且无法从中吸取经验教训……它有时会出现简单的推理错误，它会轻信用户明显的虚假陈述，有时它会像人类一样在难题上失败，例如在它生成的代码中引入安全漏洞。”

基于此，OpenAI提醒，用户在使用语言模型时应格外小心，最好辅助以人工审查、附加上下文、或完全避免在高风险情况下使用它。

值得注意的是，GPT-4虽然于14日才正式公开，但早在一个月前，微软的新版搜索引擎必应（Bing）就已经在GPT-4 上运行。微软表示，“如果您在过去五周内的任何时间使用过新版必应，那么您已经体验过GPT-4的早期版本。”

与免费的ChatGPT不同，GPT-4目前仅向ChatGPT Plus的付费用户开放，它也将作为API（应用程序编程接口）提供给企业及开发者，开发者需进入等候名单上，将该模型集成到他们的应用程序中。

OpenAI表示，已经有多家公司将GPT-4搭载到他们的产品中，包括语言学习工具软件多邻国（Duolingo）、移动支付公司Stripe和可汗学院（Khan Academy）。

赏钱

免责声明：本文仅代表作者个人观点，与华威派无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非华威派）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@goodmaoning.com

能赋诗写剧看漫画，但GPT-4“不认识”GPT-4

2023-04-29 16:05

数据+人才+硬件三大优势，腾讯正在研发类ChatGPT聊天机器人

2023-04-29 14:43