GPT-4在某些任务上的性能表现会变差
凤凰网科技讯 《AI前哨》北京时间7月21日消息,最近有用户抱怨称,ChatGPT背后的大语言模型GPT-4和之前的迭代相比正变得“更笨”、“更懒”。ChatGPT开发商OpenAI周四承认,新版GPT-4在某些任务上的性能表现可能会变差。
最近几周,GPT-4用户对于该模型性能的下降感到困惑。一些人跑到推特和OpenAI在线开发者论坛上表达不满,他们抱怨的问题包括GPT-4的逻辑变弱,回答的错误越来越多,无法跟踪提供的信息,难以遵循指令,忘记在基本软件代码中添加括号,以及只记得最近的提示。
“现在的GPT-4令人失望。这种感觉就像你开了一个月的法拉利,突然它变成了一辆破旧的皮卡。我不确定我是否还愿意为它付费。”一位使用GPT-4协助为其网站进行功能编程的网友写道。
OpenAI显然意识到了这一点。周四,该公司在宣布新的功能更新时回应了这个问题,承认GPT-4在某些任务上的性能可能会变差,“当我们发布新模型版本时,我们的首要任务是让新模型整体上变得更聪明。我们的目标是在很多方面进行改进,比如指令遵循、事实准确性和拒绝行为。例如,上个月推出的GPT-4-0613模型在调用函数方面有了显著改进”。
不过,OpenAI话锋一转,开始谈及GPT-4的不足。“我们会查看大量评估指标来确定是否应该发布一个新模型。虽然大多数指标都得到了改进,但在一些任务的性能可能会变差。这就是为什么我们允许API用户锁定某一模型版本的原因。例如,你可以使用GPT-4-0314版本,而不是通用的GPT-4,因为后者会指向最新模型版本。每个单独锁定的模型都是稳定的,这意味着我们不会做出影响输出的更改。”OpenAI表示。凤凰网科技《AI前哨》对此将持续关注。(作者/箫雨)
相关文章
猜你喜欢