编辑:润 Lumnia
【新智元导读】最近众多网友反应GPT-4不好用了,后悔充值了。后来网友爆出OpenAI采用MOE重新设计了构架,导致性能收到影响,但是官方一直没有明确答复。最近一段时间,很多OpenAI的用户反应,GPT-4变傻了!
大家普遍认为GPT-4从5月份开始,生成内容的速度变快了,但是内容的质量下降很严重。
甚至有OpenAI论坛中的用户把自己生成的内容贴了出来,说对比2个月前相同的prompt生成的内容,现在GPT-4的能力最多能叫GPT-3.6。
不过看完这么多GPT-4重度用户的吐槽之后,小编突然开始感叹:
GPT-4确实是领先太多了。
领先程度已经到了,其他家的大模型都在加班加点的几天出一个更新版本,希望尽快赶上OpenAI。
他自己家倒好,悄悄「降本增效」「反向升级」,当起了大模型圈里的「反内卷标兵」。
可能导致性能衰退的原因
对于GPT-4表现降级,用户似乎都已经达成共识,已经开始讨论GPT-4「衰退」的原因了。
性能下降可能和消除有害内容有关
除了大佬从技术层面的解析外,网友也纷纷从各个角度进行揣测。
有些网友觉得可能是OpenAI相对保守的道德政策降低了模型回复的质量。
在OpenAI官方论坛中GPT相关的子版块,那些认为ChatGPT的性能遭到了「降级」的帖子中,许多人提到了ChatGPT在OpenAI采取新的内容限制之前对于Prompt的包容性有了很大的变化。
侧面支持了OpenAI可能出于安全性的考虑,控制了模型的输出能力和范围的观点。
在YCombinator的讨论中,有网友提出,从OpenAI开始宣布关注安全问题以后,模型的表现就越来越糟糕。
以GPT-4在最初发布报告中,让GPT-4使用TikZ(TikZ可能是在LaTex中创建图形元素的最复杂,最强大的工具)绘制独角兽这一任务为例,在后续发布的GPT-4中难以复现报告上的结果,而且表现也越来越差。
事实上,OpenAI设置了各种过滤器来防止恶意行为,例如暴力,种族主义或仇恨言论。
但是,这些过滤器通常会干扰正常的使用,例如小说写作、思想头脑风暴以及其他形式的创作。
虽然很难衡量这些变化的影响,但OpenAI的创始人Sam Altman承认了政策限制会干扰用户体验。
除此之外,在5月29日Humanloop联合创始人Raza与Sam Altman的对话中,Altman提到了OpenAI目前严重受到GPU数量的限制。
也许原因在这届网友身上?
在官方技术发言人Logan.GPT的回应中,表明了GPT-4在API模式中质量并没有下降。
而就在昨天,OpenAI产品副总裁Peter Welinder评论了这一传言。
「不,我们没有让GPT-4变笨,恰恰相反:我们让每个新版本都比前一个版本更聪明。」
对于网友提出的问题,他的理解是,「当你更多地使用它时,你会开始注意到以前没有注意到的问题。」
言下之意是,GPT-4本来就没之前那么强,现在的GPT-4才是它真正的实力。
有那么一丝凡尔赛的感觉。
果然网友不是很买账,在推文下不停回怼。
你说你没改过,然后又说每个版本都更好了,不是自相矛盾吗?
你说的这个假设不成立,同样的提示词7月的回答就是比6月的差!
不过,确实有网友对GPT-4的性能衰退也有不同的解释:
从感知退化的心理学角度来说,在GPT-4初次曝光带给人们的惊喜消失,并逐渐深入我们日常生活使用后,人们就会对它的能力习以为常。
新鲜劲儿一过,用户对其的容忍度也随之降低,转而更加关注技术和使用上的缺陷。
此外,在 Reddit 上发帖认为GPT-4性能衰退的网友,在最近的更新中表明,那天的提问可能是受到了心态的影响,因为在这之后的GPT-4工作一直都很顺利。
参考资料:
https://the-decoder.com/openai-comments-on-reports-of-gpt-4-performance-loss/
相关文章
猜你喜欢