从初出茅庐到变成炙手可热的现象级聊天AI,ChatGPT只用了短短几个月的时间。
就在我们刚熟悉将它和它的段子们作为日常工具和娱乐手段的节点,背后的OpenAI公司又整了个大活:GPT-4正式发布了。
而且从目前的体验和官方演示来看,以往基于GPT-3.5的ChatGPT在这个“船新版本”面前,可能要被秒成渣渣。
还记得今年年初,编辑部的“天语”老师有聊到弱智吧老哥大战ChatGPT的故事。
在弱智吧老哥用以往经典的“弱智桥段”拷问下,这款号称无所不能的聊天软件节节败退,不仅频繁出现答非所问的情况,甚至有时会“急了”似的想要立即结束当前的话题。
以往的回答
按照当初OpenAI给出的说法,这主要是因为当初的模型存在一定的缺陷,面对这种“比喻、反问”语气的句子,就容易发生无法理解的情况,甚至当大伙儿输入生硬文章的时候,它还会给出牛头不对马嘴的回应。
但到了最新版本的GPT-4,这个问题很大程度上已经被解决。
GPT4的回答
在官方的演示中,输入了《灰姑娘》的故事之后,要求它用一个简短的句子概括这个故事,并且句子的单词还需要按照字母表顺序来。
面对这个会让GPT3.5大脑宕机然后喊一声“妈妈生的”的难题,GPT4已经能给出了答案。
在之前的ChatGPT潮中,不少人经过测试后,都一致断言这AI的只上最多也就是个小学生,只不过调用信息比正常的孩子快上许多而已。
就这也敢号称“无所不能”?
但这个问题,在GPT4发布之后,同样很大程度上被解决了。
往常大伙儿输入一个相对简单的数学题,ChatGPT也会给出一大串的复杂解释,甚至答案还是完全错误的。
比如上面这个“黑球比白球多40%,二者比例是多少”的问题,GPT3.5给出的答案却是12:5(正确答案7:5)。
而这些数学题对于GPT4已经完全不在话下,从这份成绩表的对比也能明显看到,相较于其他科目,两代模型微积分成绩的提升堪称是从无到有。
不仅如此,经过这一轮进化之后,GPT4已经不单单是语言层面的交互了,它已经可以承担起图片识别和解析这部分功能。
在输入了一张鸡蛋、面粉的图片后,询问它能够用图片的内容去做什么,GPT4给出的答案包括了华夫饼在内的诸多糕点。
除了这样正经的问答,它甚至可以理解大伙儿日常能看到的逗乐梗图。比如:这张图的笑点在哪儿?
对于中文用户来讲,除了图片识别及解析的功能让人有些兴奋外,经过优化后的GPT4中文数据库,也比之前变得更加准确了。
唯一美中不足的是,GPT4升级之后乐子实打实会少上许多。
除了前面的“弱智吧桥段”无法再次复刻之外,大伙儿似乎也没机会用“原味粥”来嘲笑ChatGPT了——它终于能分清《原神》和《明日方舟》了!
“原味粥”
GPT4的回答
哦对,差点忘了大伙之前最热衷的角色扮演,这一点GPT4同样变得更为强大。
比如,扮演个咖啡店女仆?
这倒不是GPT4出现退化。
OpenAI官方对于这个问题也做出了明确的解释,表示在去年8月就已经完成了对这个模型的炼成,而后续几个月的时间里,主要是对有关道德和违法信息上的门槛进行设定。
相较于GPT3.5,如今的GPT4在这一方面的阈值有了83%左右的提升。道德层面的加强,配合上本身逻辑思维的提升,大伙儿想要继续从它这里套点儿学习资料什么的,就显得相当困难了。
如果还想“图一乐”地用这款聊天软件整点学习资料出来,最好还是换回GPT3.5的版本。
当然,GPT4这个新版本因为尚处于测试阶段,不少人都表示使用时偶尔会碰到“访问过多”等情况。
和以往有关AI的话题兴起时一样,更加强力的GPT4出现后,不少已经步入社会的老哥开始担心:自己过两年会不会失业?
即便是还在学校的朋友,似乎也会产生这方面的焦虑:我不会还没毕业就被提前预告失业了吧?
可时代在发展,大伙儿也在进步不是?
更何况,即便来到了更为强力的GPT4版本,它以往凭空生成参考文献的老毛病依然存在(所以最好别用来搞论文)。甚至在询问它知不知道自己是谁的时候,它给出的答案是“GPT-3”。
而除了大伙儿对于日后“饭碗不保”的担心之外,真正直接遭受冲击的,还是其余几家网络企业。
不提谷歌,百度在今天(16号)也公布了自家名为“文心一言”的AI产品。
在发布会上,百度掌门李彦宏着重强调了“文心一言”的语言能力以及数理推理等能力,期间更是展示了商务稿创作、续写三体等多种操作。
当然,即便是我这样的门外汉也知道,股价的变动一般都是多方面因素造成的。
没谁能肯定究竟是是“文心一言”或者其他哪只蝴蝶扇了扇翅膀,最终导致了这波让百度很是肉疼的“股价风暴”。
而且,因为现阶段“文心一言”的受众为企业用户,大伙儿短时间内很难亲自上手来找点儿乐子——其实也并非完全没有办法。
ChatGPT,你现在就是新的“文心一言”了
所以,大伙儿作为这次技术革命的见证者,在感到焦虑之余,不妨真正将它当成一个工具来了解和使用——因为很明显,即便是比“文心一言”更为强大的GPT-4,也很难称得上是“无所不能”。
就像它的开发者在演示直播上所说的那样:
它并不完美,你也不是,但二者可以相辅相成、来到更高的高度。
如果你觉得这波鸡汤有些太过“假大空”,那么咱可以更具体一点儿。
拿我自己举例,平日的工作流程就是找选题、跟老大确认选题,然后搜集信息写稿,审核通过后就能顺利发布了。
而在拥有资料整合和逻辑思维能力的GPT-4出现之后,以往“找选题-查资料-写稿子”的工作三部曲,似乎就只剩下前两个部分了。
也许,未来真有机会用AI给大伙写一篇稿子?
如果真的能靠AI出稿,并且蒙过负责审核的刹那老师以及屏幕前的大伙儿。
我想,这也算是一种“新的高度”吧?
相关文章
猜你喜欢