编辑:Aeneas 拉燕
【新智元导读】近日,一名外国小哥测出,GPT-4语言能力智商已达152,吊打绝大多数人类。好在,它的空间推理还不行。GPT-4在语言能力上的智商,已经吊打人类!
最近,国外的一位小哥测试了GPT-4的智商,结果显示,它的语言智商已经达到了152。
而根据调查,人类的平均智商是90-109,单论语言智商的话,人类是妥妥地被GPT-4吊打了……
首先,这位小哥上网搜索了一下免费的智商测试。
但他发现一个棘手的问题:这些智商测试,很多都是以图像的形式。
怎么办呢?这位小哥随后意识到,肯定有专门为视力缺陷的人设计的智商测试。
他动手试了试,果然搜到了。然而,这种测试非常昂贵,需要花1500多刀,没法白嫖。
另外,它也无法证明孪生素数猜想。(要是能证明就有鬼了)
所以,GPT-4的极限到底在哪里呢?
这位小哥只能去查阅公开的文献。在OpenAI的官方论文中,GPT-4在SAT的数学考试中得分高于91%的人类,在其其他数学类考试中表现也很优异。
不善沟通的语言天才
接下来,小哥想测试一下GPT-4在人际关系智能(Interpersonal Intelligence),以及内省智能(IntRAPersonal Intelligence)方面表现如何。
严谨的小哥先上网查了一下,何为人际关系智能——善于处理人际关系的人,他们能更好地理解他人,并和别人进行互动。这类人擅长评估情绪、动机、欲望,以及周围人的意图。
然后,他找了一篇SAT考试中的文章,将文章内容复制下来,把所有的和人物动机有关的问题也一股脑甩给了GPT-4。
空间推理 小试牛刀
而转到空间能力这一块,GPT-4的表现就不容乐观了。
本来,小哥想让GPT-4直接做一套空间推理的选择题。
ChatGPT:魔方?我不会啊
为了进一步测试GPT-4的空间理解能力,小哥祭出了大杀器——魔方。
要知道,对人类来说,魔方也是衡量一个人空间感的方法之一。
首先,因为GPT-4不能看图,所以要先想办法用文字描述魔方的状态。
熟悉魔方的朋友对下面这个图应该不会陌生。在公式中,我们常常会用若干字母,或字母加一个撇号来代表不同的操作。
一般魔方正对我们,不同的旋转对应不同的表达。就像下面这样。
紧接着是UR,意思就是最上层左拧一次,最右边上拧一次。
GPT-4也很快给出了反向操作——R’U’。
接着就要上难度了!小哥开始彻底打乱魔方,总共十多步。
令人惊讶的是,GPT-4居然真的生成出结果了!
然而小哥定睛一看,GPT-4生成的复原方法,就是把所有打乱的步骤反过来来一遍。
看完直呼无语,这要你何用。
这次经过尝试,只有第一次的小试牛刀成功了,也就是只打乱一次的结果。
GPT-4处理起简单问题真是毫不手软,可惜一复杂就趴窝了。
小哥表示,这现实的魔方根本拧不成这样啊,GPT-4你在干什么??
这个结果直接给GPT-4玩儿魔方的能力宣判了死刑。
除了倒推复原,GPT-4根本玩不转魔方。
两任总统的rap对决,泰裤辣
最后,这位小哥还测了一波GPT-4的音乐能力。
所以,小哥让GPT-4用ABC notation写一个Boom bap beat,然后把这个beat输入到一个音乐网站里。
GPT-4写出的beat是这样的——
听起来没啥惊喜。
,时长00:10
小哥希望挽救一下这个beat,于是换了一种乐器。把它下载成midi file,再上传到FL Studio。但不好的是,所有乐器都结合在一个音轨中了。
所以小哥让GPT-4给每个音轨一个单独的乐器文件。
成品一放,还挺惊艳:「yo!我是拜登,我来打破纪录,直截了当……」
接着,小哥下载了一个现成的beat,做成了拜登和川普的说唱battle——各位,请准备好尖叫吧。
总的来说,GPT-4已经在多方面吊打人类,如果在未来哪一天,它能克服视力和听力上的缺陷,人类的未来,可就真不好说了。
参考资料:
相关文章
猜你喜欢