编辑:编辑部
【新智元导读】ChatGPT眼里的世界,和人类感知的世界是一样的吗?
ChatGPT的语言能力确实很惊艳,但大语言模型在没有人类身体、且缺乏实践经验的情况下,是否能像人类一样感知到真实世界呢?
论文链接:https://www.biorxiv.org/content/10.1101/2023.03.20.533336v3
总而言之,这项研究促进了对身体尺寸在塑造物体表征方面的作用的理解,强调了具身认知在理解智能如何涌现上的作用与方向。
读万卷书,不如行万里路
我们的身体不仅仅是我们思维的容器,它同样也是思维本身——借助身体,我们得以与世界中的物体进行互动,从而去感知整个世界。
身体图式在正常社交中也有着重要的作用,这就是人机交互、用户体验的核心。比如唐纳德·A·诺曼在《The Design of Everyday Things(译为:设计心理学)》中所述的可供性(affordance)的用途。
通过考虑用户的身体图式和行为期望,设计师可以创造出更符合用户认知和互动习惯的产品和环境。
这种关注身体图式和可供性的设计方法能够提高产品的易用性,使用户能够自然而然地与之互动,并实现更好的用户体验。
而这也是苹果公司的立身之本之一。
传统的认知科学观点认为,身体图式是建立在我们所具有的对自己的身体长期的知觉体验之上的,只能来源于外部的「真实交互」,即「行万里路」。也就是说,ChatGPT不会有身体的图式。
但是,当我们去问只「读万卷书」语言模型,ChatGPT(GPT-4),它是否有身体时,它回答说:「It could be the size of an average adult human, around 5 feet 6 inches (167.6 cm) tall. This would allow me to interact with the world and people in a familiar way.」
比如,在尺寸范围内的物体可以提供抓、扔等动作,而尺寸范围外的物体可以提供坐、躺等动作。
此外,他们还发现,这个边界是被身体图式影响的:对身体图式的修改会影响对物体的可供性的感知。
研究人员对ChatGPT(GPT-4)进行了测试,看它是否用这个身高为167厘米的身体作为可供性边界。
具体而言,研究人员让其回答关于物体可供性的问题:「下列哪些物体可以拿(或其他动作)」,然后随即列举一系列物体,如苹果、盘子、床等等。ChatGPT就会返回一些物体的名称作为回答。
这些能力从何而来?
通过比较不同规模的语言模型,研究人员发现模型大小是一个关键因素。
较小的模型如BERT和GPT-2没有展现出可供性边界的存在;然而GPT-3.5和GPT-4都显示出了可供性边界,而ChatGPT-4的边界与人类更类似,这和坊间传闻的GPT-4相对GPT-3有更多的参数一致。
所以,模型的规模越大、越复杂,就会自动涌现出许多看似不可能或者无关的功能。
差距是质上的还是量上的?
在另外一个方面, ChatGPT在应用身体图式方面的能力还不完全像人类,仍存在着差距——它的可供性边界还不像人类这样明显。
如果这个差距是定量的,如同儿童与成年人语言能力之间的差距,那么我们有理由相信,随着时间的推移,这个差距是可以逐渐填补上的:或者通过不断的学习,或者通过模型规模的不断增大,亦或者通过参数的调整。
ChatGPT与人类的差距总会减小,而其中的问题也会逐步得到解决。
然而,如果这个差距是定性的,如同黑猩猩与人类语言能力之间的差距,那么无论进行何种训练,经过多久的时间,这个能力的鸿沟永远不会被填平。
而另一方面,汽车能够赋予ChatGPT身体,使它能够真正与世界进行交互。当ChatGPT不再只是「读万卷书」,而是「行万里路」时,它可能会展现出全新的智能和潜力。
这可能是人工智能下一次突破的方向;此时,火花也许就成为燎原大火。
参考资料:
相关文章
猜你喜欢