乔姆斯基对语言学、计算机科学、认知科学和哲学有深刻贡献,同时他也是在世的最有影响力的知识分子之一。有人说他位列有史以来引用数最高的十位思想者,这话即使不完全准确,应该也很接近。用Google Ngram查一下:他的名声和维特根斯坦差不多,高于波普尔、托尔斯泰、图灵和哥德尔,但逊于罗素,更不要说爱因斯坦、牛顿和希腊三贤。
塔南鲍姆
内部语言关乎“真”,尺度是内在一致性;而外部语言关乎“意义”,尺度是外在对应性。意义得自交流,维特根斯坦所谓“意义即使用”,或者约翰·奥斯汀所谓“以言行事”(do things with words),“言语行为”都是指外部语言。外部语言对应于工程师们感兴趣的 embodied intelligence(中文别扭地翻译为“具身智能”)或“多模态”(视觉、听觉、触觉等)。意义是功能层在与外界交互时进行强化学习的过程。乔老爷认为外部语言是交流而不是思维。小塔并没有提出什么新东西。即使马斯克这样聪明的工程师也认为自动驾驶之类的具身智能是狭隘的(narrow form),要远比人们想象的简单,这很明显要比喜欢讨好大众的小塔更加有洞见。
承认思维即语言,对工程实践也会有影响。设计多模态大模型时,承认派会把语言模型作为基座,其他模态坐在基座之上,不同模态之间的沟通也通过基座进行。但否认派可能企图直接在任意模态之间建立映射,这明显不经济。
设想在火星上做自动驾驶,如果所有的停车标志(STOP)都是绿色的,难道我们需要拿所有的数据重新训练一遍火星自动驾驶大模型吗?如果驾驶员是人,一条简单的指令:“注意!停车标志是绿色的”,就足以让人适应新的驾驶场景。难道在大语言模型上不可以用一条简单的提示或者“咒语”(prompt):“把所有停车标志的颜色替换成绿色”吗?事实上,1970年代普渡大学的傅京孙就曾经用语言学的手段研究视觉,当时不被广泛认可。可惜他英年早逝。如果在“思维即语言”的立场重新审视视觉,傅京孙可算得高瞻远瞩。
大语言模型的可解释性
2000年,麻省理工学院的人文社科学院成立五十年的庆祝大会上,乔姆斯基、普特南和平克三人参加一个论坛,题为“关于人性,我们知道什么?”(What Do We Know About Human Nature?)这场论坛被组织者称为“三大男高音”齐聚。从休谟起,人性的核心是思维。平克把认知革命归功于乔姆斯基。乔老爷和普特南曾经在宾夕法尼亚大学同学,立场偶有不同,但彼此尊重。 2011年5月,麻省理工学院为配合一百五十周年校庆,召开名为“大脑、心、机器”的研讨会(Brain, Mind and Machine Symposium),本校的几位大佬乔姆斯基、明斯基、温斯顿等悉数出席,并由平克主持。乔姆斯基批评当时重新开始流行的神经网络是黑盒子:没有提供解释和知识。麻省理工学院主办的《技术评论》杂志为这个研讨会发了专文,标题故意挑事儿:“不会思维的机器”(Unthinking Machines)。时任谷歌研发总监的诺维格(Peter Norvig)很快回应乔姆斯基,他批评语言学的规则在自然语言处理上,根本就没用。现在看,诺维格的工程实践还真给了他一些先知先觉。有人用“两种文化”来总结乔姆斯基和诺维格的隔空掐架。
乔姆斯基
语言问题曾被理所应当地认为是逻辑的,现在却被用神经网络得到满意地解决,这本身就是令人惊奇的。工程师们甚至认为语言的中间任务(词分析、句法分析、语义分析)已经不需要认真对待了,因为ChatGPT代表的大模型对语言学问题给出了端到端的解决办法。语言学家就是研究各种中间步骤的,中间步骤就是解释。其实在1990年代统计方法被引入之后,自然语言处理(NLP)就越来越不需要语言学了,曾有玩笑:NLP团队每开除一个语言学家,系统的性能就提升一个台阶。估计令乔姆斯基沮丧的是:大语言模型把自己的工作彻底搞丢了。诺维格的合作者、伯克利教授斯图亚特·罗素(Stuart Russell)的态度则一直温和得多。他怀疑ChatGPT的良好表现是不是碰巧碰上的。他说:“如今的自然语言处理不再研究语言,我认为这是非常不幸的。”这和乔姆斯基的态度差不多,斯图亚特·罗素仍然把希望寄托于知识和推理。他们都认为ChatGPT是工程而不是关乎语言的科学。人类专属的技能不多了,难道我们要等到机器证明了黎曼猜想才能被彻底折服吗?
乔姆斯基与笛卡尔的不同之处在于,乔姆斯基并不是试图在心身之间划一条明确界限的二元论者。这么说,和晚年蒯因的“整体主义”也没啥太大区别,都接近皮尔士的实用主义。相同的是,他们都认为语言是人的独有能力,但乔姆斯基用语言作为人和动物的划界,而笛卡尔用语言作为人和机器的划界。笛卡尔认为人类语言是任何自动机也不能实现的,他大概不会认可丘奇-图灵论题。
乔姆斯基曾说他自己的方法是“伽利略式”的,也就是从小数据里找寻基本定律,而不是用大数据构建黑盒子。但如果人人都有低成本的黑盒子,谁还要麻烦基本定律呢?虽然乔姆斯基在技术上对ChatGPT可能有所误判,但他“思维即语言”的立场却是大语言模型引发的这场革命的哲学基础之一。
相关文章
猜你喜欢