作者:卢爱芳 公众号:科技资本论
ChatGPT席卷中国,最近连一位很久不联系的医生朋友也突然跟我聊起这个神奇的聊天机器人,可见其影响之大。不管有没有看懂ChatGPT,人们已经朦胧地意识到了AIGC是大势所趋,自己决不能置身局外。
2月13日,原美团联合创始人王慧文发贴公告天下,他出资五千万美元,诚邀各路英雄一起打造中国版OpenAI。OpenAI是ChatGPT的研发机构,旗下除了ChatGPT这样的文本生成工具,还有Dall-E这样的图像生成工具。
有人嘲笑王慧文自以为5000万美元是大手笔,殊不知GPT3训练一次就花掉近500万美元。也有人鄙视他不过是借机营销,尽显国内互联网的浮躁之气。
OpenAI和ChatGPT是否可复制?首先一起来看看ChatGPT在人工智能技术上究竟有什么重大突破。
中央美院信息中心主任孟虹回忆,人工智能实际上走了很长时间,在计算机还没产生之前,计算机的发明者图灵就说过,用10-20年的时间就能解决人工智能的问题。可惜图灵英年早逝,此后几十年时间,很多科学家投入研究人工智能,但各种实验完全失败,人工智能陷入了停滞。
直到谷歌的出现,人工智能才恢复发展,并解决了一些问题。谷歌的搜索引擎是一个数学的算法,就是用人工智能来判断网页排名,PageRank等效于搜索,实践证明是对的。
但接下来人工智能又陷入长期的停滞,直到了AlphaGO的出现。AlphaGO是一个博弈问题,是计算力和人脑力的PK。人的大脑反应速度是生物反应,是以秒为单位,肯定比不上机器的运算速度,AlphaGO和人类的PK,不是对等的pk,而且它并没有真正解决人工智能的问题。
那么人工智能的问题究竟是什么问题?我们认为人类跟机器不一样,我们有智能。我们在认识世界的时候,有两种形式,一种是对直观的感知,用图释;另一种是对概念的表述,用文字。
对于直观的表述,我们认为很简单,其实很难。你看到一个人,一个猫,或者一只老虎,你看着它描述它,另外一个人也看着它听你描述,这事儿很简单。但假设听的人没有看到,只听你描述,其实他是很难理解的。
心理学上有一个概念叫格式塔:人看到的东西不完整,但在心理上把它补全了。当人看过无数的东西,再看到这个东西时,就会在心理上把它补全。如果能把前后背景准确地分离出来,那么人所看到的东西、理解的东西和事实上的东西,就已经很接近了。
去年就火起来的AI绘画Stable Diffusion就解决了这个问题。Stable Diffusion实际上是把大量的描述跟图释做对应,让描述跟图释取得相对一致性,但这种一致性是概率层面的, 达到概率的最大值或者平均值下的一种状态。而且所有的认知在语言学范畴上,在有既定文化背景和前后语义的前提下,才能达成相对一致性。
而ChatGPT又是什么?它实质上是一个语言对话模型:我提出个问题,计算机给我回答,让我感觉到它像一个人在回答我。为什么像一个人?因为它被喂养了无数的语言逻辑训练,所以给出一个让我认为是个正常人的回答。
ChatGPT能解决几乎所有语言类的问题,帮你写诗,写文案、写文章,写剧本,还可以写代码,因为编程也是语言。
所以我们看到,在AlphaGO问世七年后,人工智能终于走到了一个新的高度。现在的人工智能分为两类:一类是对于语义的回应,以ChatGPT为代表;另一类是对图释的回答,以Stable Diffution为代表。ChatGPT和Stable Diffution,形成了很好的人工智能基本框架。
但跟人类的智能相比,现在的人工智能还有缺撼,人之所以是人,他是会变化的,根据条件的变化,做出的回答也会变化。人是不可琢磨的,但ChatGPT只能给你一个答案,它不能给你无数回答让你选,那就是搜索引擎了。
ChatGPT现在面临的问题是,不知道你要什么答案,它不知道你是谁,只能给你一个中庸的答案,一个平均值。除非它探测到你的意图,捕获到你当下的心理状态。
但它现在还没有办法捕获你,因为它只看到你的输入,不可能看到你的面部表情,也不可能查你的背景,它能给你的回答就是一个保守的、不突破道德底线、带有抑制性的均值回答。但即使这样,我们已经很惊诧了。
中国有没有可能再造一个ChatGPT?孟虹认为,人工智能不像美团这样的应用,可以模仿,它是科学,需要踏踏实实地做科研。训练大模型要给海量的数据标注,还有语义关系和逻辑的一致性,这是巨大的工作量。但国内少有人安心做这种研究,就好比学古诗,人家是一个字一个字读,逐字研究,而大多数人就是看看相关的书籍,听听别人的解读。
其次,从商业化的角度来说,ChatGPT独立存在是没有意义的,它只能附着在场景里。ChatGPT的商业化只有两条道路:一种就是它给你扩展接口,让你构造新的模式,新的功能,产生商业价值。另外一个它不扩展接口,你把它跟你的场景结合,进行产业化。
如果说ChatGPT的基本能力开放,大家都拿到了,那对于所有的人来说,在商业价值上是等价的。而且中国的场景肯定比美国多,把场景驾驭好了,也是一种创新,这也是我们唯一的方向。
而前微软亚太研发集团主席助理兼技术战略总监、境成资本管理人合伙人向江旭则认为,ChatGPT的突破在于它使得之前“人工智障”的聊天机器人变成了能以假乱真的聊天机器人,它是“算力 数据 算法”突破临界点的结果。当初大家不确定在算力、数据和算法三方面花大力气就有可能训练出一个媲美人类的AI模型,因此不敢大笔投入,但只有OpenAI坚持这么做了。
OpenAI成立至今八年,GPT从2018年发布到现在也花了五年时间,这条路被它趟出来了,后面跟风的人一定可以做出类似的东西,就好比浏览器、操作系统和搜索引擎,似乎人人都能做,但要达到Chrome、安卓和Google的水平,还得三方面综合技术实力都到位才行,而且很考验工程的能力。
而对于OpenAI来说,它的定位应该也是2B,采取MaaS(Model as a Service模型即服务)模式,它把接口开放给B端,每调用一次就收一次钱,或者按月收费。未来OpenAI将嵌入无数APP,隐身幕后为它们提供AIGC的能力,而应用场景是无穷无尽的,比如智能家居等等。
向江旭预判,OpenAI在AI时代的地位将相当于手机的操作系统。而其实谷歌Bard技术实力一点也不弱,现在被ChatGPT占了上风,一是因为谷歌在人工智能伦理方面的顾虑,二是也许谷歌还没想明白Bard究竟是搜索的补充还是替代、是否会反噬其搜索的市场领导地位。
未来AI市场是ChatGPT和Bard二分天下,还是有更多山头林立,还得拭目以待。至于中国,受益于监管政策,中国一定会出现面向中文市场的AI大语言模型及服务,正如搜索领域的百度。
相关文章
猜你喜欢