短短几日,OpenAI 的聊天机器人 ChatGPT 席卷了互联网,用户数轻而易举突破百万。
答疑解惑、编写代码、撰写论文、创作诗歌和钢琴曲,当人类绞尽脑汁设下「九九八十一难」,ChatGPT 基本问什么答什么,就算不会也能编得像模像样。
到目前为止,在推向大众的文本生成 AI 里,ChatGPT 是最好的那一个,更何况还免费使用。
当 ChatGPT 春风得意马蹄疾,也有人看到它光环下的失意,程序员和文字工作者的饭碗可能不保,连 Google 等传统搜索引擎也可能被它革了命。
有了搜索引擎,我们依然需要花大量时间翻网页找答案,如果 AI 能直接把答案递到你眼前,还能保证正确率,那岂不是更好?
但问题就在于「如果」。
ChatGPT:我无法与 Google 相比12 月 1 日,开发人员 Josh Kelly 晒出同一个代码问题在 Google 和 ChatGPT 的不同结果,ChatGPT 的答案看起来质量更高,让他感叹「Google is done」(Google 完蛋了)。
初出茅庐的 ChatGPT,真的把刀架在 Google 搜索的脖子上了吗?
先看看两者在定义上的区别。
搜索引擎的核心是海量信息集合,而非信息创造。你在搜索框输入关键字,搜索引擎根据算法,抓取、索引、排序与你的查询匹配的结果,然后你看到了大量的链接,再从中寻找自己需要的信息。
而 ChatGPT 属于 AIGC(人工智能生产内容),是一种新的内容创作方式。它已经被数据集训练完毕,通过一对一的对话和类似人类的口吻,给出单一、即时的答案,还能结合上下文,实现多轮对话,帮你解决更为复杂的、连续性的问题。
你可以一步步引导规则,让它设计游戏等产品,或者给它一段程序,让它检查 bug,还可以给它演示案例,让它举一反三。互动越复杂,ChatGPT 的能力也会越丰富,只当一个回合的搜索引擎用,倒有些「屈才」。
另外,ChatGPT 的回答混入了不少片汤话,被调侃为「水文神器」。OpenAI 解释,这主要是因为训练数据偏差(训练者更喜欢看起来更全面的、更长的答案)和过度优化。
种种不足摆在台面上,ChatGPT 暂时不会威胁到搜索引擎。
▲《2001 太空漫游》的 AI 杀人事件.
虽然 ChatGPT 比其他 AI 更像人了,本质上还是「随机鹦鹉」,离不开大模型、大数据、大算力,它的知识来自训练数据中的统计规律,并不理解自己所说的话。12 月 5 日,《时代》杂志「专访」了 ChatGPT,在被问到「大型语言模型有哪些限制」时,ChatGPT 回答道:
大型语言模型的一个限制是,我们无法理解我们生成的单词的上下文或含义。我们只能根据给定的训练数据,根据某些单词或单词序列一起出现的概率来生成文本。这意味着我们无法为我们的回答提供解释或推理,并且我们可能不会总是生成完全连贯或在对话上下文中有意义的回答。
但 ChatGPT 回避了一个问题:什么是理解?「理解」是属于人类的概念,它能否用在 ChatGPT?如果能用,它的理解是否约等于「生成有意义的回答」这个结果,论迹不论心?
此外,ChatGPT 的时效性、准确性不足,也并非是无解的。
一方面,知乎答主、自然语言处理专家@张俊林指出,近乎实时地将新知识融入大规模语言模型,非常有挑战性,一种解决办法是,把它存到传统搜索引擎的索引里,ChatGPT 如果回答不了时效性的问题,可以转向搜索引擎抽取对应的答案。
另一方面,彭博社报道,OpenAI 正在开发一个名为 WebGPT 的 AI 系统,WebGPT 将能够更准确地回答问题,甚至还能说明引用的来源。
为什么 Google 没有像 OpenAI 一样,直接向大众推出类似 ChatGPT 的产品,或者将它集成在自己的搜索之中?Alphabet 工程师@hncel 认为,问题主要在于成本和延迟:
像 GPT 这样的大型语言模型是 Google 主要研究的领域之一,Google 有大量预算与人员来处理这些模型,但在最大的 Google 产品(例如搜索、Gmail)中实际使用这些语言模型的经济性还不完全存在。发布有趣的测试版是一回事,但将它深入集成到一个每天服务数十亿个请求的系统中,考虑到服务的成本、增加的延迟,则是另一回事。将成本降低至少 10 倍,才能将这样的模型集成到搜索等产品中。
与此同时,大型语言模型也会影响 Google 搜索当前的商业模式——Google 母公司 Alphabet 2021 年收入 2576 亿美元,约有 81% 来自广告,其中大部分是 Google 的按点击付费广告。
像 ChatGPT 这样的 AI 大大减少了页面数量,阻碍了人们浏览和点击更多广告,那么广告收入也会随之下降。
某种程度上,迭代的搜索引擎也好,进击的通用 AI 模型也罢,一个是固有框架的微调,一个是另起炉灶的改革,它们都在让知识更容易被获取,让信息筛选更加智能,降低你的学习门槛,缩短你的学习过程。
Google 高级副总裁 Prabhakar Raghavan 提出了一个很有意思的观点,搜索还是一个远没有解决的问题,「如果你把所有的机器都给我,我仍然会被人类的好奇心和认知所束缚」。
搜索得到更好的答案之前,我们要先知道如何提出问题。未来,组织资料的能力可能不再稀缺,基于个体经验和情感的提问能力和原创观点更为珍贵。当你被引到知识的大门前,人之为人的思辨性和创造力,则以前所未有的地位被凸显出来。
相关文章
猜你喜欢