“chatGPT”到底是什么啊？-华威派

> 自媒体 > AI人工智能 > “chatGPT”到底是什么啊？

“chatGPT”到底是什么啊？

来源：桃园愚人1

2023-05-15

398

管理

#挑战30天在头条写日记#

“chatGPT”到底是什么啊？

chatGPT是一个智能对话应用，也称聊天机器人，可以回答用户的各种天南海北的问题。

chatGPT背后的技术被称为“大型语言模型”（Large Language Model，简称LLM），是人工智能技术中，属于深度神经网络的技术。

从原理上来说，我觉得chatGPT像是一个知识的压缩器：它把很多知识浓缩在里面，然后你可以通过对话问答的方法把知识取出来。如果把浓缩知识的过程称为“压缩”，那取出知识的过程就是“解压缩”。从这个意义上讲，chatGPT是一个知识的“压缩-解压缩器”。

本来知识的表现形式，是我们看得懂的文本，经过机器的重新编排，存储在一个称为“神经网络”的东西里，也就是今天我们所说的 “模型”。人的大脑有一张“神经网络”，是由很多相互连接的神经元构成。

机器学习技术参照了这个名字，也叫“神经网络”，实际就是许许多多彼此连接的数据节点，其中，大型语言模型拥有的数据节点少则几百亿个、多则上万亿个。

知识被重新编排后，就用这些数据节点的参数以及节点之间的关系来表示，不再是一篇篇可读的文本。“解压缩”就是把知识从网络中恢复出来，变成我们可读的文本。而“解压缩”的钥匙，就是我们问chatGPT的问题。

问题：能不能再解释得详细一点？为什么chatGPT能回答问题？

回答：

我用“搜索引擎”来做对比，有利于说清楚问题。

网上的知识非常多，以网页或数据库的形式存在。搜索引擎首先要去抓取网页，上千亿的网页，就是获取知识的过程，这是搜索的第一个功能。

然后，搜索引擎要浓缩这些网页，它会把文章拆成一个一个的词，以词为单位来重新组织文章，就是制作“倒排表”，“倒排表”就是每个词后面跟着一串它出现过的文档编号，这样查询时可以快速找到哪些文章包含了查询词。这是搜索引擎的第二个功能“索引”。

再然后，当用户来查询的时候，输入一个或几个词，包含这些词的文章是相当多的，那就要给文章排序，尽量让用户想要的结果排在前面。这就是搜索引擎的第三个功能“排序”。

搜索引擎就有这样三个主要功能：获取知识——抓取；编排知识——索引；把你想要的排前面——排序。还有其他很多细节，大致是这样。

可以说，搜索引擎也是一个知识的“压缩-解压缩器”。类似的，我们也可以按照“获取知识-编排知识-呈现知识”这样三个方面来理解chatGPT。

在“获取知识”方面，chatGPT有三个阶段。在第一阶段，研发团队收集大量的网页或者数据库，用里面的文本信息作为训练模型的“语料”，这个量很大，按单词个数来算能达到上万亿。在第二阶段，模型优化阶段，会有专门设计的一些问答数据，这个数量很少，但对模型效果很关键。第三阶段，当模型的效果足够好、可以对用户开放之后，chatGPT可以通过和用户的对话来获取数据，研发团队还开发了插件，方便合作方将各种数据库接入chatGPT，来丰富其指定场景下的知识，这个数据量可以是海量的。

在“编排知识”方面，chatGPT和搜索引擎不同，它把知识揉得更碎，文本变成了数字编码、以节点参数和节点之间的关系的形式来存储，知识就好像“融化”在网络里；当用户来问时，chatGPT会用同样的方式把用户的问话也变成数字编码，输入神经网络，这样就触发了神经网络中的相关信息，回收信息后，再经过一个和揉碎相反的过程——就是解码，就形成了返回的文案。

在“呈现知识”方面，用户用日常对话来获取知识，而不是使用搜索引擎时的查询词。返回的结果也不同，搜索引擎会返回一组网页，而chatGPT给的是通顺的文案。chatGPT还能对信息做梳理，总结成结构化的文案，这是让人印象深刻的地方。至于答案中信息的相关性和重要性等，可能已经被考虑在神经网络的参数里，具体机制我不懂。

另外的区别是，chatGPT还可以和你做多轮问答，有根据上下文调整答案的能力。这取决于它能编码的长度，就是能把多长的问题放到网络中去。

当然，你用日常问话去问搜索引擎也行，但是返回的结果往往很不好，为了改善搜索结果，搜索会在下拉框里补充一些提示词。这当然和千变万化的日常对话没法比。

总而言之，作为知识的“压缩-解压缩器“，chatGPT确实是一次技术上的飞跃。