> 自媒体 > AI人工智能 > ChatGPT火爆出圈!“Chat”是“聊天”,但你知道GPT是什么意思吗
ChatGPT火爆出圈!“Chat”是“聊天”,但你知道GPT是什么意思吗
来源:一臼饭
2023-08-03
242
管理

ChatGPT无疑是2023年开年爆款话题!

5天注册用户超100万,月活破亿用时仅2个多月······

ChatGPT的爆火毋庸置疑,投行瑞银集团发布研报称之为“史上增长最快的消费者应用”。根据Sensor Tower数据,TikTok达到1亿用户用了9个月,Instagram则为2年半。此外,Worldof Engineering整理的一份达到全球1亿用户所用时间排名显示,iTunes用了6年半、Twitter用了5年、Meta(Facebook)用了4年半、WhatsApp用了3年半。

好了,聊完这款应用的逆天增长数据,我们来聊一聊ChatGPT到底是什么?从英语字面意思来看,Chat是“聊天”的意思,而GPT就要复杂一些,它指的是Generative Pretrained Transformer 3。

那么,从人工智能的专业角度来说,ChatGPT是一个基于GPT-3(Generative Pretrained Transformer 3)的语言模型,用于处理自然语言问答。GPT-3是由人工智能公司openAI开发的一种大型神经网络模型,能够处理自然语言文本。ChatGPT是基于GPT-3模型构建的,能够根据用户输入的问题,生成自然语言的回答。通常,ChatGPT被用于聊天机器人、问答系统和其他自然语言处理应用中。

ChatGPT的原理是什么?

ChatGPT 是基于 GPT-3 模型构建的。GPT 是 Generative Pretrained Transformer(生成预训练变换器)的缩写,它是openAI推出的一种用于处理自然语言文本大型神经网络模型,GPT-3 是它的最新版本。

GPT-3 模型包含大量的语言数据,能够理解语言的语法和语义。当用户输入问题时,ChatGPT 会将问题转换为计算机能够理解的数据,并使用 GPT-3 模型进行处理。GPT-3 模型会根据语言数据,生成一个回答候选集,并从中选择一个最佳回答。最终,ChatGPT 会将生成的回答以自然语言的形式返回给用户。

如此复杂的模型是怎么训练的呢?简单来说是 RLHF(从人类反馈中强化学习),分三步:

1.收集提示信息(prompt)和人工形成的任务示例(demonstration),并用监督学习方法训练模型。

2. 将初始模型用在新的对比数据上,生成多个输出,人工对这些输出进行排序,排序结果用于训练奖励模型。

3.使用PPO(Proximal Policy Optimization)强化学习算法训练奖励模型。

最终ChatGPT能演变成何种科技形式,让我们拭目以待!

0
点赞
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与华威派无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
凡本网注明 “来源:XXX(非华威派)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。
QQ:2443165046 邮箱:info@goodmaoning.com
关于作者
重新开始(普通会员)
点击领取今天的签到奖励!
签到排行
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索