> 自媒体 > AI人工智能 > GPT3—一个真正能代替你工作的AI?
GPT3—一个真正能代替你工作的AI?
来源:风林木鱼
2023-05-22
235
管理

AI自1956年提出以来一直呈渐进式发展,前期发展缓慢,但随着半导体工业技术的发展,芯片算力在近二十几年中的指数型增长,AI的发展也拥有了更好的载体。

众所周知AI的根本动力与核心资源是算力与数据。半导体芯片行业发展到如今3nm的制程工艺加之几十年的芯片设计经验积累,可以说算力的提升已经达到相当的水平,逐渐到了AI大展拳脚的时候了。

自从1997年IMB的“deep blue”战胜国际象棋冠军以来AI已经在越来越多的领域趋近甚至有隐隐超越人类的势头。而今天我们将要说到的便是AI领域的又一新成果—“GPT3”。其展现出的性能尤其是在NPL领域显得相当喜人,和AlphaGo一样可以称得上是人工智能历史上的又一里程碑。

GPT3是什么?

不错想必你已经猜到既然有GPT3,那么之前一定还存在GPT2、GPT1之类的前置版本,今天取得喜人成就的是该系列的第三代。

可以说已经十分惊艳了。

3、内容创作与新闻资讯编辑

GPT3出现之前小生只知道很多村里的大妈大爷被聚集起来写网文的情况,一少部分机器写的文章很容易被辨识出来,而如今GPT3的文章不可谓强悍。

一位来自美国加州大学计算机系名叫Liam Porr的小哥已经用GPT3写博客做自媒体,其文章已经登上了新闻平台技术板块热门榜第一。你没看错就是热榜第一,这得益于其巨量的数据库训练及与独特的注意力模式。优秀的关联模式注意力算法使得其擅长编写漂亮的辞藻加上众多专业书籍知识的数据集,很容易迷惑一大批非专业人士。但其实并不擅长逻辑关系,翻译过来便是借鉴的东西太多,单独一段辞藻华丽看似很有道理,不过联系前后文逻辑关系不能太复杂。该特性恰好适合很多不需要严格逻辑论证的文章,例如鸡汤文,GPT3尤其擅长。

不过这也不能影响GPT3写作十分强悍的结论,国外甚至已经有好事者在《权力的游戏》烂尾后使用当时的GPT2重写剧本,剧情精彩,很多网友表示AI剧本比原著写得更好。

4、搜索与数据分析

就如Google或百度搜索一样,GPT3同样拥有强大的搜索能力。不同之处在于由于大量数据集的训练与注意力算法,其回答更加人性化。

搜索:

最明显的区别便是你用Siri时如果遇到稍微刁钻一点的问题它便不能明白你说什么甚至直接打开浏览器搜索了,而GPT-3能理解你说的什么进而像与人交流一般回答你的问题。例如你问他馒头为什么软乎乎的,它能充分理解软乎乎的意义并会详细回答你那是因为酵母菌无氧呼吸产生二氧化碳、二氧化碳受热会使馒头膨胀等等,并非生硬的给你一个百度百科链接之类(虽然他的知识也来自于数据集),而是亲口给你诉说,总之你能感受到很像与人在交流。

该规则同样适用于NPL领域的GPT3,同理注意力一直是自然语言理解与语言模型生成的核心组成。GPT3的交替密集与局部带状稀疏的注意力模式只关注K个最大贡献的状态,其他相关度与查询度低的值被归为0,相比传统注意模式可能造成的负反馈识别更加高效与准确。

2、训练数据集大幅度增加

这里的领域包含多方面,可以是与人聊天、文学创作、数学计算、甚至是编程

其实GPT3与前代GPT2就逻辑算法层面其实大同小异,区别在于其学习的参数是前代的100多倍达到1750亿,而训练的数据集相比上一代的40GB增加到了45TB,据了解包含600万篇文章的英文维基百科全书仅占其学习总数据集的0.6%,其余还包含大量数字化书籍与网络链接,就结果来说它是一个包含文学、政治、医学、法律、宗教等知识的百科全书。最终导致训练出的模型本体达到700GB而上一代只有5GB。

通过上图可以知道可以知道,机器训练的模型规模越大,识别率也随之增加。尤其是当样本数量达到13亿后,GPT3的准确率增强速度更加显著增强,可以说训练模型的数量是非常重要的。

GPT3存在的不足之处

不过智能如GPT3也并非在每个领域都通过了图灵测试,并非完美,还远达不到通用人工智能AGI的标准(人工智能专家们梦寐以求的圣地,一个如人类一般思考与行事的多用途AI)。

例如对一些无意义的问题,GPT3照样也能给出不明所以的回答。

问:一个地球上有多少个绯想天?

答:一个地球上有3个绯想天。

问:从北京到华盛顿需要多少个太阳?

答:从北京到华盛顿需要2个太阳。

问:头有几只手?

答:头有两只手。

之类无意义的答案有很多,甚至在一些物理问题上GPT3也显得捉襟见肘,对问题原理的理解还停留在数据训练的层面。就目前来说它还仅仅是一个语言模型根据输入的文本推理字符的概率分布进而挑选出一个,其实根本没有理解你说的是什么。就如今所展现出的喜人成就也许存在精心挑选的成功案例。

与人类的差距:

GPT3目前还无法执行复杂的逻辑推理,就算将同一句话换一种说法后,它也会立刻出错,说明其理解能力还未达到AGI通用阶段,仅停留在语言层面,不能实现对物理场景的理解。目前GPT3的宽度仅为2048个token,代表其理解上下文的数量,而人类通过学习可以记住大量知识并将其上下文相关联。

在今年10月30日开幕的第三届世界顶尖科学家论坛上,被称为“硅谷教父”的美国计算机科学家约翰.轩尼斯发表的《AI,赋能美好生活》中也指出大脑是有史以来最伟大的学习机器,人类能理解什么是猫什么是狗,而AI只能通过数据学习分清其区别而并不能认识其本质告诉你为什么。这便涉及到机器感知的领域了,并且单一感知是很难实现性能大幅度提升必须多源信息融合,例如你看到一个东西便知道闻起来什么味道,抓起来什么声音,摸起来什么感觉,吃起来什么味道。正是这一系列的感官信息的融合促成了你对该事物较为全面的理解。不是简单抠字眼的GPT3所能实现的。

未来展望

算力无疑是AI的核心,随着摩尔定律的到来科学家们也在另辟蹊径探索大规模神经网络数据中心来突破进而实现更加智能的AI。

最近世界顶尖科学家论坛上大家也都在关注人脑相关的领域,研究不同行为大脑神经的反应与应答机制。借此如有实质性突破的话当然对AI的发展也是革命性的。

我们的大脑拥有约860亿个神经元与1000万亿个神经突触也就是连接参数,而GPT3的连接参数仅有1750万个,从数量上比还差了几个数量级,不过正如对比GPT2的进步,GPT4的连接参数至少又会扩大十几倍,也许不久AI的连接参数也将进入人脑的万亿级别。

届时其不仅能处理文字语言也能处理图片、声音、视频甚至人类的五感信息也未可知,最终赶上人类的大脑。

GPT3巨大的商业价值

综上所述,GPT3在各类应用场景中拥有巨大的潜力,这也是微软愿意与OpenAI合作耗巨资并提供世界顶级超级计算机与云计算服务器的原因。其在众多应用场景中都能实现直接替代或强大的支持。今后我们的搜索也不是像如今在搜索框中输入较为准确的关键词,而是直接人与人交流的大白话,例如你问女朋友为什么黏人,它会直接文字或语音回答你,依据感情的培养原理、年龄、性格等方面给你分析得头头是道,甚至在拥有你的个性人物画像后针对个人做出针对性的回答,你会觉得机器是如此的懂你,而不像如今搜索出的各类人工的文章以及回答(虽然其学习源数据也来源于各类资料)。

我们知道人工智能的核心动力是数据与算力,从某种程度上来说数据越多越智能,有人设想如果将整个互联网的数据喂给一个AI再加上强劲的算力与神经感知系统,那么其是否可以无限接近甚至超越人类?该想法似乎不无道理,只是计算能力的突破似乎来到了近年来炙手可热的量子计算机上,那便是另一个话题了。

总之虽然GPT-3展现出的惊人天赋使我们眼前一亮,让我们意识到其蕴藏的巨大价值与潜力,但也意识到其不足之处,不仅数据训练的数量,对多方面信息的感知与融合同样决定了其是否理解事物的本质,同时我们还得研究人脑的结构与运行机制,演化了几十亿年的人脑可没那么简单。如此也许AGI通用人工智能的时代才能真正到来。

0
点赞
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与华威派无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
凡本网注明 “来源:XXX(非华威派)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。
QQ:2443165046 邮箱:info@goodmaoning.com
关于作者
赶海的老阿姨(普通会员)
点击领取今天的签到奖励!
签到排行
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索