ChatGPT技术探索8：ChatGPT历史产品GPT-4-华威派

> 自媒体 > AI人工智能 > ChatGPT技术探索8：ChatGPT历史产品GPT-4

ChatGPT技术探索8：ChatGPT历史产品GPT-4

来源：杨老师说专业

2023-09-06

266

管理

探索ChatGPT历史产品的目的和意义在于更好的了解GPT模型的构建与发展，回顾过去，才能更好把握未来。

2023年3月15日，OpenAI发布了GPT系列的最新力作多模态GPT-4。这一新模型在发布当天就被集成到ChatGPT平台中。ChatGPT Plus会员在开始新对话时可以选择不同的基座模型，其中就包括GPT-4，用户能享受到更为出色的对话体验。

相较于前代产品，GPT-4的最显著差异在于它能够处理图像和文本输入，并生成文本输出。换句话说，GPT4已不再仅仅是一个大型语言模型，而是发展成了一种多模态模型。

所谓的“多模态”是一个专业术语，意味着该模型能够同时处理多种不同类型的数据，如图像、文本、语音和视频等。多模态模型能整合各种数据信息，从而提供更全面且准确的理解和决策。例如，当模型同时学习图像和文本两种模态的数据时，就可以提高其在视觉和语言融合的任务上的效果，典型的融合任务有图像标注和图文分类等。同样地，在语音和文本模态间共同学习，有助于提升语音识别和语音合成的性能。

多模态模型一直是人工智能技术的一个重要目标和发展方向，其背后最关键的原因在于，人类的学习本身就是多模态的。在婴儿期的感知和认知发展过程中，宝宝会同时接触到多种不同类型的刺激，包括视觉，听觉和触觉，通过多模态学习，宝宝能够建立对外部世界的理解和认知。例如，当妈妈一边摇着金色的铃铛，一边给襁褓中的宝宝哼唱“金色的铃铛，叮当叮当”时，宝宝能够将来自不同感官的信息整合起来，从而构建更全面且准确的感知和认知。

与传统的语言模型相比，多模态模型可以通过对文本、图像和声音等多种不同模态的数据进行联合建模，更好地模拟人类学习的方式。传统的语言模型只能通过文字学习，虽然能够记住铃铛通常呈现金色，摇晃时发出叮当声，却无法真正领悟金色的实质和叮当声的具体音色。因此，多模态的GPT-4被认为是通往更强大、更通用的人工智能的坚实一步，是通用人工智能的雏形。

仅就语言能力而言，GPT-4也远超前代产品GPT-3.5。首先，GPT-4能处理更长的上下文，可以按受约30000个单词文本作为输入，相比之下，GPT-3.5只能处理约4000个单词。同时，GPT-4在高级推理和处理复杂指令方面的能力得到了显著提升。在模拟律师考试中，GPT-4的得分位于前10%的考生之列，相较之下，GPT-3.5则位于后10%；在相当于美国高考的SAT模拟考试中，GPT-4在阅读和写作部分取得710的高分，满分为800分，较GPT-3.5高出40分；在数学部分，GPT-4以700分成绩超出GPT-3.5约110分；在AP生物考试中，GPT-4的成绩从GPT-3.5的4级提升至5级，在通用语言理解评估基准测试上，GPT-4达到了90.1%的准确率，而目前人类的最高水平仅为88.5％。此外。GPT-4在其他语言，编程时和看图能为等领域也展现出了与人类相当，甚至超越人类的性能水平。

尽管GPT-4在诸多方面取得了显著进步，但它仍然存在一些局限性和潜在风险，在OpenAI的GPT-4技术报告中，作者特别强调了以下几个方面：GPT4仍不完全可靠，有时会产生事实错误或推理错误；GPT-4可能生成有害或不道德的回复内容；无论是训练还是运行，GPT-4都需要大量的计算资源，这给经济和环境都带来了不小的压力；由于GPT4的强大能力，其被用或误用的风险相较前代产品有所增加，科学家们一直在努力改并和解决这些问题，相信将来会为人们提供更安全、更可靠、更高效的人工智能工具。

今天就聊到这里，我想强调一下，我真的不是ChatGPT技术领域的专家，只是因为兴趣，我先一步使用了ChatGPT。所以我希望与各位同仁在讨论区一起探索和学习，共同进步，谢谢。

赏钱

免责声明：本文仅代表作者个人观点，与华威派无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非华威派）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@goodmaoning.com

他用GPT-3实现了「量子速读」

2023-09-06 16:26

基于GPT-4的必应聊天AI面临质量问题微软做出回应

2023-09-06 16:09