> 自媒体 > AI人工智能 > 国内AI大模型综述:ChatGPT取得突破性进展,国内大模型争相发布
国内AI大模型综述:ChatGPT取得突破性进展,国内大模型争相发布
来源:未来智库
2023-09-13
153
管理

(报告出品方/作者:国信证券,谢琦,陈淑媛,王颖婕)

大模型概述:大模型提升机器理解能力,优化人机交互

AI大模型是实现通用人工智能(AGI)的重要方向

AI 大模型是实现通用人工智能(AGI)的重要方向。AI 大模型是基于海量多源数据打 造的模型。AI 大模型具备通用、可规模化复制等诸多优势,是实现 AGI(通用人工智 能)的重要方向。AI 大模型当前包含自然语言处理(NLP)、计算机视觉(CV)等,统 一整合的多模态大模型等。 ChatGPT 推出两个月 MAU 突破 1 亿,是自然语言处理领域突破性的创新,进一步理解 了人类语言。大语言模型(Large Language Model,LLM)是一种使用了大量数据训练 的深度学习算法,构建出一个能够理解人类语言并自动生成语言的模型。ChatGPT 在 2022 年 11 月底推出后,2023 年 1 月的月活跃用户数已达 1 亿,成为历史上用户增长 最快的应用。ChatGPT 的自然语言处理能力超越了以往的自然语言处理模型,可以应 对各种自然语言处理任务,包括机器翻译、问答、文本生成等。

ChatGPT 由 OpenAI 研发,GPT 模型已更新至 GPT-4,大力出奇迹后出现涌现能力。GPT 全称是 Generative Pre-trained Transformer,是 OpenAI 开发的一系列延伸自转换 器架构(Transformer)的自然语言生成模型。2018 年, OpenAI 推出 GPT-1。2022 年 11 月,OpenAI 推出了对话交互式的 ChatGPT。ChatGPT 在 GPT-3.5 之上用基于人类反 馈的监督学习和强化学习(RLHF)进行微调。人类反馈的引入,使机器更理解人类语言, 让 GPT 获得更逼真的结果。ChatGPT 在逻辑推理、上下文理解等方面的能力,是模型 规模达到量级后“涌现”出的。

模型toC应用:文心一言有望优化C端用户搜索、创作体验

百度已经推出对话式产品文心一言。文心一言可通过对话模式,帮助用户文学创 作、商业文案创作、数理推算、中文理解、多模态生成等。例如文心一言发布会 上案例,文心一言可以生成 2023 世界智能交通大会海报,解答“智能交通最适合

模型toB应用:开放 API 接口赋能企业,精调行业模型 目前,百度开放大模型 API 接口,在文案、AI作画、开放域对话方面赋能开发者 和企业。百度文心大模型开放了 NLP 大模型 ERNIE3.0、ERNIE-ViLG 文生图、对话 大模型 PLATO。 ERNIE 3.0 提供文案改写、开放问答、摘要、文案创作、小说创作、文本补 全等文本理解与创作能力。 ERNIE-ViLG 提供基于文本描述的 AI 作画能力。 PLATO提供生成式开放域对话服务,逻辑清晰、知识多元、情感丰富,闲聊 能力接近真人水平。 当前已经有 650家企业宣布接入文心一言生态,还有更多的企业在排队。据百度 介绍,申请文心一言 API调用服务测试的企业已突破 6.5 万。

对于具体行业来说,百度也推出文心.行业大模型,进行行业精调。行业大模型 是在百度通用大模型的基础上学习行业特色数据与知识,建设行业 AI 基础设施。

百度文心行业大模型以“行业知识增强”为核心特色。目前百度文心行业大模型 在能源、金融、航天、制造、传媒、城市、社科以及影视等领域,与国网、浦发、 吉利、TCL、人民网、上海辞书出版社等均有案例应用。我们以五个行业场景举例: 在燃气行业,“深燃-百度·文心”在环境巡检、安全监控等领域落地,有效 解决了场景繁杂、识别困难等难题; 在汽车行业,“吉利-百度·文心”应用于售后服务和汽⻋领域知识库构建等 场景; 在保险行业,“泰康-百度·文心”应用于医疗单据识别等任务,平均字段识 别错误率相对下降;在电子制造行业,“TCL-百度·文心”改变了传统质检算法流程,大幅提升 了模型研发与运营效率,实现降本增效;在社科行业,“辞海-百度·文心”用于版权保护、词条管理和知识挖掘等方 面。

阿里巴巴通义大模型

模型简述:由通义-M6模型融合语言模型和视觉模型组成

通义大模型最早发布于 2022 年 9 月 2 日,在阿里达摩院主办的世界人工智能大会 “大规模预训练模型”主题论坛上。通义大模型实际上是由一系列模型组成,包 括统一底座“M6-OFA”,三大通用模型“通义-M6”“通义-AliceMind”“通义- 视觉大模型”,以及行业层面的不同垂直领域专业模型。通义系列前身为 M6,是阿里达摩院研发的通用性多模态大模型,特点是训练能耗 显著降低。M6 自 2020 年初正式启动研发,于 2021 年 1 月/3 月/5 月分别发布百 亿/千亿/万亿参数多模态预训练模型。2021 年 10 月发布十万亿参数模型,并且 支持使用 512 GPU 在 10 天内即训练出具有可用水平的 10 万亿模型,同等参数下 相较于 GPT-3 能耗降低 99%。

M6 融合语言模型和视觉模型,形成当前的通义系列大模型。2022 年 1 月,阿里 M6 发布了统一大模型 M6-OFA,可以实现不同模型之间的模态表示、任务表示、模 型结构的统一。以 M6-OFA 为统一底座,阿里巴巴将另外两大模型“AliceMind” “视觉大模型”与 M6 进行融合,形成了当前的通义系列架构。其中,通义 -AliceMind 为深度语言模型体系,包含了通用语言模型 StructBERT、生成式 PALM、结构化 StructuralLM、超大中文 PLUG 、多模态 StructVBERT、多语言 VEC 等多个不同模型,具有阅读、写作、翻译、问答、搜索、摘要生成、对话等多种 能力;通义-视觉大模型包括文本到视觉生成、语言和视觉的模态映射两大基础模 型,可以提供文生图等能力。

模型应用:已在广告游戏多场景落地,大幅提升效率并降低成本

腾讯广告业务:腾讯在广告业务中应用 AI 模型,助力广告主提升广告创作效率、 提升广告推荐系统的内容理解能力,大幅提升了广告效率,实现降本增效。在混 元 AI 大模型基础上建立“巨阙”广告内容理解、“乾坤”广告智能创作、“神针” 广告智能审核、“天印”广告指纹系统等四大技术平台,提升了广告系统的理解 能力,让系统更加智能,从而提高用户体验以及广告转化效果与广告制作效率。

内容创作:腾讯智能创作助手文涌(Effidit)主要用途是帮助创作者开阔思路、 提升创作后的文本水平和质量等,目前已经发布 2.0 版本。据官方介绍,文涌融 合了知识抽取、文本理解、文本生成、大规模预训练模型、经典语言模型、搜索 等技术,部分功能的实现使用“混元”系列 AI 大模型作为底层预训练模型。

游戏业务:腾讯近日提出基于 AI Bot 与 AIGC 两大方向的自研 3D 虚拟场景自动 生成解决方案,帮助游戏开发者以更低成本创造风格多样、贴近现实的虚拟城市, 大幅提升 3D 虚拟场景的生产效率。以 3D 虚拟城市道路布局设计为例,现有技术 生成的路网通常横平竖直、风格单一,要实现不同城市风格必须手动设计和反复修改,耗时至少一周。腾讯解决方案只需用户输入城市主干道和海岸线,模型 1 分钟内即可填充合理、多样的路网细节并支持微调操作,相比现有技术下效率提 升近 100 倍。

对话式智能助手:腾讯集合集团内资源与顶尖人才,正在全力打造类 ChatGPT 对 话式产品。36 氪旗下媒体消息,腾讯类 ChatGPT 对话式产品项目组——腾讯混 元助手项目组(HunyuanAide)于 2023 年 2 月已经成立。该项目组联合腾讯内部 多部门构建大参数语言模型,目标是通过性能稳定的强化学习算法训练,完善腾 讯智能助手工具,打造腾讯智能助手,并能成为国内的业界标杆,我们预计未来 AI 只能助手将广泛应用于腾讯系社交产品和办公产品等。

字节跳动大模型

模型简述:AI探索基础扎实,语言大模型和图像大模型初步布局

字节跳动 AIGC 大模型将从语言和图像两种模态发力。根据 36 氪消息,字节跳动在大模型上已有所布局,分别在语言和图像两种模态上发力,预期是在今年年中 推出大模型。 字节跳动 AIGC 大模型尚在初期探索阶段,有一定 AI 基础。根据 36 氪,在 ChatGPT 公开前,字节跳动对大模型的投入存疑。但字节跳动在工程团队和云服务团队方 面并无短板。 1)算力:字节并不缺 GPU。字节旗下的企业技术服务平台火山引擎,在 2021 年 正式进军基础云市场(IaaS 层),为大模型所需的算力奠定了基础。4 月 18 日, 火山引擎发布自研 DPU 等系列云产品,并推出新版机器学习平台:支持万卡级大 模型训练、微秒级延迟网络,弹性计算可节省 70%算力成本。同时,火山引擎宣 布与字节跳动国内业务并池,抖音等业务的空闲计算资源可极速调度给火山引擎 客户使用。

2)算法:阿里巴巴 M6 大模型的原带头人杨红霞现已加入字节 AI Lab(人工智 能实验室),参与语言生成大模型的研发。 模型应用:可用于图文、视频内容生成等,飞书将推出智能 AI 助手“My AI” 抖音、今日头条基于 AIGC 生成图文内容。在 AIGC 的加持下,用户上传照片后, 短时间内系统即可自动生成不同风格的图片。例如,抖音上线该“漫画脸”特效 后,吸引了大量用户,据抖音平台数据显示,截至 2022 年 12 月 6 日,该特效已 经超 2428 万人使用,并迅速飙升至特效潮流榜 TOP1。

剪映提供 AI 生成视频功能。剪映的创作者可以通过几个关键词或一小段文字,生 成一段创意小视频。除此以外,剪映可以根据文字描述智能匹配视频素材,将视 频包装为更垂直的内容作品,包括财经、历史、人文等类别。飞书将推出智能 AI 助手“My AI”。4 月 11 日字节跳动飞书宣布将推出智能 AI 助手“My AI”,My AI 将包括自动汇总会议纪要、创建报告、优化和续写文字内 容,在飞书 app 中,My AI 也可以通过对话形式,帮助用户自动创建日程、搜索 公司内部知识库等功能。

(本文仅供参考,不代表我们的任何投资建议。如需使用相关信息,请参阅报告原文。)

精选报告来源:【未来智库】「链接」

1
点赞
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与华威派无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
凡本网注明 “来源:XXX(非华威派)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。
QQ:2443165046 邮箱:info@goodmaoning.com
关于作者
榴莲啾啾啾(普通会员)
点击领取今天的签到奖励!
签到排行
1
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索