谷歌发布最大语言模型：等于9个GPT-3，训练成本却低得多-华威派

> 自媒体 > AI人工智能 > 谷歌发布最大语言模型：等于9个GPT-3，训练成本却低得多

谷歌发布最大语言模型：等于9个GPT-3，训练成本却低得多

来源：量子位

2023-05-15

241

管理

杨净发自凹非寺量子位报道 | 公众号 QbitAI

今天，谷歌大脑声称，他们新技术能训练万亿级参数的语言模型。

研究人员表示，大型稀疏模型可用于创建较小的密集模型，在任务上进行微调，其质量增益为大型模型的30%。

从整体结果上看，Switch Transformer 模型在多项推理和知识任务中带来了显著性能提升。这说明该模型架构不只对预训练有用，还可以通过微调将质量改进迁移至下游任务中。

研究人员表示，

我们无法完全保留模型质量，但通过将我们的稀疏模型提炼成密集模型，可以实现10到100倍的压缩率，同时实现约30%的专家模型的质量增益。

在未来的工作中，研究人员计划将Switch Transformer应用于不同模态或多模态模型，包括图像和文本。

参考链接：论文地址：https://arxiv.org/abs/2101.03961https://venturebeat.com/2021/01/12/google-trained-a-trillion-parameter-ai-language-model/

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

0

点赞

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与华威派无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非华威派）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@goodmaoning.com

以假乱真？加州某高材生用 GPT-3 生成伪文章成功骗得 26000 访问

2023-05-15 16:25

ChatGPT进化之路：ChatGPT-4与3.5的版本差异解析

2023-05-15 16:22

相关文章

能提供定制旅游建议、优化机场体验…美国多家旅游网站近期加载ChatGPT插件..

ChatGPT颠覆的第一个行业，是机器人吗？

ChatGPT登上Apple Watch！口述问题就能收到AI答复

数字文化“体验官” |智能化不输ChatGPT! 这个“wise数字机器人”有玄机..

火爆全球的GPT-3，到底凭什么砸大家饭碗？

英国出版商敦促首相保护知识产权免受OpenAI等人工智能系统的侵害..

学术分享丨结合大语言模型Chatgpt设计了机器人的番茄采摘末端..

聊天的时候，建议你冷淡一点

关于作者

雪霁(普通会员)

点击领取今天的签到奖励!

猜你喜欢

01

抛妻弃女31年，李连杰再次遇到前妻黄秋燕，泪点却在合影的位置上..

2022/09/12

02

豆瓣评分9.0以上的国产剧排行榜豆瓣评分9.0以上的国产剧前十..

2022/09/24

03

盘古和女娲（中国神话故事）

2022/08/27

04

2022离世的11位名人：有人患癌，有人突发意外，有人元旦当天离世..

2022/09/11

05

巨蟹座：一生最旺的颜色，能旺你一生，可以不喜欢，但必须爱上它..

6个月前

06

30个暖心睡前小故事，很甜很撩的睡前小故事

2022/08/26

07

香蕉是如何种出来的？从育苗到收获，揭秘香蕉种植的全过程..

2022/06/02

08

“没有好奇心，人就死了”！喜马拉雅鬼王——杨湃的鬼故事哲学..

2022/08/27

标签云

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索