GPT“高仿”系列开源了！最大可达GPT-3大小，能自主训练-华威派

> 自媒体 > AI人工智能 > GPT“高仿”系列开源了！最大可达GPT-3大小，能自主训练

GPT“高仿”系列开源了！最大可达GPT-3大小，能自主训练

来源：量子位

2023-05-05

276

管理

萧箫发自凹非寺量子位报道 | 公众号 QbitAI

虽然GPT-3没有开源，却已经有人在复刻GPT系列的模型了。

例如，慕尼黑工业大学的Connor Leahy，此前用200个小时、6000RMB，复现了GPT-2。

作者们打算尝试各种结构和注意力类型，最终扩展出GPT-3大小的大语言模型。

为了实现这一目标，他们从复现GPT系列的模型开始，不断尝试各种模型架构、和各种注意力机制的实现方式。

……

这个项目还在施工中，不过，连模型的训练方式都准备好了。

项目计划通过TPU或GPU，对大语言模型进行训练。

为此，作者们已经基于Tensorflow-mesh（用于在GPU上训练模型）、Deepspeed（用于在TPU上训练模型）两个项目，编写了GPT-Neo的训练代码。

这两个项目都可以扩展到大于GPT-3的大小，甚至还能更大。

如何训练GPT-Neo

当然，在TPU和GPU上训练的方式有所不同。

如果使用TPU训练的话，需要注册一个谷歌云平台，创建存储空间，然后再搞个虚拟机，将模型放到TPU上训练。

训练过程也不复杂，主要包括创建分词器、数据集预处理、指定训练数据集、选择训练配置、训练模型几个步骤。

在创建分词器上，GPT-Neo目前提供一个Huggingface的预训练GPT-2分词器。不过，也可以训练自己专属的分词器。

然后，对数据进行预处理，可以直接下载项目提供的数据，也可以使用自己的数据集。

在那之后，指定模型训练所用的数据集，然后对训练方式进行设置，例如优化算法、训练步数等。

目前，GPT-Neo的所有项目和代码已开源。

想要上手一试、或是对项目感兴趣的小伙伴，可以行动起来了~

项目地址：https://github.com/EleutherAI/gpt-neo

参考链接：https://www.eleuther.ai/gpt-neohttps://news.ycombinator.com/item?id=25819803

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

1

点赞

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与华威派无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非华威派）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@goodmaoning.com

GPT-3 1750亿参数少样本无需微调，网友：「调参侠」都没的当了

2023-05-05 20:33

放心，GPT-3 不会“杀死”编程

2023-05-05 20:31

相关文章

重新检视特德·姜、乔姆斯基对ChatGPT的思虑

OpenAI骗了全世界，GPT-4根本不会推理！其能力远低于人类..

博士被骗至缅甸，每天工作18小时！女友和师妹发声

前沿追踪｜由ChatGPT引发的十个知识点（上）

会做策划，能写代码：聊天机器人ChatGPT将抢走更多游戏人的饭碗？..

私有版ChatGPT来了：价格翻十倍

奔驰正在车辆生产中测试ChatGPT，进行质量管理和流程优化等活动..

微软连夜升级AI全家桶！宣布支持Llama 2大模型，GPT-4版Office定价30美元/..

如何用Chat GPT轻松编写高质量的软件需求文档

关于作者

赶海的老阿姨(普通会员)

点击领取今天的签到奖励!

猜你喜欢

01

抛妻弃女31年，李连杰再次遇到前妻黄秋燕，泪点却在合影的位置上..

2022/09/12

02

豆瓣评分9.0以上的国产剧排行榜豆瓣评分9.0以上的国产剧前十..

2022/09/24

03

盘古和女娲（中国神话故事）

2022/08/27

04

2022离世的11位名人：有人患癌，有人突发意外，有人元旦当天离世..

2022/09/11

05

巨蟹座：一生最旺的颜色，能旺你一生，可以不喜欢，但必须爱上它..

6个月前

06

30个暖心睡前小故事，很甜很撩的睡前小故事

2022/08/26

07

香蕉是如何种出来的？从育苗到收获，揭秘香蕉种植的全过程..

2022/06/02

08

“没有好奇心，人就死了”！喜马拉雅鬼王——杨湃的鬼故事哲学..

2022/08/27

标签云

1

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索