低成本复制 ChatGPT 训练流程，仅需 1.68GB GPU 即可使用，方法现已开源！-华威派

> 自媒体 > AI人工智能 > 低成本复制 ChatGPT 训练流程，仅需 1.68GB GPU 即可使用，方法现已开源！

低成本复制 ChatGPT 训练流程，仅需 1.68GB GPU 即可使用，方法现已开源！

来源：CSDN

2023-04-29

175

管理

编译 | 屠敏

出品 | CSDN（ID：CSDNnews）

当昨日我们还在讨论从大厂以及个人创业的角度来看，复制一家 OpenAI 和一款强大的 ChatGPT 可行性究竟有几成之际，苦于 OpenAI 并未将 ChatGPT 开源出来，所以这趟水究竟有多深，众人并不知。

不过，2 月 14 日情人节这一天，来自加州大学伯克利分校的教授 James Demmel 和新加坡国立大学计算机系的校长青年教授尤洋及其背后的研究团队悄悄提供了一些答案，其率先呈现了一个开源的低成本 ChatGPT 等效实现流程，瞬间吸引无数 AI 爱好者的目光。

话不多说，简单来看，只需实现如下图所示的三步走，便能实现：

使用 Colossal-AI 低成本复制 ChatGPT 训练过程

那该怎么解决？

在这里，潞晨科技研究团队用上了自家研发的面向大模型时代的通用深度学习系统 Colossal-AI 带来了一个开源地成本部的 ChatGPT 等效实现流程。

想必不少 AI 从业者对 Colossal-AI 这款开源模型也有过一定的了解，它是开源的（https://github.com/hpcaitech/ColossalAI），其运用了高效多维自动并行、异构内存管理、大规模优化库、自适应任务调度等多项技术，实现高效快速部署 AI 大模型训练和推理，降低 AI 大模型应用成本。

Colossal-AI 背后的潞晨科技，其核心成员来自美国加州伯克利、斯坦福、清华、北大、新加坡国立、南洋理工等世界一流高校。这款模型于去年四月发布，通过一年不到的时间，截至目前，其获得了 8.9k 个 Star。

在单台多 GPU 服务器上，即使使用最高端的 A100 80GB GPU，由于 ChatGPT 的复杂性和内存碎片化，PyTorch 也只能启动基于 GPT-L（774M）等小模型的 ChatGPT。因此，用 PyTorch 的 DistributedDataParallel（DDP）将多 GPU 并行扩展到 4 或 8 个 GPU，结果性能提升有限。

根据研究团队介绍，Colossal-AI 不仅在单 GPU 上有明显的训练和推理速度优势，而且可以随着并行规模的扩大而进一步提高，单服务器训练速度可达 7.73 倍，单 GPU 推理速度可达 1.42 倍，并且能够继续扩大到大规模的平行度，大大降低 ChatGPT 复制的成本。

写在最后

目前，该研究团队已经开源了完整的算法和软件设计来复制 ChatGPT 的实现过程：https://github.com/hpcaitech/ColossalAI。

不过，同样是基于成本考虑，他们表示，「对于这样一个巨型的人工智能模型，它需要更多的数据和计算资源来实际生效和部署。毕竟，用 1750 亿个参数训练一个 GPT-3 需要价值数百万美元的计算能力。因此，大型预训练模型长期以来只为少数大科技公司所拥有。」

因此，他们也希望能够以开源的方式，吸引更多的研究人员、机构共同参与进来，仅以上文中所复制 ChatGPT 训练流程的实践探索为起点，未来可以向大模型的时代做出努力。

更多详情内容可查阅官方公告：https://www.hpc-ai.tech/blog/colossal-ai-chatgpt

参考资料：

https://twitter.com/ArtificialAva/status/1623346998928723971

https://finance.yahoo.com/news/chatgpt-on-track-to-surpass-100-million-users-faster-than-tiktok-or-instagram-ubs-214423357.html

https://blogs.microsoft.com/blog/2023/02/07/reinventing-search-with-a-new-ai-powered-microsoft-bing-and-edge-your-copilot-for-the-web/

https://arxiv.org/abs/2106.09685

https://arxiv.org/pdf/2203.02155

https://openai.com/blog/chatgpt/

https://en.wikipedia.org/wiki/ChatGPT

https://www.benzinga.com/news/23/02/30850547/bill-gates-says-chatgpt-as-big-an-invention-as-the-internet-will-make-many-office-jobs

赏钱

免责声明：本文仅代表作者个人观点，与华威派无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非华威派）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@goodmaoning.com

谷歌将推出聊天机器人“巴德”抗衡ChatGPT

2023-04-29 14:38

马上消费高级总监张耀华：ChatGPT助力消金机构营销可更精准

2023-04-29 14:14