0门槛克隆ChatGPT！30分钟训完，60亿参数性能堪比GPT-3.5-华威派

> 自媒体 > AI人工智能 > 0门槛克隆ChatGPT！30分钟训完，60亿参数性能堪比GPT-3.5

0门槛克隆ChatGPT！30分钟训完，60亿参数性能堪比GPT-3.5

来源：新智元

2023-06-21

210

管理

编辑：编辑部

【新智元导读】破解「CloseAI」，ChatGPT克隆羊问世！0门槛实现「自研」，从此大语言模型不再只是少数大公司的「金手指」。

此前，OpenAI不Open的事件，已经引发了坊间的诸多争议。

光放出基准和测试结果，不提供训练数据、成本、方法，是真的要「赢家通吃」了。

60亿参数堪比ChatGPT，30分钟就训好

由于ChatGPT需要消耗大量的数据和算力资源（利用数万个单词训练，消耗大量GPU），所以这类大语言模型注定只能被少量巨头所掌握。

和「CloseAI」相反，Meta在今年3月向学术界发布了一组高质量（但不是指令跟随的）语言模型LLaMA，每个模型的训练时间超过了80,000个GPU小时。

随后，斯坦福大学基于LLaMA构建了Alpaca，但不同之处在于，它利用一个包含50,000个问题和答案的小数据集进行了微调。令人惊讶的是，这使得Alpaca具有了类似于ChatGPT的交互性。

而Dolly正是受到了Alpaca的启发。

更有趣的是，拥有60亿参数的Dolly并没有利用现在最新的模型，而是选择了一个2021年发布的开源模型——GPT-J。

由于Dolly本身是一个模型的「克隆」，所以团队最终决定将其命名为「多利」——有史以来第一个被克隆的动物。

而这种「创造性」问题，显然是ChatGPT的强项，洋洋洒洒地写了300多个字。

开放问答

在事实性问题的问答测试上，团队选择了下面这个：「向我解释一下核裂变和核聚变之间的区别。」

先不管对错，GPT-J全篇都是在讲太阳如何如何，虽然提到了「聚变」这个词，但完全无视了「裂变」。

而Dolly第一句就直接点题——核裂变和核聚变的区别在于释放能量的方式，随后简单解释了他们的不同。

相比之下，ChatGPT给出的回答明显要更加翔实。

头脑风暴

当让它们头脑风暴，给出应该阅读的五本科幻小说的名单，GPT-J则只是在喃喃自语，像是沉浸在了拖延阅读而产生的愧疚情绪中，完全回避了这个提问。

Dolly则一如既往的表现稳定，按照指令给出了5本科幻小说的书名及其作者。

ChatGPT对于该问题给出了更加丰富的回答，不仅包括书名和作者，还对每一本书的内容、类型作了简要评述和介绍。

你要Close，我就Open

对于很多公司而言，宁愿自己建立一个不那么强的模型，也不愿将数据发送给那些只提供API的大语言模型供应商。

其中一个重要原因便是，这些问题和数据集是公司最敏感和专有的知识产权，直接将其交给第三方显然是不靠谱的。

此外，公司自身可能在模型质量、成本和期望行为方面有不同的权衡，一种可定制化的语言模型更加符合需求。

现在，Dolly的发布给了他们希望——即便是一个「过时」的开源大型语言模型 (LLM)，也能通过30分的训练，赋予它神奇的类似ChatGPT的指令跟随能力。

不难想象，大语言模型或许很快就不是AI巨头公司独占的玩法了！

正如公司CEO Ali Ghodsi所说，「我们的信念是，让全世界的每个组织都能利用这些技术。」

参考资料：

https://www.databricks.com/blog/2023/03/24/hello-dolly-democratizing-magic-chatgpt-open-models.html

https://venturebeat.com/ai/databricks-debuts-chatgpt-like-dolly-a-clone-any-enterprise-can-own/

0

点赞

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与华威派无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非华威派）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@goodmaoning.com

ChatGPT老板警告：AI可能灭绝人类

2023-06-21 16:57

偏科太严重！ChatGPT考高三物理得零分！张朝阳：原创内容很重要

2023-06-21 16:56

相关文章

马上消费高级总监张耀华：ChatGPT助力消金机构营销可更精准..

「炫富」的GPT-3来了:45TB数据，1750亿个参数，还会三位数加减法..

GPT-4被要求禁止商业化/百度打假冒牌文心一言…

GPT-4震惊四座，中国创业者激战“小模型” | Future

OpenAI发布GPT3 api调用接口！可处理几乎所有英文问题

ChatGPT到底是啥？你知道吗？#人工智能

GPT-4来了，你要知道

GPT-4的新功能以及我基于GPT-4做的机器人

Chrome和Safari浏览器已可使用微软必应聊天，但有诸多限制..

关于作者

轻随风之舞(普通会员)

点击领取今天的签到奖励!

猜你喜欢

01

抛妻弃女31年，李连杰再次遇到前妻黄秋燕，泪点却在合影的位置上..

2022/09/12

02

豆瓣评分9.0以上的国产剧排行榜豆瓣评分9.0以上的国产剧前十..

2022/09/24

03

盘古和女娲（中国神话故事）

2022/08/27

04

2022离世的11位名人：有人患癌，有人突发意外，有人元旦当天离世..

2022/09/11

05

巨蟹座：一生最旺的颜色，能旺你一生，可以不喜欢，但必须爱上它..

7个月前

06

30个暖心睡前小故事，很甜很撩的睡前小故事

2022/08/26

07

香蕉是如何种出来的？从育苗到收获，揭秘香蕉种植的全过程..

2022/06/02

08

“没有好奇心，人就死了”！喜马拉雅鬼王——杨湃的鬼故事哲学..

2022/08/27

标签云

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索