GPT-3变ChatGPT！吴恩达高徒、华人CEO震撼发布Lamini引擎-华威派

> 自媒体 > AI人工智能 > GPT-3变ChatGPT！吴恩达高徒、华人CEO震撼发布Lamini引擎

GPT-3变ChatGPT！吴恩达高徒、华人CEO震撼发布Lamini引擎

来源：新智元

2023-05-21

196

管理

编辑：Aeneas 好困

【新智元导读】这个全新发布的Lamini引擎，大大拉低了模型训练的门槛，开发者人手一个ChatGPT的梦想成真了。

快速定制模型的LLM引擎Lamini来了，开发者狂喜！

ChatGPT虽好，但始终有门槛。通常，只有拥有AI博士学位的大型机器学习团队，才能这样训练一个模型。

为了把这个门槛打下来，团队构建了Lamini引擎，从此，每个开发者都能够拥有从GPT-3训练ChatGPT的超能力！

划重点：可以商用！可以商用！可以商用！

对此，英伟达科学家Jim Fan表示， LLaMa 自定义数据正在成为新的范式，而Lamini的推出也带了一种全新的模式——FaaS，微调即服务。

MLOps的未来是「LMOps」。哪里有标准化，哪里就有机会。

OpenAI科学家，前特斯拉人工智能总监Andrej Karpathy也表示，LLM定制化的生态正在愈发火爆。

训LLM就像prompt-tuning一样简单

写一个prompt如此容易，但想要从基础模型训练出一个大语言模型，却是如此困难。

因为需要花费大量时间，来找出微调模型失败的原因，所以对数据集微调的迭代周期都是以月为单位的。

与之相反，微调prompt的迭代，只需要几秒钟，并且在几个小时内，性能都能保持稳定。

这个过程只需要把有限数量的数据整合到prompt中就可以了，并不需要动辄几TB的数据。

ChatGPT的诞生十分艰难，OpenAI的团队花了几个月的时间，在基础的GPT-3模型上微调，并进行RLHF。这个门槛极高，只有大型的ML团队才能完成这种训练。

有500强企业的技术负责人这样抱怨过：「我们团队的10名机器学习工程师用了OpenAI的微调API，结果我们的模型反而变得更差了，怎么办啊。」

「我真的不知道该怎么充分利用数据，我已经用尽了所有从在线教程中能学到的prompt魔法了。」

这，就是研究者构建Lamini的原因：让每个开发者可以直接从GPT-3训练ChatGPT。

任意LLM，秒变ChatGPT！

Lamini是一个LLM引擎，可以让不仅仅是机器学习专家的任何开发人员，都能在大型数据集中，把高性能的LLM训练得像ChatGPT一样好。

这个过程，只需要Laimini库的几行代码即可。

值得注意的是，这个库中的优化（optimization）远远超出了现在开发者可以使用的范围，从更具挑战性的优化（如RLHF）到更简单的优化（如减少幻觉）。

比如，你想从不同的角度生成一个广告文案。

首先，从llama模块导入LLM引擎：

from llama import LLMllm = LLM(name="marketing")

接下来，需要定义输入和输出类型。注意，这里一定要包括上下文（Context），因为可以有助于LLM在自然语言中进行理解。

from llama import Type, Contextclass AdAspects(Type): tone: str = Context("tone of the marketing copy") product_features: list = Context("product features to promote") audience: str = Context("target audience for the message") subject: str = Context("subject or topic of the message") goal: str = Context("goal of this marketing campaign and message")class AdCopy(Type): title: str = Context("google ad title tag") description: str = Context("google ad description") keywords: list = Context("keywords for the search engine")

然后就可以开始提问了：

语气：大胆，但不傲慢

特色：亚洲酱料和香料、家常调料和套餐包，可以轻松在家烹饪。

aspects = AdAspects( tone="bold and bright, but not arrogant", product_features=[ 'asian sauces and aromatics', 'home-cooked seasonings and meal packs that can be easily cooked at home' ], audience="suburban families", subject="delicious asian meals without going to a restaurant", goal="get suburban moms and dads to try buy their first omsom pack or free tasting kit")ad_copy = llm(input=aspects, output_type=AdCopy)print(f"Ad copy: {ad_copy}")

模型输出：

尝试 Omsom 的美味亚洲酱料、香料、家常调料和套餐包。轻松为家人在家做出美味佳肴。

> title='Delicious Asian Meals Without Going to a Restaurant | Omsom' description="Try Omsom's delicious Asian sauces, aromatics, and home-cooked seasonings and meal packs. Easily cook delicious meals at home for your family." keywords=[ 'Asian sauces', 'Aromatics', 'Home-cooked seasonings', 'Meal packs', 'Delicious meals', 'Suburban families', 'Omsom' ]

如何创建自己的「ChatGPT」

基础模型能理解一般的英语，但如果需要它们学习一些垂直语言和规则，prompt微调并不足够，很多时候我们都需要构建自己的LLM。

利用用下面这个步骤，就能获得像ChatGPT一样遵循指令的LLM。

Lamini数据生成器是一个LLM管线，它采用原始的100多条指令的小集合，与预期的响应配对，生成50k 新的配对，灵感来自Stanford的Alpaca 。这个生成管线使用Lamini库来定义和调用 LLM，以生成不同但相似的指令和响应对。

根据这些数据训练后，你的LLM会遵循这些指示，因而得到改进。对于使用开源LLM的生成管线，研究者提供了一个很好的默认值，Lamini Open和Lamini Instruct。

随着每天新的LLM发布，研究者都会将默认值更新为性能最佳的模型。在目前的版本中，Lamini Open用的是EleutherAI的Pythia，Lamini Instruct用的是Databricks的Dolly。

Lamini Open会生成更多指令，而Lamini Instruct会生成这些指令的成对响应。

最终生成的数据集可供免费商业使用，已经通过CC-BY许可。

仅用一行代码，就可以将Lamini库的默认值换成其他开源或OpenAI模型。

研究者发现，OpenAI模型的平均表现更好，但它们的许可限制了将生成数据用于训练类ChatGPT模型的商用。

对生成数据进行微调

在这个过程中，生成的数据会质量不一。

在微调之前，下一步就是将生成的数据过滤为高质量数据。

然后，Lamini会通过在这个过滤后生成的数据集上训练基础模型，来创建自定义LLM。

研究者已经发布了一个开源指令跟随LLM（CC-BY 许可），可以用Lamini来训练Pythia基础模型，生成的37k指令是从70k中筛选出来的。

显然，Lamini库的出现，让迭代周期变得更快、更有效，有更多的人能够构建模型，而不仅仅是试验各种prompt。

团队介绍

Sharon Zhou是Lamini的联合创始人兼首席执行官。

Gregory Diamos是MLPerf的联合创始人。

他曾是百度硅谷AI实验室的创始成员，对DeepSpeech和DeepVoice系统有贡献。

参考资料：

https://lamini.ai/blog/introducing-lamini

赏钱

免责声明：本文仅代表作者个人观点，与华威派无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非华威派）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@goodmaoning.com

GPT-3回答问题不靠谱？OpenAI找来人类“调教师”，终于教明白了

2023-05-21 20:05

1750亿参数,史上最大AI模型GPT-3上线:不仅会写文,答题,还懂数学

2023-05-21 20:03