ChatGPT让LeCun酸成柠檬精？谷歌、Meta、OpenAI聊天机器人大PK！-华威派

> 自媒体 > AI人工智能 > ChatGPT让LeCun酸成柠檬精？谷歌、Meta、OpenAI聊天机器人大PK！

ChatGPT让LeCun酸成柠檬精？谷歌、Meta、OpenAI聊天机器人大PK！

来源：新智元

2023-04-13

287

管理

编辑：好困 Aeneas 桃子

【新智元导读】做聊天机器人，OpenAI不是第一家，但绝对是最出风头的那个。谷歌、Meta、DeepMind、OpenAI的聊天机器人大PK，谁最牛？

前几天，Meta首席人工智能科学家Yann LeCun的一段对于ChatGPT的点评迅速传遍圈内外，引发了大波讨论。

在Zoom的媒体和高管小型聚会上，LeCun给出了一段令人惊讶的评价：「就底层技术而言，ChatGPT并不是多么了不得的创新。」

「虽然在公众眼中，它是革命性的，但是我们知道，它就是一个组合得很好的产品，仅此而已。」

但其实，他的言论不无道理。

像ChatGPT这种数据驱动的人工智能系统，许多公司和研究型实验室有。LeCun表示，OpenAI在这个领域并没有多么独树一帜。

「除了谷歌和Meta之外，还有六家初创公司，基本上都拥有非常相似的技术。」LeCun 补充道。

在Huggingface的一篇博客中，几位作者调查了关于RLHF、SFT、IFT、CoT（它们都是ChatGPT的关键词）这些主题的重要论文，对它们进行了分类和总结。

他们制成了一个表，根据公开访问、训练数据、模型架构和评估方向等细节，对BlenderBot、LaMDA、Sparrow和InstructGPT这些AI聊天机器人进行了比较。

注意：因为ChatGPT没有记录，所以他们使用的是InstructGPT的细节，InstructGPT是一个来自OpenAI的指令微调模型，可以被认为是ChatGPT的基础。

在RLHF中，一组模型响应根据人类反馈进行排序（例如，选择一个更受欢迎的文字简介）。

接下来，研究人员在这些注释过的响应上训练一个偏好模型，为RL优化器返回一个标量奖励。

最后，通过强化学习训练聊天机器人来模拟这个偏好模型。

论文指出，采用CoT微调的模型，在涉及常识、算术和符号推理的任务中表现得更好。

此外，CoT微调在敏感话题方面也非常有效（有时比RLHF做得更好），尤其是可以避免模型摆烂——「对不起，我无法回答」。

SFT和IFT的联系非常紧密。IFT可以看作是SFT的一个子集。在最近的文献中，SFT阶段经常用于安全主题，而不是用于在IFT之后完成的特定指令主题。

在将来，它们的分类和描述应该会有更清晰的用例。

另外，谷歌的LaMDA也是在一个有安全注释的对话数据集上进行微调的，该数据集有基于一系列规则的安全注释。

这些规则通常由研究人员预先定义和开发，包含了一系列广泛的主题，包括伤害、歧视、错误信息等。

AI聊天机器人的下一步

关于AI聊天机器人，目前仍有许多开放性问题有待探索，比如：

1. RL在从人类反馈中学习方面有多重要？我们能在IFT或SFT中通过更高质量的数据训练获得RLHF的性能吗？

2. Sparrow中的SFT RLHF，与LaMDA中仅仅使用SFT，两者的安全性如何比较？

3. 鉴于我们已经有了IFT、SFT、CoT和RLHF，那么还有多少预训练是必要的？有哪些权衡因素？最好的基础模型是哪个（包括公开的和非公开的）？

4. 现在这些模型都是精心设计的，其中研究人员会专门搜索故障模式，并根据揭露的问题影响未来的训练（包括提示和方法）。我们如何系统地记录这些方法的效果并进行复现？

总结一下

1. 与训练数据相比，只需拿出非常小的一部分用于指令微调（几百个数量级即可）。

2. 监督微调利用人类注释，可以让模型的输出更加安全和有用。

3. CoT微调提高了模型在逐步思考任务上的表现，并使模型不会总是逃避敏感问题。

参考资料：

https://huggingface.co/blog/dialog-agents

1

点赞

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与华威派无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非华威派）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@goodmaoning.com

微软抢先官宣ChatGPT版新必应，搜完答案还能持续聊天

2023-04-13 11:41

阿里巴巴：正研发“阿里版”ChatGPT，目前处于内测阶段

2023-04-13 11:40

相关文章

ChatGPT被曝有隐私漏洞，OpenAI创始人证实

chatAI 对中国存量房看法：AI都知道要这样做了，其他。..

AI掘金再扩散 ChatGPT如何赋能机器人行业？微软早已给出方向..

【科学强国】ChatGPT革命！尝鲜者的喜与忧

Snap整合ChatGPT技术推出聊天机器人：不要和它说秘密

逆天魔法正式解禁，GPT-4以来最强应用“代码解释器”.....

跑分达ChatGPT的99%，人类难以分辨！开源「原驼」大模型爆火..

说句话就能做表格、PPT，微软把GPT-4塞进办公套件后，我慌了..

做ChatGPT无法取代的文案

关于作者

重新开始(普通会员)

点击领取今天的签到奖励!

猜你喜欢

01

抛妻弃女31年，李连杰再次遇到前妻黄秋燕，泪点却在合影的位置上..

2022/09/12

02

豆瓣评分9.0以上的国产剧排行榜豆瓣评分9.0以上的国产剧前十..

2022/09/24

03

盘古和女娲（中国神话故事）

2022/08/27

04

2022离世的11位名人：有人患癌，有人突发意外，有人元旦当天离世..

2022/09/11

05

巨蟹座：一生最旺的颜色，能旺你一生，可以不喜欢，但必须爱上它..

6个月前

06

30个暖心睡前小故事，很甜很撩的睡前小故事

2022/08/26

07

香蕉是如何种出来的？从育苗到收获，揭秘香蕉种植的全过程..

2022/06/02

08

“没有好奇心，人就死了”！喜马拉雅鬼王——杨湃的鬼故事哲学..

2022/08/27

标签云

1

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索