国产ChatGPT「套壳」的秘密，现在被找到了-华威派

> 自媒体 > AI人工智能 > 国产ChatGPT「套壳」的秘密，现在被找到了

国产ChatGPT「套壳」的秘密，现在被找到了

来源：量子位

2023-05-29

236

管理

衡宇发自凹非寺量子位 | 公众号 QbitAI

“套壳ChatGPT！”“套皮Stable Diffusion！”“实则抄袭！”……

外界对国产大模型产生质疑已经不是一次两次了。

业内人士对这个现象的解释是，高质量的中文数据集实在紧缺，训模型时只能让采买的外文标注数据集“当外援”。训练所用的数据集撞车，就会生成相似结果，进而引发乌龙事件。

然而这样喂养出的大模型始终是英文思维，当遇到成语改写、俗语理解、文章改写这类含有中文语言特色的内容，往往处理不佳，出现翻译错误或潜在文化的偏差。

还有个解决办法就是采集、清洗和标注中文语料，做新的中文高质量数据集，供给给大模型们。

开源数据集众人拾柴

察觉现况后，国内不少大模型团队决定走第二条路，着手利用私有数据库做数据集。

百度有内容生态数据，腾讯有公众号数据，知乎有问答数据，阿里有电商和物流数据。

积累的私有数据不一，就可能在特定场景和领域建立核心优势壁垒，将这些数据严格搜集、整理、筛选、清洗和标注，能保证训出模型的有效性和准确性。

而那些私有数据优势不那么明显大模型团队，开始全网爬数据（可以预见，爬虫数据量会非常大）。

当更多的中文数据集被开源到聚光灯下，行业的态度是欢迎与欣喜。如智谱AI创始人兼CEO张鹏表达出的态度：

中文高质量数据只是被藏在深闺而已，现在大家都意识到这个问题了，自然也会有相应的解决方案，比如数据开源。总之是在向好的方向发展，不是吗？

值得注意的是，除了预训练数据，目前阶段人类反馈数据同样不可或缺。

现成的例子摆在眼前：

与GPT-3相比，ChatGPT叠加的重要buff就是利用RLHF（人类反馈强化学习），生成用于fine-tuing的高质量标记数据，使得大模型向与人类意图对齐的方向发展。

提供人类反馈最直接的办法，就是告诉AI助手“你的回答不对”，或者直接在AI助手生成的回复旁边点赞或踩一踩。

先用起来就能先收集一波用户反馈，让雪球滚起来，这就是为什么大家都抢着发布大模型的原因之一。

现在，国内的类ChatGPT产品，从百度文心一言、复旦MOSS到智谱ChatGLM，都提供了进行反馈的选项。

但由于在大部分体验用户眼中，这些大模型产品最主要的还是“玩具”属性。

当遇到错误或不满意的回答，会选择直接关掉对话界面，并不利于背后大模型对人类反馈的搜集。

So～

今后遇到AI生成回答有错误或遗漏时，

请不要吝惜一次点击，高举你手中的

，让大模型能收集更多的人类反馈。

就像读到这里，不要吝惜对这篇推文点赞、转发、在看一样！（doge）

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

0

点赞

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与华威派无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非华威派）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@goodmaoning.com

律师用ChatGPT打官司，结果被骗引用不存在的案例

2023-05-29 19:20

人工智能现在能有多“聪明”？

2023-05-29 19:20

相关文章

ChatGPT「10 双最好球鞋」！Nike 三款上榜，第一名还得是它 .....

国内ChatGPT软件团灭？上百款APP下架调整，算是意料之中..

地表最强的GPT-3，是在推理，还是胡言乱语？

回到未来！用童年日记训练AI，这个程序员借助GPT-3实现了与“过去的自己”..

60多岁阿姨砸20万追男星，儿子懵了：怎么又是他？

Open AI：听说你们到处说我破产了

微信迎重大更新！网友：很实用

国产ChatGPT+语料库概念第一黑马，万亿估值，有望从7元到90元..

仅两个小时，chat GPT输出跌宕起伏小说|码字小白也可！有图有方法..

关于作者

经典好看视频(普通会员)

点击领取今天的签到奖励!

猜你喜欢

01

抛妻弃女31年，李连杰再次遇到前妻黄秋燕，泪点却在合影的位置上..

2022/09/12

02

豆瓣评分9.0以上的国产剧排行榜豆瓣评分9.0以上的国产剧前十..

2022/09/24

03

盘古和女娲（中国神话故事）

2022/08/27

04

2022离世的11位名人：有人患癌，有人突发意外，有人元旦当天离世..

2022/09/11

05

巨蟹座：一生最旺的颜色，能旺你一生，可以不喜欢，但必须爱上它..

6个月前

06

30个暖心睡前小故事，很甜很撩的睡前小故事

2022/08/26

07

香蕉是如何种出来的？从育苗到收获，揭秘香蕉种植的全过程..

2022/06/02

08

“没有好奇心，人就死了”！喜马拉雅鬼王——杨湃的鬼故事哲学..

2022/08/27

标签云

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索