复刻中文chatgpt的难点分析-华威派

> 自媒体 > AI人工智能 > 复刻中文chatgpt的难点分析

复刻中文chatgpt的难点分析

来源：三维棱镜

2023-09-19

155

管理

复刻chatGPT的几个难点：

1.资金方面，OpenAI其核心语言模型GPT-3的单次训练成本高达460万美元。如果投资5000万美金，也只够GPT-3进行十次训练。

2.模型方面，OpenAI已经探明道路，也发表了论文，Meta也开源了一个类似的AI大模型，这块相对难度小一些。

3.训练GPU方面，美国已对中国禁售高端GPU，而运行AI大模型需要大量GPU，将影响AI大模型训练。跑通一次100亿以上参数量的GPT模型，至少要1000张GPU卡连续训练一个月。（英伟达A100，价格是五万元一个，GPT-3 参数在1750亿个参数，chatGPT参数更多）

4.人力方面，训练一个有一两千亿参数的大规模语言模型，需要大量的人工调教和用户数据反馈。

5.语料数据方面，大模型所需的语料。

大量的数据都在互联网上，主要难度在于如何清洗出好数据。清洗数据本是个脏活累活。且中文互联网资料已经孤岛化，数据都在各大互不相通的APP上。如果语料不好，很有可能模型越训练，效果越匪夷所思。

6.中文训练难度更高，中文的语法较英文更松散灵活。

总结

初创公司复刻中文chatgpt成功概率极低。很有可能花了大量资金，最后训练出来的模型与以前的检索模型差不多。

0

点赞

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与华威派无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非华威派）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@goodmaoning.com

我们请ChatGPT写了两篇高考作文，结果有点“翻车”

2023-09-19 08:30

ChatGPT：会中文的AI文字工具，不亚于iPhone4的发布！

2023-09-19 08:26

相关文章

OpenAI CEO 发推警告称 AI 工具 ChatGPT 存在明显局限性

多位畅销书作家起诉“ChatGPT”侵犯知识版权

OpenAI 发布 GPT-4，部分已超越人类水平

你的ChatGPT数据能不被拿去训练模型了！代价是「只聊天不记录」..

ChatGPT重塑Windows！操作系统全面接入，Bing也能用插件了..

OpenAI反水微软！Altman密谋私人订制ChatGPT，AI市场又要变天？..

如何通过微信号查到对方聊天记录？怎么查对方都在和谁聊天..

飞苹果应邀出席AIGC创建者大会：AI不会取代人类

GPT-4“终极大揭秘”:1.8万亿巨量参数、训练一次6300万美元!..

关于作者

经典好看视频(普通会员)

点击领取今天的签到奖励!

猜你喜欢

01

抛妻弃女31年，李连杰再次遇到前妻黄秋燕，泪点却在合影的位置上..

2022/09/12

02

豆瓣评分9.0以上的国产剧排行榜豆瓣评分9.0以上的国产剧前十..

2022/09/24

03

盘古和女娲（中国神话故事）

2022/08/27

04

2022离世的11位名人：有人患癌，有人突发意外，有人元旦当天离世..

2022/09/11

05

30个暖心睡前小故事，很甜很撩的睡前小故事

2022/08/26

06

巨蟹座：一生最旺的颜色，能旺你一生，可以不喜欢，但必须爱上它..

3个月前

07

香蕉是如何种出来的？从育苗到收获，揭秘香蕉种植的全过程..

2022/06/02

08

“没有好奇心，人就死了”！喜马拉雅鬼王——杨湃的鬼故事哲学..

2022/08/27

标签云

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索