GPT-4参数最新爆料！1.76万亿参数-华威派

> 自媒体 > AI人工智能 > GPT-4参数最新爆料！1.76万亿参数

GPT-4参数最新爆料！1.76万亿参数

来源：图灵同学

2023-07-04

383

管理

GPT-4参数最新爆料！1.76万亿参数，8个2200亿MoE模型，PyTorch创始人深信不疑近来，美国知名骇客George Hotz在接受采访时透露，GPT-4由8个220B模型组成。这么算来，8 x 220B = 1.76万亿。就连PyTorch的创建者Soumith Chintala对此也深信不疑。GPT-4：8 x 220B专家模型用不同的数据/任务分布和16-iter推理进行训练。如果真是这样的话，GPT-4的训练可能更加有效。而George在接受Latent Space的采访时，对GPT4架构的描述着实让人震惊。他的部分原话如下：GPT-4每个head都有2200亿参数，是一个8路的混合模型。所以，混合模型是当你想不出办法的时候才会做的。OpenAI训练了相同模型8次，他们有一些小技巧。他们实际上进行了16次推断。他特别强调，OpenAI做了8个混合专家模型，任何人可以花8倍资金都能训练出来。也就是说，人们能够训练更小模型更长时间，微调后，就能找到这些技巧。OpenAI曾经发表类似关于让计算量不变的情况下，让训练更好的算法，比较像BatchNorm和NoBatchNorm。

赏钱

免责声明：本文仅代表作者个人观点，与华威派无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非华威派）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@goodmaoning.com

GPT-4满分通过MIT本科数学考试！这套提示词火了

2023-07-04 17:12

推特被马斯克“限流”后，GPT-4等大模型的训练数据没了？

2023-07-04 17:09