你好,我是王煜全,这里是王煜全要闻评论。
上周chatGPT的热潮我们主要还是看热闹,大部分都是国外发生的事情,这周已经反转过来,国外媒体已经把目光放到了中国企业身上。
《华尔街日报》发了一篇文章,提到了上周A股和港股的chatGPT概念热,除了百度、阿里因为要推出同样的AI大模型受到热捧,做图像识别的云从科技、做AI数据训练的海天瑞声等一批上市企业也从中受益,搞文字识别的汉王更是靠7连涨停板,登上了好几家金融媒体的版面。
第二轮热潮会在中国版chatGPT真正出现后到来,也就是我们特训营常说的:属于大多数人的「模式创新」机会。
我在分析chatGPT和未来的AI机遇时,有朋友问为什么举的都是国外案例,原因也就在这:中国的“云端AI大模型”才开始研发,大部分应用案例自然要看国外。
那中国的chatGPT何时能出现呢?
面对这个问题,我只能说从技术原理上看相隔并不远,但实际的距离要大得多。
只看表面的参数,chatGPT的进步其实是OpenAI大力出奇迹的结果,表现平平的GPT-2在2019年推出,只有15亿参数,到2020年GPT-3一口气把参数提高到了1750亿,立刻就取得了惊人的效果,chatGPT常被称作GPT-3.5,只是做了一些优化。
考虑到GPT-2整个算法都是开源的,谁都拿得到,看起来似乎只有一两年的技术差距,把参数堆起来是不是就快了?
其实这比大家想象的要难得多,参数规模扩张的背后,既有大量工程调优的经验,也是对算法和数据更深入理解的成果,这其中数据的作用可能超出大家的想象。
OpenAI在推出GPT-3后,分享过一个AI大模型的「伸缩法则」,简单说就是算法参数越大,数据量越高,AI大模型的效果就越好,但他们当时认为算法参数才是重点。
随着谷歌也加入到研究中,大家发现,数据才是更关键的部分,参数规模如何与数据规模匹配,数据质量的高低,对结果都有显著影响。
这也就是说,中国chatGPT的开发既要解决算法上的问题,还要积累一个与超大规模算法匹配的优质数据库,前者靠聪明的大脑或许能加速不少,但后者就是实打实的苦功夫,会成为不少AI企业面对的最大难点。
好在这个领域巨大的市场潜力已经被看见,门槛越高,越会有人投入其中,想要越过门槛拥抱新未来。
我想中国的chatGPT终归还是会出现,只是会比大家想象的慢一些,但只要这个时刻到来,属于中国大多数创业者的机会也就来了。
虽然中国在第一轮浪潮中落后了,但因为我们有更加广泛的应用优势,有望在第二轮浪潮中领先。
我也会持续关注AI技术将如何演进,中国AI产业的格局会如何发展,和大家分享我的产业未来的分析、预测,也欢迎你留言分享你的思考。
以上是今天的内容,更多详细的产业分析和底层逻辑,我会在科技特训营里分享。欢迎关注全球⻛口微信号,报名加入!
王煜全要闻评论,我们明天见!
相关文章
猜你喜欢