一个简单的聊天搜索引擎,一个业界程序员完全看不起的机器学习马甲,却能搅动全球科技产业。ChatGPT真的和我们想象中的那么简单吗?国产之路又在何方呢?
从上面这张对比图你就可以知道,在复杂问题面对测试用例上,GPT-3可以说是遥遥领先前两代模型。而其数据规模甚至是2019年发布的GPT-2的100倍有余。
GPT-3一经发布,就成为全村的希望。
如果你之前关注过AI,你就会知道当时GPT-3引来了很大的业内关注,然而正如很多大数据产品一样,首先GPT-3虽然能够依托互联网快速反应、回复内容,但其可靠性不佳仍然是一个记忆引擎。其次,想要发挥其最大的能力,就必须有足够多的“投喂”,而对于GPT-3而言,这个数量是一个天文数字。
于是,基于ChatGPT-3.5技术,openAI首次以混合引擎的方式向公众提供免费的使用,而使用方法十分简单,即使不懂得编程的人,只要会打字,就可以参与到训练模型的工作里去。
GPT-3.5通过吸收大量来自网络的内容,包括成千上万的维基百科条目、社交媒体帖子和新闻文章,来学习句子、单词和部分单词之间的关系。
穿上了“聊天机器人”的马甲,相比原先小程序里经常犯傻的AI聊天机器人,ChatGPT可以算是跨越式发展,从语言模型里理解复杂的文字、从网络知识和记忆模型里拼凑答案,虽然可靠性仍有待提高,而且目前也没有表现出真正意义上的”智能“也就是创造。但作为辅助工作的AI助手,已经具备极高的商业价值。
国产为什么不迈进?是故意的还是不小心的这一点就是在于商业价值这一概念了。
对于国内巨头而言,短平快的科技项目由于回笼资金快、市场好垄断、投资人乐意掏腰包,使得这类型的项目充斥于科技行业。而需要大量时间和人力成本,且产生商业价值和周期过长,就基本不会碰。
其实,这一点在华为麒麟芯片上就可见一斑。
华为需要研发和迭代芯片,就需要展现其商业价值。所以当年荣耀的低端产品或者与运营商的合作手机,都基本采用了麒麟芯片,虽然使用体验不佳,但借助合作出货和低成本倾销,让麒麟芯片能够等到展现商业价值的那一天。
但是,这款芯片依旧是ARM架构,这就意味着麒麟芯片是站在ARM芯片成熟市场上,用着成熟的技术,规避了从0开始和生态建设的成本。即便如此,也用了超长的时间周期,才为市场证明了芯片的价值。
这个时候我们再反观ChatGPT。
从仅仅是一个Transformer的概念,到GPT模型的建立,再到指数型增长的如今,这里面的成本让资本市场瑟瑟发抖,依靠资本市场去盘活这样一个概念,直到它落地生根,在国内几乎没有可能性。
甚至到目前为止,ChatGPT没有通过广告、会员费等等回笼资金,但很多巨头比如微软、谷歌、苹果等等却都主动与其合作,使该引擎与成熟的商业产品结合,发挥出极大的商业价值。
而知名的如百度、腾讯等巨头,则站在成熟的市场上,开始进军“类ChatGPT”的方向,而不是通过研发创造新的AI方向或模型。
复旦大学计算机科学技术学院教授邱锡鹏团队最新发布的国内第一个对话式大型语言模型,这个被称作中国版ChatGPT的产品,悄然上线,又匆匆关闭,却用大火的“MOSS”名号,赚足了吆喝和研发经费。
国产GPT的破局之道?其实很简单中国并不缺少有能力、有想法的科技企业和科研人员。
缺少的,只是巨头们的思路。
我们需要的,是从“拿来主义”变成“创造主义”,科研和科技的进步,并不全依赖商业价值。比如OPPO的马里亚纳计划,即使知道自研芯片的路不好走,但有华为麒麟这一前辈的成功,还是选择用更长远的目光。
AI、智能,还有已经被国内抛弃的AR、VR这些过时的概念,在谷歌、微软等巨头的眼里,还是没有孵化成功的蛋,所以他们依然投入了大量的资金在推动这一技术的铺开和革新。
中兴及旗下的努比亚、红魔,虽然知道屏下摄像头技术不成熟,但依然用大量的产品推动这一技术的更新换代,甚至在MWC2023上,还计划展出带有裸眼3D技术的平板电脑。
所以,如果只想做出ChatGPT,那么商业合作一下可以轻松做到。但是,ChatGPT所应用的技术已经是过时的GPT-3.5了,GPT4、GPT5早已整装待发。如果明天有了MusicGPT,后天出来个ChatKPT,我们依然还选择商业合作和拿来主义吗?
从“挣快钱”的思路转变,或许才是真正的破局之道!
相关文章
猜你喜欢