ChatGPT 的出现将 AIGC 这个概念捧上了热度高点,但是在讨论热度过后,ChatGPT 的发展还需面临一个关键问题,即其如何才能实现商业化落地,找到后续的发展路径?那么对 ChatGPT 而言,有哪些可以参考的商业化落地方向?
前言:我希望谨慎地做出判断虽然媒体狂欢、大厂跟进,所有迹象都表明一个新时代正在到来。
但是在前文发布后,我和很多人进行了交流。给我印象最深刻的就是,有些朋友在表达感谢后,总会忐忑地追问一句——“你觉得ChatGPT方向能落地吗?”
他们中有面临职业抉择的打工人,有跃跃欲试的创业者,有二级市场的冲浪者,有一级市场态度谨慎的投资人。所有人都在岸边谨慎、克制地观望。所以,究竟能落地吗?如果能,是100%完全能吗?哪些方向可以哪些方向不可以?如果不可以,那么为什么不可以?
因为少年时的AI幻想成真感动感动是一回事,客观的现实又是另一回事。而且当我的建议会对其他人产生影响,这就愈加让我谨慎。
OK,前言就到这里,我将开始我的推理过程,向你展示我整个过程中的所思所想。
如果你对推理过程不感兴趣,可以直接看结论——“我相信他能够成功落地,并且将是一个时代的开始。”
但是我更希望你跟随我的思考过程,就像GPT模型中用到的思维链CoT技术一样,我们“think step by step”,当每个环节都清晰无误时,最终的答案也将更值得信任。
第一步:开始思考前,想清楚如何思考我们需要更清晰地定义我们的问题,从我们自身的角度出发(打工人、创业者、投资者等)。并在随后围绕定义来确定我们要去加载哪些方面的知识,并基于这些知识做出符合利益和逻辑的推理。
我所寻求的答案是“AIGC这波狂潮能否落地”,那么:
01首先,这是一门生意。而生意的本质就是价值交换,并在过程中积累剩余价值。所以他的首要原则一定是能跑通商业模式,赚到利润。
当然,生意要赚到钱是谁都知道的道理。AI绘画也能赚到钱啊,有人靠激励广告打平收益,有人拿到了融资,有人延伸出了提示语买卖。
02是的,所以我还期望他具备足够宽度的赛道,能够支撑百花齐放。因为这样对于打工人来说,他进入这个方向才足够宽阔,拥有突破天花板的可能,对创业者来说市场的机会足够多,避免扎堆死在沙滩上,对于一级市场投资者来说有足够的种子进行选择试错,对于二级投资者来说,百花齐放的涌现才是这个赛道长久生长的推力。
在这里我们观察一下AI绘画,他的赛道是不是一眼就望到了尽头?你敢投入其中吗(此处假装忽略Diffusion技术后续的潜力)?
然后,找到03 新技术带来的增量市场。。
我们要避免被媒体词语迷惑。什么是媒体词语?就是标题中的“AIGC”。
事实上这波狂潮中只有AI绘画背后的Diffusion和ChatGPT背后的GPT这两项技术产生了应用端的突破。但是AIGC词语一造出来,干涸的互联网终于迎来了久违的新概念,媒体迫不及待将他扶上王座,绘制出一张张行业全景图。
但事实上真正因为这两项技术发生影响的行业是哪些?受到影响的行业就一定存在增量机会吗?我搜集材料时一般刚开始的时候是不看投研式的报告的,很宽很全,但是好像知识从脑子流淌过去,看完什么也没留下。
特别做过汇报PPT的人应该知道,很多时候为了结构式美观,你会硬凑信息,比如这个产业链只有2条不好看呀,我凑够3个来个金字塔布局。这种信息会误导思维框架的的建立,我一般是建立了体系化认知再去看报告来补充参考的。
第二步:开始组装知识框架在有了思考的方向后,我们需要构造知识框架,哪些重要、哪些不重要、哪些要素之间互相关联、影响、先后顺序是什么等等。
首先,搞钱是最重要的,即核心场景,第一个要做的就是盘点应用场景,客观评估其商业模式及可行性。
其次,场景不是独立存在的,有大量因素影响制约。其中影响最大的是技术,其次可能是政策、道德等。
最后,我们在知识收集过程中,必定面临一些困难。例如自身的知识洼地无法跨越,或是元素过多无法穷尽,我们需要应用一些抽象、指代的方法来跨过这些障碍。
基于上述原则,形成我们的收集框架:
优先梳理商业部分,并在遇到知识洼地时采用抽象要素、同理推断、指代推断等方法。
技术现状决定当前生意是否成立,技术潜力决定生意的上限天花板。作为重要支撑因素进行分析。
限制因素如道德、政策、版权等,对主干不构成影响,放到最次优先级大概看看就行,对行业未来可能的限制稍作了解。导图见下方:
对了,补充一下接下来这篇文章将只分析GPT是否能够落地,不涉及AI绘画,这是因为:
1)我做不到
AI绘画的材料我收集了,但是还未整理,后续会有一篇《AI产品经理视角下的AI绘画全解析》。我要等那篇文章写完了,思路才会清晰,没想清楚之前我就不乱说了。
2)其实也没必要
两项技术虽然都具备突破性,但目前ChatGPT的延伸方向、变革程度,都是远远高于Diffusion的,所以如果ChatGPT能论证成功,不用等AI绘画,我们也可以推出标题中的答案。
第三步(1):基于框架进行知识填充——商业篇我们先说盈利模式和成本控制两部分,然后带着相关认知去盘点场景。
1. 盈利模式互联网主流盈利模式无非三种:
1)广告/流量模式
通过免费产品吸引用户使用,促使用户投注大量时长/频率,再从中切割广告流量从而盈利。在目前短视频、中长视频、游戏、小说的围剿下,我不看好ChatGPT所创新的应用能够抢夺足够份额的时长。边角料的时长空间或许可以,但上限不够大。
而且一旦涉及时长争夺,我们所描述的肯定是C端娱乐应用。对于有野心的玩家来说,是很难接受让广告突破用户体验的。
不过小规模应用其实可以考虑,特别对于独立开发者来说,激励广告变现是一个很好的方式,虽然我手里没有数据,但AI绘画在过去的半年内已经证明了可以实现收益打正。
From《VUI设计方法分享》
不过游戏方向是非常特殊的,技术能够为他带来改变,但他的成功绝不会只靠技术。事实上,全智能NPC、全智能任务只是一种新颖的设计。真正一款游戏好不好玩,能不能打动人心,还有非常多题外的因素。
另外技术是否还能应用到其他领域呢?例如NPC决策逻辑,世界背景构建,新语言创造等——我不知道,但对技术永远抱有期待。希望绿洲早日来临!为了部落,waaaaagh!
最后收尾总结一下:游戏领域是一个100%的旧市场,但又和客服机器人、工具机器人不一样,新技术可能让这个领域出现颠覆性的新玩家。补充:或许MUD类型游戏会重新闪亮出场?这种类型可以甩开音乐、UI、建模等诸多成本,最先吃到这波技术升级的红利。利用好玩家们对新技术的新鲜感应该会有一波流量,但后续留存就难说了。
8. 是否还有其他方向?在上文列举的文本生成、Chatbot、代码生成,其实是ChatGPT演示中直观带给我们的灵感,只是在落地过程中,随着参赛者的选择,逐步延伸向了各自的细分方向。而游戏方向则是典型的,GPT技术 其他行业逻辑构造出的延伸方向。因此我们可以想象类似游戏这样的扩展行业还有很多,只要他的行业中有大量关于文本的应用——哪个行业不是呢?
例如教育行业,能不能用GPT梳理、查找关联知识点?金融行业,能不能用GPT阅读会计报告、合同文件进行分析?我不知道哈哈,暂时没有case,等待新玩家们涌现。
第三步(2)基于框架进行知识填充——技术篇技术篇非常简单,我们不再科普技术原理,技术原理已经在前文万字长文:AI产品经理视角的ChatGPT全解析中大篇幅讲过了。我们重新基于应用角度,梳理当前技术的现状及潜力。现状决定短期内哪些能做哪些不能做,潜力决定未来横向、纵向的扩展可能。大家可以用这些认知来扫描任何新出现的应用场景。
1. 技术现状1)结果不稳定,需要review需要Review,就意味着大部分场景不能脱离人,只能辅助人。除非你在做一些完全不在乎质只在乎量的市场,例如营销号、SEO、刷评论。
2)推理能力弱,容易推出看似正确的错误答案结构复杂、逻辑复杂的场景无法适配,例如长篇小说容易颠三倒四,教育应用也要谨慎用在理工科方向的问题上。
3)知识更新困难,成本巨大知识无法通过Prompt获取,源头只来自LLM中的1750亿参数,更新一次知识成本高,速度慢。所以无法适配需要紧跟时事的场景——但这不意味着不能用来摘要新闻,毕竟天底下无新鲜事。
4)延迟较高,实时场景不适配截止昨天2月3日我已知的信息是接口延迟在1~2S(可能有误),所以暂时语音助手这种实时响应要求高的会不适配。但我觉得这个问题应该很快会被解决,工程问题无法求解是没看到蛋糕,只要看到蛋糕性能迭代是非常快的,AI的演进历史本身就是一部效率迭代的历史。
5)垂直领域表现未达最佳这里的垂直领域包含两种解释,一种是技术侧的垂直领域,例如自然语言理解类的任务,暂时仍是BERT更优。另一种是行业侧的垂直领域,例如法律、心理、金融等。我猜想一个原因可能来自原始训练数据中缺乏高质量的文本数据。
From《Language Models are Few-Shot Learners》模型预训练训练中所用到的数据集
6)可挂载其他模块,但目前没有标准方法目前看到的一些方式是,用GPT作为输入端,再用其他工具作为逻辑端,例如GPT unity,GPT Wolfram | Alpha。
一方面是这些挂载目前都是自发行动的,后续有可能会出现标准规范的GPT引用方式,甚至可能大部分应用会以“本店支持GPT-3”做为荣誉标识。另一方面我还没看到更深层次、更触碰GPT底层逻辑的实践。
现在的实践本质上和ifttt有点像,是两个应用的解耦式联合。是否能实现更深层次的呢?例如我们前面说的知识更新困难,有办法通过挂载一个小规模的实时知识库来实现吗?不知道,等待玩家们的表现。
2. 技术潜力1)更通用说白了就是从Text-Text到Text-everything。GPT已经证明了在NLP领域的统治力,而图像、语音、视频等多模态,其实只需要Text-多模块的若干转译通路。我没有针对性地搜集信息,但至少Text-image的通路是现成、成熟的。Stable Diffusion中一个关键技术就是OpenAI所提供的CLIP(Contrastive Language-Image Pre-Training)。
2)更便宜经过商业模式部分的分析,我们可以相信这个方向的应用潜力是巨大的。当应用可行时,配套的上下游产业链会快速出现,包括芯片、算法平台、专属云服务等等。不过前面就说了,上下游产业链不做分析,整个结果是不证自明的。我们只需要知道,按照逻辑推理,更便宜是100%会出现的就可以。
3)更强大一方面的提升来自于多种GPT方向大模型的尝试落地。目前大厂们哪怕在短时间内会与OpenAI展开合作,但除了微软以外,应该都无法忍受上游关键技术握在其他人手里。因此可预见的GPT的最上游会出现复数玩家来一起尝试。
另一方面的提升来自模型结构的改进,2023年学术界的关于这方面的paper肯定会爆炸的。唯一限制他们的就是学术界如何绕开大模型训练成本这一难关。应该会形成企业-学术这样的合作通道。最后一方面来自各种垂直方向的适配调优,前面在分析商业模式盘点场景的时候已经举了很多例子了。
第三步(3)基于框架进行知识填充——限制篇在国内其实限制部分不用太快关注。毕竟我们现在是全面落后的状态,整体的趋势肯定是先追赶,再监管。反而海外因为OpenAI一枝独秀,对相关方面的限制其实已经初现波澜。下面大概展开说说:
1. 道德方面1)有害言论。训练数据质量 模型不可控性导致AI的回答像一个定时炸弹。目前的优化方式一方面是基于RLFH技术进行针对模型的道德训练,另一方面是在答案输入输出时加装敏感过滤器。
2)教育危机有一些美国大学封禁ChatGPT之类的新闻,事实上这不是一个噱头。尽管模型的有很多缺点,但至少在社科人文类上表现还不错。这个情况有点像当初的“以图搜题”,后续可能会有政策要求对这方面进行限制。
3)内容泛滥这个问题是在AI绘画领域、虚拟人领域都出现过的。抖音、小红书等平台,已经在限制基于AI绘画的账号。视频号之前也禁止完全虚拟人直播,只允许中之人类虚拟人直播(现在还限不限不清楚)。本质上这是每个内容社区都会做的事情,内容质量和内容数量之间,永远会倾向质量。
但是对AI生成内容的检测,现在还没有太好的方法。anti-spam这个领域如果不成功,以后的信息搜集将让人绝望。感觉都可以看到营销号改名机器号的那一天。
某平台账号限制说明
2. 技术代差/封锁1)技术代差在这方面我不是专家。但看大厂PR稿,全是乐观,看技术大神的言论,全是焦虑,我也看不懂了。我还是相信大神们多一些,但也对国内跟进速度抱有期待。毕竟上一轮AlphaGo浪潮所代表的落后,最后也迎头赶上了。
2)技术封锁DDDD。
3. 政策、版权有一个法规:《互联网信息服务算法推荐管理规定》,我从里面找到了一些两句相关的话,贴给大家参考一下:“发现未作显著标识的算法生成合成信息的,应当作出显著标识后,方可继续传输”“不得生成合成虚假新闻信息”而版权方面目前没有相关消息出来,炒得最多的还是AI绘画领域,大家搜一搜就有新闻了,我就不多说。
重点说说GPT的版权问题。先跟我看下面这张图:
模型训练的语言分布,中文5%左右
在ChatGPT的体验中,我们并没有太发现他有摘抄、洗稿的痕迹。是否有一种可能是,他的原始素材中,中文占比仅为5%?
如果国内基于中文语料重新训练属于我们的GPT后,是否有导致AI直接抄袭语料中的答案,或者稍微洗稿后吐出?
这个答案只能等待国内的GPT模型落地我们才能看到结论了。但如果基于这种猜测,中文高质量语料会变得炙手可热,比如知乎社区以及百度百科,另外人工标注训练也可能会迎来一波春天。
第四步:推理出最终答案经过上面的知识填充,我们最终得到这样一张图:
我们接下来就要基于我们上述所有收集到的知识进行判断。而我的判断结果也很简单,就是开篇那个——“我相信他能够成功落地,并且将是一个时代的开始”。当然,会附带一些小补充、小限制:小心旧技术市场,小心媒体词语的迷惑,关注技术的更新等等。
是的,这一步就这么简单哈哈。事实上做决策最难的永远是信息收集,当拥有足够信息时,答案近在眼前——是的我说的就是拉普拉斯妖。我相信能看到这里的朋友,应该心中也有自己的那份判断了。
本文由@马丁的面包屑 原创发布于人人都是产品经理,未经许可,禁止转载。
题图来自 Unsplash,基于 CC0 协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。
相关文章
猜你喜欢