> 自媒体 > AI人工智能 > 交钱!StackOverflow:类ChatGPT们用我数据训练得付费
交钱!StackOverflow:类ChatGPT们用我数据训练得付费
来源:量子位
2023-04-24
150
管理

金磊 发自 凹非寺

量子位 | 公众号 QbitAI

ChatGPT,遭到了一波反向收费。

而管OpenAI要钱的,正是全球最大程序员问答网站StackOverflow。

理由是这样的:

你们拿我家的数据去训练AI了。

不得不说,这波围绕类ChatGPT展开的“商战”着实有点意思。

不过围观的网友们就不那么乐观了:

唯一没有获利的……好像就是用户了。

科技巨头们要为训练数据买单了

我们都知道,训练一个像诸如ChatGPT这样的AI,背后定然需要海量的数据。

无论是OpenAI、谷歌、微软、Meta或是其它公司都是如此。

但这些科技巨头们一般获取这些数据的方式都是从网上抓取,也因此不会给对应数据背后的公司掏钱。

他们所获取的数据来源,就包括了StackOverflow、Reddit在内的数千个在线“资源”。

然后科技巨头们就会将这些数据“喂”给大模型,让对话AI变得更聪明、更智能。

待产品们成熟可以“上岗”之后,科技巨头们就会开启付费模式,例如我们熟知的ChatGPT Plus、GitHub Copilot等等。

据了解,StackOverflow和Reddit目前都没有对数据收费做明确的公示,而且价格也没有定下来。

但另一方面,各种大语言模型背后的企业,也正在努力降低开发的成本。

将来若是训练数据都要收费了……那这部分成本又将会有谁来买单呢?

反正Reddit CEO的表态是:

爬取Reddit数据产生了价值,却不将任何价值返还给我们的用户,这是个问题。

会怎么收费?

虽然目前StackOverflow和Reddit都没有明确训练数据的价格,但有媒体猜测,他们可能会借鉴马斯克推特的“定价路线”。

例如在这个月,马斯克就提高了访问推特数据的价格——42000美元/5000万条推文。

更戏剧性的是,马斯克前一阵子还以“OpenAI非法使用推特数据训练”为由,准备起诉OpenAI。

而不仅是文字领域,在图片生成领域,因训练数据而产生的纠纷也是屡见不鲜。

例如Getty Image就在此前起诉了OpenAI的对手Stability AI。

理由是涉嫌使用超过1200万张照片且之前没有寻求过许可。

……

至于像StackOverflow和Reddit最终将如何定价,还需要等待他们官方的表态。

但值得明确的一点是,随着这一波AIGC热潮的到来,其背后的各种“规矩”,是值得深入探讨、商定了。

参考链接:[1]https://www.wired.com/story/stack-overflow-will-charge-ai-giants-for-training-data/[2]https://qz.com/reddit-ai-bots-training-payment-1850352526[3]https://twitter.com/ruchowdh/status/1649168431063736320

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

0
点赞
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与华威派无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
凡本网注明 “来源:XXX(非华威派)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。
QQ:2443165046 邮箱:info@goodmaoning.com
关于作者
雷振杍(普通会员)
点击领取今天的签到奖励!
签到排行
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索