GPT4震撼发布！最大变革在「一切数据Token化」-华威派

> 自媒体 > AI人工智能 > GPT4震撼发布！最大变革在「一切数据Token化」

GPT4震撼发布！最大变革在「一切数据Token化」

来源：第一财经

2023-05-05

237

管理

3月15日凌晨，OpenAI正式发布了大家期待已久的GPT-4，很快就在中外科技圈刷屏了。

这款新的AI大模型确实拿出了一些新东西，不但理解能力、可靠性、输入处理长度上都有显著提高，还有一个重大进化——拥有了多模态的能力，简单说就是不仅能看懂文字，也能看懂图片了。

当时我预测AI会是这轮变革中重要的颠覆力量，如今OpenAI用实际行动证明了这个趋势正在到来。

AI大模型能使用多种类型的数据训练，其实已经是非常常见的事了。

OpenAI自己的AI绘画软件Dall-E就是基于GPT-3，用图片数据训练出来的，他们之前还做过分享，一张图片最长会被转化为1024个Token，打个不准确的比方，相当于所有图片都会拉成一个长条，AI是通过这些长条上的数据掌握经验的。

谷歌去年5月在这方面做的更为极致，他们将图片、文字、机器坐标等数据全部Token化，AI经过训练后分类掌握各种经验，然后根据实际情况，匹配对应Token中的经验，一下就拥有了完成600多种任务的能力。

GPT-4这次实现的多模态进化则是再前进了一步，以前图片数据训练出的AI也就是用于生成图片，或者识别某些具体的物品，这次体现出对图片信息更强的理解能力，提供了图片数据处理的新方案，这背后潜在的价值难以估量。

由此我们也会看到，AI的数据需求同样还会继续爆发，在文字数据之后，各种图片数据的标注需求将是新的热点。

我可以这样说，未来所有的数据都会Token化，衡量数据质量的标准将不再是清晰、完整这些为人服务的指标，而是能拿来训练AI的数据才是好数据。

可以说，数据Token化，就相当于石油精炼成汽油的过程，会使得人工智能这个发动机得到广泛运用，最终无所不在。未来各个领域的人工智能水平，甚至能用Token化的数据量大小来做评估。

（作者为海银资本管理合伙人）

1

点赞

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与华威派无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非华威派）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@goodmaoning.com

惊呆！GPT-4“越狱”计划曝光，引诱人类帮助

2023-05-05 20:00

真·量子速读:突破GPT-4理解50页文本限制，新研究扩展到百万token

2023-05-05 19:59

相关文章

ChatGPT爆火出圈，国际政治的“算法时代”即将到来？

成为GPT-3的甲方，让它来帮你设计网站

OpenAI 的起步、现状和未来：让人工智能飞一会儿

从知识库到交互机器人：GPT教程助你搭建基于内容的智能对话系统..

有了ChatGPT，我们还用不用学习？

OpenAI 首次公开收购初创公司 Global Illumination：致力于核心产品 ChatGP..

微信新功能“火”上热搜！其实还有这些隐藏功能，你知道吗？..

ChatGPT：今天说说近期的东南亚嘎腰子

能写论文能聊天，这款机器人是“天使”还是“魔鬼”|新京报专栏..

关于作者

冷冷的太阳(普通会员)

点击领取今天的签到奖励!

猜你喜欢

01

抛妻弃女31年，李连杰再次遇到前妻黄秋燕，泪点却在合影的位置上..

2022/09/12

02

豆瓣评分9.0以上的国产剧排行榜豆瓣评分9.0以上的国产剧前十..

2022/09/24

03

盘古和女娲（中国神话故事）

2022/08/27

04

2022离世的11位名人：有人患癌，有人突发意外，有人元旦当天离世..

2022/09/11

05

巨蟹座：一生最旺的颜色，能旺你一生，可以不喜欢，但必须爱上它..

6个月前

06

30个暖心睡前小故事，很甜很撩的睡前小故事

2022/08/26

07

香蕉是如何种出来的？从育苗到收获，揭秘香蕉种植的全过程..

2022/06/02

08

“没有好奇心，人就死了”！喜马拉雅鬼王——杨湃的鬼故事哲学..

2022/08/27

标签云

1

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索