DALL·E 3 推理能力炸裂提升，OpenAI 抢跑“ChatGPT 原生”-华威派

> 自媒体 > AI人工智能 > DALL·E 3 推理能力炸裂提升，OpenAI 抢跑“ChatGPT 原生”

DALL·E 3 推理能力炸裂提升，OpenAI 抢跑“ChatGPT 原生”

来源：AI科技评论

2023-09-22

442

管理

而与此前 DALL·E 系列模型相比，根据同一句提示词“一名篮球运动员扣篮、被描绘成一个星云爆炸的油画”，使用 DALL·E2 和 DALL·E3 分别进行图片生成。可以看到，两代模型在生成图片的效果存在明显的差异。

和左侧相比，DALL·E 3 图片中的细节描绘、场景明亮度等效果都更好。

到了 DALL·E 3 的版本中可以看到，小丑和熊猫击掌，小丑明显的五根手指，自行车车轮完全是奶酪元素，包括车轮激起的泥点细节等， DALL·E 3 在理解提示词语义和呈现画面方面有了非常明显的进步。

当在 Stable Diffusion 、MidJourney 中输入相同提示词时，呈现的画面与提示词的关系，不能说一点不同，也差不多是毫不相关。看到 DALL·E 3 的表现，很多网友表示 Stable Diffusion 、MidJourney 无法在这个级别上与其竞争。

就在上周，有消息爆出谷歌正在小范围内测 Gemini，传言称，Gemini 将比 ChatGPT 强大 20 倍，这也给 OpenAI 带来了一定程度上的舆论压力。

随后，OpenAI “悄悄”更新了 GPT-3.5-Turbo-Instruct，此前有消息传出，OpenAI 正紧锣密鼓地将 GPT-4 与类似于 Gemini 提供的多模态功能结合起来，不少业内人士猜测，OpenAI 获将在即将召开的首家开发者大会上发布多模态大模型，比如 GPT-4-Vision。

大模型局势扑朔迷离，作为大模型的引领者，谷歌和 OpenAI 在互相试探，二者真实实力几何，还有多少颠覆我们认知的能力，尚且未知。

目前， DALL·E 3 背后的技术细节并未公布。但在安全和版权保护方面，OpenAI 已对 DALL·E 3 投入了大量的工作，包括采取缓解措施拒绝提供公众人物姓名、与外部的“红队”成员（对模型进行压力测试的团队）合作、在内部开发来源分类器等。

此外，DALL·E 3 拒绝提供在世艺术家风格图像，艺术创作者也可选择将其个人作品从 DALL·E 3 未来图像生成模型的训练中剔除。

据悉，DALL·E 3 将于 10 月初面向 ChatGPT Plus 和 Enterprise 用户上线，用户使用 DALL·E 3 创建的图像无需 OpenAI 授权即可转载或者出售。

下半年，大模型原生应用有望在哪爆发？欢迎添加作者微信（finfl26est和sunpx33）交流，互通有无。

参考链接：https://openai.com/dall-e-3

未经「AI科技评论」授权，严禁以任何方式在网页、论坛、社区进行转载！

公众号转载请先在「AI科技评论」后台留言取得授权，转载时需标注来源并插入本公众号名片。

赏钱

免责声明：本文仅代表作者个人观点，与华威派无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非华威派）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@goodmaoning.com

OpenAI 被曝正在训练多模态大模型，代号“Gobi”

2023-09-22 22:43

人类数据，要被 OpenAI 用完了，然后呢？

2023-09-22 22:41