基于GPT-3和DALL-E的漫画生成-华威派

> 自媒体 > AI人工智能 > 基于GPT-3和DALL-E的漫画生成

基于GPT-3和DALL-E的漫画生成

来源：新缸中之脑

2023-05-21

181

管理

我花了上个月的时间探索如何使用 OpenAI 的 GPT-3 文本生成器和他们的 DALL-E 图像到文本系统来创建新的漫画，而无需编写任何源代码。请注意，这两个系统都处于测试阶段，在我用完所有免费代币后，它们开始收取象征性的使用费。不过效果还不错！并且 OpenAI 授予用户将其生成的材料用于商业目的的权利。

它想出了一些不错的点子。

1. "ML Mayhem"2. "G33k5 Uprising"3. "Coding Crazy"4. "Cyber security Shenanigans"5. "The Great Cloud Catastrophe"10、为 M.L. Mayhem创建角色

我喜欢 ML Mayhem，但我将其风格化为 M.L. Mayhem。然后我要求 GPT-3 创建主角。生成的文本以粗体显示。

Create lead characters for a new techy comic strip called "M.L. Mayhem"1. Millie is a brilliant young coder who spends her days creating new ways to make life easier for her friends and family.2. Lily Nguyen is Millie's best friend and closest confidante. She's always there to offer a listening ear.3. Mayhem is the name of the extremely powerful AI system that Millie accidentally created. It has a mind of its own and is always causing havoc for Millie and Lily.

好的，我知道它在那里做了什么。名字是 M.L. Mayhem，所以它命名为主要主角米莉和莉莉。嗯，M和L。很聪明！造成严重破坏的 AI 系统的名称叫做 Mayhem。干净整洁。

11、为三个面板创建场景

接下来，我要求 GPT-3 为三个面板生成场景和对话。

Create a scene and dialog for a three-panel techy comic strip called "M.L. Mayhem."CHARACTERS: Millie is a brilliant young coder who spends her days creating new ways to make life easier for her friends and family.Lily Nguyen is Millie's best friend and closest confidante. She's always there to offer a listening ear.Mayhem is the name of the extremely powerful AI system that Millie accidentally created. It has a mind of its own and is always causing havoc for Millie and Lily.PANEL 1 SCENE: Millie is sitting at her computer, her fingers flying across the keyboard as she codes. MILLIE: I'm almost finished with my latest project. I can't wait to show Lily!PANEL 2 SCENE: Lily is sitting on the couch, reading a book.LILY: I can't wait to see what Millie has been working on. She's so brilliant! PANEL 3 SCENE: Millie's computer screen is flashing red and an error message is displayed.MILLIE: Oh no! What have I done?12、为多面板漫画创建图稿

对于这个任务，我真的扩展了 DALL-E 的能力。前两部漫画只有一个面板，但我需要为这一个创建三个面板，并使角色的外观保持一致。

这是我用来创建基本图像的三个提示。

Panel 1: "A techy comic strip where Millie, a brilliant young coder, is sitting at her computer typing."Panel 2: "A techy comic where Lily Nguyen is sitting on the couch, reading a book."Panel 3: "A techy comic, Millie, a college student with red hair and a green shirt, is working on her computer, the screen is showing an error message, and her friend Lily Nguyen, wearing a black shirt and blue sweatpants, is watching in horror."

请注意，我不得不对提示进行一些文字加工，以尝试为角色获得某种程度的视觉一致性。 DALL-E 为三个提示中的每一个生成了四个版本的图像，这里是最好的。

总的来说，这些都很好。但是，除了乱码之外，第三个面板中的视觉一致性也存在重大问题； DALL-E 不知道角色应该是什么样子。根据提示，它只是尽力而为。

13、创建角色研究

为了让角色更真实，我首先在 Photoshop 中润色了图像，然后创建了一个带有 3x2 网格的模板，并在左上角渲染了 Millie。我让六个面板中的五个保持透明。模板的大小为 1024x1024，这是 DALL-E 的工作分辨率。

然后我将模板上传到 DALL-E 并使用提示编辑图像，“Millie 的漫画人物研究，一位才华横溢的年轻大学生和编码员，以六个不同的姿势从侧面和正面展示她。” 这是结果。

显然，DALL-E 知道什么是角色研究，并且在以不同姿势呈现我们的主角方面做得相当不错。

为了创建最终的片段面板，我选择了其中一个姿势并将其与透明背景上的 Lily 图像的一部分一起粘贴到 Photoshop 中。我擦掉了他们脸上的一部分，看看 DALL-E 是否可以根据提示填写他们的表情，“米莉的一个技术漫画，一个大学生在她的电脑上工作，屏幕显示可怕的错误信息，她的朋友 Lily Nguyen 看着吓坏了。” 这是结果。

该系统在细节方面做得很好，比如米莉的手在她的键盘上打字，并为她提供了双显示器设置。

这是在 Photoshop 中进行更多清理后最终的三面板漫画的样子，以及来自 GPT-3 的对话中的气泡一词。

14、最后的想法

比较这两个系统，我发现 GPT-3 在生成文本方面比 DALL-E 在艺术作品方面做得更好。尽管漫画的初始图像作为概念渲染看起来还不错，但它们需要进行一些清理才能用于生产。但主要问题是 DALL-E 不能为漫画连贯地生成角色。主要限制源于 DALL-E 中的 1024x1024 图像大小。请注意，OpenAI 最近添加了一个新的“outpainting”功能，可以更轻松地添加到生成的图像中。但是，新功能只能以零星的方式发挥作用。它只考虑用于图像生成的 1024x1024 帧。该系统需要一个“上传参考帧”功能来一致地生成视觉元素，比如漫画人物。

原文链接：http://www.bimant.com/blog/gpt-comics-generation/

赏钱

免责声明：本文仅代表作者个人观点，与华威派无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非华威派）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@goodmaoning.com

理解GPT-3: OpenAI最新的语言模型

2023-05-21 20:18

GPT-3来了！1750亿参数，告别微调

2023-05-21 20:17