我花了上个月的时间探索如何使用 OpenAI 的 GPT-3 文本生成器和他们的 DALL-E 图像到文本系统来创建新的漫画,而无需编写任何源代码。 请注意,这两个系统都处于测试阶段,在我用完所有免费代币后,它们开始收取象征性的使用费。 不过效果还不错! 并且 OpenAI 授予用户将其生成的材料用于商业目的的权利。
1. "ML Mayhem"2. "G33k5 Uprising"3. "Coding Crazy"4. "Cyber security Shenanigans"5. "The Great Cloud Catastrophe"10、为 M.L. Mayhem创建角色
我喜欢 ML Mayhem,但我将其风格化为 M.L. Mayhem。 然后我要求 GPT-3 创建主角。 生成的文本以粗体显示。
Create lead characters for a new techy comic strip called "M.L. Mayhem"1. Millie is a brilliant young coder who spends her days creating new ways to make life easier for her friends and family.2. Lily Nguyen is Millie's best friend and closest confidante. She's always there to offer a listening ear.3. Mayhem is the name of the extremely powerful AI system that Millie accidentally created. It has a mind of its own and is always causing havoc for Millie and Lily.
好的,我知道它在那里做了什么。 名字是 M.L. Mayhem,所以它命名为主要主角米莉和莉莉。 嗯,M和L。很聪明! 造成严重破坏的 AI 系统的名称叫做 Mayhem。 干净整洁。
11、为三个面板创建场景接下来,我要求 GPT-3 为三个面板生成场景和对话。
Create a scene and dialog for a three-panel techy comic strip called "M.L. Mayhem."CHARACTERS: Millie is a brilliant young coder who spends her days creating new ways to make life easier for her friends and family.Lily Nguyen is Millie's best friend and closest confidante. She's always there to offer a listening ear.Mayhem is the name of the extremely powerful AI system that Millie accidentally created. It has a mind of its own and is always causing havoc for Millie and Lily.PANEL 1 SCENE: Millie is sitting at her computer, her fingers flying across the keyboard as she codes. MILLIE: I'm almost finished with my latest project. I can't wait to show Lily!PANEL 2 SCENE: Lily is sitting on the couch, reading a book.LILY: I can't wait to see what Millie has been working on. She's so brilliant! PANEL 3 SCENE: Millie's computer screen is flashing red and an error message is displayed.MILLIE: Oh no! What have I done?12、为多面板漫画创建图稿
对于这个任务,我真的扩展了 DALL-E 的能力。 前两部漫画只有一个面板,但我需要为这一个创建三个面板,并使角色的外观保持一致。
Panel 1: "A techy comic strip where Millie, a brilliant young coder, is sitting at her computer typing."Panel 2: "A techy comic where Lily Nguyen is sitting on the couch, reading a book."Panel 3: "A techy comic, Millie, a college student with red hair and a green shirt, is working on her computer, the screen is showing an error message, and her friend Lily Nguyen, wearing a black shirt and blue sweatpants, is watching in horror."
请注意,我不得不对提示进行一些文字加工,以尝试为角色获得某种程度的视觉一致性。 DALL-E 为三个提示中的每一个生成了四个版本的图像,这里是最好的。
总的来说,这些都很好。 但是,除了乱码之外,第三个面板中的视觉一致性也存在重大问题; DALL-E 不知道角色应该是什么样子。 根据提示,它只是尽力而为。
13、创建角色研究为了让角色更真实,我首先在 Photoshop 中润色了图像,然后创建了一个带有 3x2 网格的模板,并在左上角渲染了 Millie。 我让六个面板中的五个保持透明。 模板的大小为 1024x1024,这是 DALL-E 的工作分辨率。
然后我将模板上传到 DALL-E 并使用提示编辑图像,“Millie 的漫画人物研究,一位才华横溢的年轻大学生和编码员,以六个不同的姿势从侧面和正面展示她。” 这是结果。
显然,DALL-E 知道什么是角色研究,并且在以不同姿势呈现我们的主角方面做得相当不错。
为了创建最终的片段面板,我选择了其中一个姿势并将其与透明背景上的 Lily 图像的一部分一起粘贴到 Photoshop 中。 我擦掉了他们脸上的一部分,看看 DALL-E 是否可以根据提示填写他们的表情,“米莉的一个技术漫画,一个大学生在她的电脑上工作,屏幕显示可怕的错误信息,她的朋友 Lily Nguyen 看着 吓坏了。” 这是结果。
这是在 Photoshop 中进行更多清理后最终的三面板漫画的样子,以及来自 GPT-3 的对话中的气泡一词。
14、最后的想法比较这两个系统,我发现 GPT-3 在生成文本方面比 DALL-E 在艺术作品方面做得更好。 尽管漫画的初始图像作为概念渲染看起来还不错,但它们需要进行一些清理才能用于生产。 但主要问题是 DALL-E 不能为漫画连贯地生成角色。 主要限制源于 DALL-E 中的 1024x1024 图像大小。 请注意,OpenAI 最近添加了一个新的“outpainting”功能,可以更轻松地添加到生成的图像中。 但是,新功能只能以零星的方式发挥作用。 它只考虑用于图像生成的 1024x1024 帧。 该系统需要一个“上传参考帧”功能来一致地生成视觉元素,比如漫画人物。