OpenAI 赋予了 ChatGPT 运行代码和使用第三方插件的能力。
谢泼德音调
然后,我进一步测试 ChatGPT 的声音能力,要求 ChatGPT 生成一段康威生命游戏的会话,然后将它转换为一段音乐。
补充介绍一下,康威生命游戏(Conway's Game of Life),又称康威生命棋,是英国数学家约翰·何顿·康威(John Horton Conway)在 1970 年发明的元胞自动机。这是一个零玩家游戏,意味着它的发展完全由其初始状态决定,不需要进一步输入信息。
ChatGPT 第一次输出的音乐片段听起来有点太随机,于是我要求 ChatGPT 让这段音乐更悦耳一些。ChatGPT 用五声音阶对结果进行处理,于是就得到了下面这段音乐:
以音乐形式呈现的生命游戏
设想一下,用这种方法,我们甚至可以让 ChatGPT 制作一整张的数学音乐专辑:斐波那契数列、曼德布洛特集合、元胞自动机等等!
接下来,我让 ChatGPT 为刚才的“生命游戏之歌”生成一张专辑封面。由于 ChatGPT 并没有连接到 DALL-E(OpenAI 发布的文本生成图像工具)不具备作图的能力,我就要求它根据一张生命游戏模拟结果生成专辑封面。
生命游戏之歌的专辑封面
看着生命游戏专辑图片和旁边的二维码,我在想……能不能让 ChatGPT 创建一个以二维码为终局的生命游戏模拟过程呢?(我告诉它通过从二维码倒推来作弊……)没错,它可以:
生命游戏二维码
生成图片
在关于 ChatGPT 插件的博客文章中,我展示了一些用 Python 库进行图像处理的酷炫方法。这也让我不由得好奇,想看看 ChatGPT 还能用基础库做些什么。
使用 OpenCV(开放源代码计算机视觉类库)和一个简单的人脸识别算法(Haar Cascade Classifier),代码解释器能够创建一个函数,在下面这张图片中找到我的脸:
用 OpenCV 查找人脸
转换成 ASCII 格式
生成动画
既然代码解释器可以生成数据,并将其输出为包括 gif 动图在内的不同格式,那我们就来测试一下,ChatGPT 具体能做到什么程度。
首先,我让 ChatGPT 制作一个弹跳的方块:
跳动的方块
然后,我试着让 ChatGPT 用矢量立方体来生成生命游戏,得到的最接近的结果是这样的:
旋转的立方体
光学字符识别(OCR)
事实证明,ChatGPT 的代码解释器基本库中,包含了光学字符识别(OCR)。我决定用一个网站的屏幕截图来测试一下。果然,这个方法有用。能把 OCR 与一个非常强大的语言模型相结合,这有可能让 ChatGPT 具备了一定的恢复旧文档的能力。
一只戴帽子、叼烟斗的猫
那么 ChatGPT 可以模拟国际象棋吗?首先,我必须让 ChatGPT 创建它自己的国际象棋库(一个简化了规则的、不怎么标准的国际象棋库……)并使用 unicode 表示棋子,之后,ChatGPT 就能模拟一局游戏的开始,并将其保存为 gif 动图:
国际象棋
这是我与 ChatGPT 进行的关于生成国际象棋模拟过程的对话。可以看到,这里我只给出了一些指令,剩下的工作都是由 ChatGPT 和代码解释器完成的。
以上这些只是我对 ChatGPT 和代码解释器插件的部分探索。随着越来越多的人加入进来,我相信我们很快会看到一些真正令人惊叹的应用。
相关文章
猜你喜欢