GPT-3.5逆袭GPT-4！DeepMind华人天团，让LLM像人类一样制作工具-华威派

> 自媒体 > AI人工智能 > GPT-3.5逆袭GPT-4！DeepMind华人天团，让LLM像人类一样制作工具

GPT-3.5逆袭GPT-4！DeepMind华人天团，让LLM像人类一样制作工具

来源：新智元

2023-06-18

371

管理

编辑：好困 Aeneas

【新智元导读】最近，来自Google DeepMind，普林斯顿和斯坦福的顶尖华人团队提出了一种全新的框架。现在，LLM可以像人类一样制作自己的工具了！

ChatGPT等大语言模型诞生以来，凭着强大的语言理解能力、生成能力、逻辑推理能力等，已经被人类玩出了花。

而OpenAI公开GPT-4后，最大的惊喜之一，莫过于插件模式的引入了。

插件使得GPT-4可以执行代码、搜索引擎、集成各种APP的功能。这无疑是对于LLM后续应用模式的一大突破。

论文地址：https://arxiv.org/abs/2305.17126

项目地址：https://github.com/ctlllll/LLM-ToolMaker

基于这个框架，LLM就变得像人类的祖先一样，能够自我开发，并且学会使用工具。

同时，这种工具制造者和使用者之间的分工，在不降低生成工具和解决方案质量的情况下，就能实现成本效益。

结果显示，当使用GPT-4作为工具制造者，GPT-3.5 Turbo作为工具使用者时，可以在成本低、速度快的GPT-3.5 Turbo上实现与GPT-4相当的性能。

让LLM自己造工具

虽然LLM很好用，但如果问题太多的话，直接丢给GPT-4这种性能很强的模型，成本会非常高。

另一方面，轻量级模型在成本效益上很高，但通常在处理复杂任务时遇到困难。

LATM通过利用强大的模型作为工具制造者，为请求中观察到的任务生成可重复使用的工具（以Python函数实现），并将工具传递给一个成本效益高的工具使用者模型，用于解决后续请求中的类似实例。

这种方法使得轻量级模型在保持更高的成本效率的同时，能够达到与强大模型相当的性能。

LATM的闭环框架

LATM可以分为两个阶段：

1. 制造工具：一个强大但更昂贵的模型作为工具制造者，从一些示例中生成通用且可重复使用的工具；

2. 使用工具：一个轻量且更便宜的模型作为工具使用者，使用工具来解决任务的各种实例。

制造工具阶段可以进一步划分为三个子阶段：

（1）工具提议：工具制造者试图从一些训练示例中生成工具（Python函数），如果工具无法执行，报告错误并生成新的（修复函数中的问题）；

（2）工具验证：工具制造者在验证样本上运行单元测试，如果工具没有通过测试，报告错误并生成新的测试（修复单元测试中函数调用的问题）；

（3）工具封装：封装函数代码和如何从单元测试中将问题转换为函数调用的示例，为工具使用者准备可用的工具。

LATM和思维链（CoT）的性能比较

此外，在所有的模型中，GPT-3.5 Turbo也有着最佳的性价比。

工具验证

工具封装

分派器

封装工具

逻辑推理

Dyck语言

单词排序

参考资料：

https://arxiv.org/abs/2305.17126

0

点赞

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与华威派无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非华威派）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@goodmaoning.com

别再浪费20美元，教你如何免费体验ChatGPT-4！

2023-06-18 23:28

GPT4考90分全假！30年资深律师用GPT打官司，6个虚假案例成笑柄

2023-06-18 23:26

相关文章

ChatGPT：十款开源快速开发平台

一起了解 ChatGPT，环境要求，部署方式，集成 ChatGPT，Docker部署..

2万字复盘：OpenAI的技术底层逻辑

ChatGPT -3 的无监督和零次学习特征

小孩都能学明白ChatGPT的AI读物，给你们看一眼，就一眼..

又一组作家因版权主张起诉 OpenAI

人工智能：现状、挑战与未来展望

男子用ChatGPT写假新闻！警方通报

刷屏的ChatGPT能帮自媒体人写稿吗？我们帮你试了试

关于作者

雷振杍(普通会员)

点击领取今天的签到奖励!

猜你喜欢

01

抛妻弃女31年，李连杰再次遇到前妻黄秋燕，泪点却在合影的位置上..

2022/09/12

02

豆瓣评分9.0以上的国产剧排行榜豆瓣评分9.0以上的国产剧前十..

2022/09/24

03

盘古和女娲（中国神话故事）

2022/08/27

04

2022离世的11位名人：有人患癌，有人突发意外，有人元旦当天离世..

2022/09/11

05

30个暖心睡前小故事，很甜很撩的睡前小故事

2022/08/26

06

香蕉是如何种出来的？从育苗到收获，揭秘香蕉种植的全过程..

2022/06/02

07

“没有好奇心，人就死了”！喜马拉雅鬼王——杨湃的鬼故事哲学..

2022/08/27

08

巨蟹座：一生最旺的颜色，能旺你一生，可以不喜欢，但必须爱上它..

3个月前

标签云

0

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索