GPT-4写代码能力提升21%！MIT新方法让LLM学会反思-华威派

> 自媒体 > AI人工智能 > GPT-4写代码能力提升21%！MIT新方法让LLM学会反思

GPT-4写代码能力提升21%！MIT新方法让LLM学会反思

来源：量子位

2023-05-03

348

管理

Pine 发自凹非寺

量子位 | 公众号 QbitAI

GPT-4再度进化！

加上一个简单方法，就能让GPT-4这类大语言模型学会自我反思，性能直接提升30%。

不过，同人类思考一样，LLM在反思的过程中同样也有局限性，这在函数中的Ω和ε中就能体现。

Ω表示重复连续动作的次数，一般会将这个数值设置为3，这表示反思过程中若重复一个步骤三次，会直接跳到下一个步骤。

而ε则表示在反思的过程中允许执行的最大操作数量。

既然有监督，那修正也必须执行，修正过程的函数是这样子的：

在HotpotQA的134个问答对测试中，可以看出在Reflexion的加持下，LLM经过多轮反思后，准确率一度达到97%。

在另外一篇博客中，团队成员也晒出了他们这种方法在GPT-4上的效果，测试范围是编写代码。

结果也显而易见，用了Reflexion，GPT-4的编程能力直接提升了21%。

关于GPT-4已经会“思考”了，你怎（huang）么（le）看（ma）？

论文地址：https://arxiv.org/abs/2303.11366参考链接：[1] https://nanothoughts.substack.com/p/reflecting-on-reflexion[2] https://www.reddit.com/r/MachineLearning/comments/1215dbl/r_reflexion_an_autonomous_agent_with_dynamic/

— 完 —

量子位 QbitAI · 头条号签约

关注我们，第一时间获知前沿科技动态

1

点赞

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与华威派无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非华威派）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@goodmaoning.com

更强大恐怖的GPT-4来了，考试表现优于人类，性能远超ChatGPT

2023-05-03 16:42

考试中击败90%人类的GPT-4来了，人类距离 “AI奇点”还有多远？

2023-05-03 16:40

相关文章

超实用！聊天必用！15个开场白推荐

ChatGPT提供的论文、商业策划书等，版权归谁？版权服务基层行首站走进高校..

GPT卷入实体机器人行业，进门掘金的“入场券”是什么？..

GPT-4玩《我的世界》15倍速攀科技，不看画面全靠代码操作..

OpenAI 透露未来路线图：开源GPT-3、翻倍模型规模、整更多GPU..

ChatGPT专业版可以排队了！限制更少但收费，网友：钱已备好..

西湖大学学者：人类和ChatGPT应该是互补关系，而不是替代关系..

史上最快！爆红AI聊天程序ChatGPT，月活跃用户数两个月突破1亿大关..

地表最强聊天机器人ChatGPT横空出世！马斯克直呼：太厉害了..

关于作者

清水大树(普通会员)

点击领取今天的签到奖励!

猜你喜欢

01

抛妻弃女31年，李连杰再次遇到前妻黄秋燕，泪点却在合影的位置上..

2022/09/12

02

豆瓣评分9.0以上的国产剧排行榜豆瓣评分9.0以上的国产剧前十..

2022/09/24

03

盘古和女娲（中国神话故事）

2022/08/27

04

2022离世的11位名人：有人患癌，有人突发意外，有人元旦当天离世..

2022/09/11

05

巨蟹座：一生最旺的颜色，能旺你一生，可以不喜欢，但必须爱上它..

6个月前

06

30个暖心睡前小故事，很甜很撩的睡前小故事

2022/08/26

07

香蕉是如何种出来的？从育苗到收获，揭秘香蕉种植的全过程..

2022/06/02

08

“没有好奇心，人就死了”！喜马拉雅鬼王——杨湃的鬼故事哲学..

2022/08/27

标签云

1

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索