GPT-4数学能力大蹦极！OpenAI爆火研究「过程监督」突破78.2%难题-华威派

> 自媒体 > AI人工智能 > GPT-4数学能力大蹦极！OpenAI爆火研究「过程监督」突破78.2%难题

GPT-4数学能力大蹦极！OpenAI爆火研究「过程监督」突破78.2%难题

来源：新智元

2023-06-23

208

管理

编辑：编辑部

【新智元导读】chatgpt为人诟病的「数学智障」问题，有望彻底攻克！OpenAI最新研究发现，利用「过程监督」可以大幅提升GPT模型的数学能力，干掉它们的幻觉。

ChatGPT自发布以来，数学能力饱受诟病。

就连「数学天才」陶哲轩曾表示，GPT-4在自己的数学专业领域，并没有太多的增值。

怎么办，就一直让ChatGPT做个「数学智障」么？

OpenAI在努力——为了提升GPT-4的数学推理能力，OpenAI团队用「过程监督」（PRM）训练模型。

让我们一步一步验证！

这里，GPT-4成功地执行了一系列复杂的多项式因式分解。

在步骤5中使用Sophie-Germain恒等式是一个重要的步骤。可见，这一步骤很有洞察力。

在步骤7和8中，GPT-4开始执行猜测和检查。

这是该模型可能产生「幻觉」的常见地方，它会声称某个特定的猜测是成功的。在这种情况下，奖励模型验证每一步，并确定思维链是正确的。

在过程监督中，会奖励大模型正确的推理步骤，而不仅仅是奖励它们正确的最终结论。这个过程，会鼓励模型遵循更多类似人类的思维方法链，因而也就更可能造就更好的可解释AI。

OpenAI的研究者表示，虽然过程监督并不是OpenAI发明的，但OpenAI正在努力推动它向前发展。

最新研究中， OpenAI把「结果监督」或「过程监督」两种方法都试了一遍。并使用MATH数据集作为测试平台，并对这两种方法进行了详细比较。

结果发现，「过程监督」能够明显提高模型性能。

如下是一个标注的示例。OpenAI正在发布原始标注，以及在项目第1阶段和第2阶段给标注者的指示。

训练模型去思考，而不仅是输出正确的答案，将会成为解决复杂问题的game changer。

ChatGPT在数学方面超级弱。今天我试图解决一个四年级数学书上的数学问题。ChatGPT给了错误答案。我把我的答案和ChatGPT的答案，在perplexity AI、谷歌的答案，以及四年级的老师进行了核对。每个地方都可以确认，chatgpt的答案是错误的。

参考资料：

https://openai.com/research/improving-mathematical-reasoning-with-process-supervision

1

点赞

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与华威派无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非华威派）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@goodmaoning.com

GPT-4玩《我的世界》15倍速攀科技，不看画面全靠代码操作

2023-06-23 18:53

阿里达摩院：GPT-4替代年薪60万数据分析师只要几千块，论文已发

2023-06-23 18:51

相关文章

GPT-4发布！ChatGPT大升级！太太太太强了！

许小年：从元宇宙到ChatGPT，什么是万变不离其“宗”？..

ChatGPT手机曝光！体验或超越苹果的语音助手Siri

突发！杜兆才被查！人民币大消息！4500亿芯片巨头闪崩！ChatGPT被“封杀”..

ChatGPT背后的故事：似乎有一个声音在说——不要模仿上帝..

谷歌医疗版ChatGPT已在诊所实测！多个指标和真人医生相当..

怎样才能学会聊天不冷场,找对话题

ChatGPT概念股大跌，是短期调整还是行情熄火？资金将流向何处..

OpenAI官方揭秘GPT-4的秘密武器- 指令的艺术

关于作者

我是歌王(普通会员)

点击领取今天的签到奖励!

猜你喜欢

01

抛妻弃女31年，李连杰再次遇到前妻黄秋燕，泪点却在合影的位置上..

2022/09/12

02

豆瓣评分9.0以上的国产剧排行榜豆瓣评分9.0以上的国产剧前十..

2022/09/24

03

盘古和女娲（中国神话故事）

2022/08/27

04

2022离世的11位名人：有人患癌，有人突发意外，有人元旦当天离世..

2022/09/11

05

巨蟹座：一生最旺的颜色，能旺你一生，可以不喜欢，但必须爱上它..

5个月前

06

30个暖心睡前小故事，很甜很撩的睡前小故事

2022/08/26

07

香蕉是如何种出来的？从育苗到收获，揭秘香蕉种植的全过程..

2022/06/02

08

“没有好奇心，人就死了”！喜马拉雅鬼王——杨湃的鬼故事哲学..

2022/08/27

标签云

1

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索