OpenAI炸裂新作：GPT-4破解GPT-2大脑！30万神经元全被看透-华威派

> 自媒体 > AI人工智能 > OpenAI炸裂新作：GPT-4破解GPT-2大脑！30万神经元全被看透

OpenAI炸裂新作：GPT-4破解GPT-2大脑！30万神经元全被看透

来源：新智元

2023-06-23

489

管理

编辑：编辑部

【新智元导读】OpenAI又双叒叕有新整活了！难懂的GPT-2神经元，让GPT-4来解释。人类看不懂的AI黑箱，就交给AI吧！

刚刚，OpenAI发布了震惊的新发现：GPT-4，已经可以解释GPT-2的行为！

大语言模型的黑箱问题，是一直困扰着人类研究者的难题。

模型内部究竟是怎样的原理？模型为什么会做出这样那样的反应？LLM的哪些部分，究竟负责哪些行为？这些都让他们百思不得其解。

万万没想到，AI的「可解释性」，竟然被AI自己破解了？

比如，如果给出这么一个prompt，「哪些漫威超级英雄拥有最有用的超能力？」「漫威超级英雄神经元」可能就会增加模型命名漫威电影中特定超级英雄的概率。

OpenAI的工具就是利用这种设定，把模型分解为单独的部分。

第一步：使用GPT-4生成解释

首先，找一个GPT-2的神经元，并向GPT-4展示相关的文本序列和激活。

然后，让GPT-4根据这些行为，生成一个可能的解释。

比如，在下面的例子中GPT-4就认为，这个神经元与电影、人物和娱乐有关。

令人兴奋的是，这给了我们一种衡量神经元解释好坏的方法：我们模拟人类如何预测未来的模式，并将此与实际的模式进行比较。

目前这种衡量方式并不准确，但随着LLM的改进，它会变得更好。

虽然现在还处于初期阶段，但已经展现了一些有趣的趋势：

后期的层比早期的更难解释简单的预训练干预可以提高神经元的可解释性简单的技巧，如迭代细化，可以改进解释

网友：OpenAI，搞慢点吧

毫不意外地，网友们又炸了。

咱就是说，OpenAI，你搞慢点行不？

听说GPT-5已经达到奇点，并且它正在与地外生命谈判和平条约。

他知道我们在计划什么

我们必须不惜一切代价让他丧失信誉

一旦他走了，就没有人能够反对我们了

「Eliezer Yudkowsky看到这一幕，一定又笑又哭——让我们使用自己不能信任的技术来告诉我们，它是如何工作的，并且它是对齐的。」

参考资料：

https://openai.com/research/language-models-can-explain-neurons-in-language-models

https://openaipublic.blob.core.windows.net/neuron-explainer/paper/index.html

https://techcrunch.com/2023/05/09/openais-new-tool-attempts-to-explain-language-models-behaviors/

2

点赞

赏钱

0

收藏

免责声明：本文仅代表作者个人观点，与华威派无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非华威派）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@goodmaoning.com

关于脑科学角度解析GPT4 / OpenAI创始人科普GPT使用技巧

2023-06-23 19:07

OpenAI警告微软：必应的AI反应很怪异整合GPT-4要谨慎

2023-06-23 19:05

相关文章

AI机器人革新职业：探索未来十大热门岗位

为什么无法使用中国手机号码注册ChatGPT账号？

对标和挑战ChatGPT，Hugging Face发布开源对话机器人HuggingChat..

OpenAI：将向所有ChatGPT Plus用户开放这一超级功能，人人都能成为数据分析..

ChatGPT免注册使用网站-为你提供无需注册即可使用的聊天机器人..

GoldenDB4个案例入选金融信创优秀解决方案，看看ChatGPT怎么说..

一图看懂GPT3.5-GPT4.0区别自然语言处理到多模态

追星女孩一个举动，妈妈卡里的45万被转走了……

微软抢先官宣ChatGPT版新必应，搜完答案还能持续聊天

关于作者

卿嫣(普通会员)

点击领取今天的签到奖励!

猜你喜欢

01

抛妻弃女31年，李连杰再次遇到前妻黄秋燕，泪点却在合影的位置上..

2022/09/12

02

豆瓣评分9.0以上的国产剧排行榜豆瓣评分9.0以上的国产剧前十..

2022/09/24

03

盘古和女娲（中国神话故事）

2022/08/27

04

2022离世的11位名人：有人患癌，有人突发意外，有人元旦当天离世..

2022/09/11

05

巨蟹座：一生最旺的颜色，能旺你一生，可以不喜欢，但必须爱上它..

6个月前

06

30个暖心睡前小故事，很甜很撩的睡前小故事

2022/08/26

07

香蕉是如何种出来的？从育苗到收获，揭秘香蕉种植的全过程..

2022/06/02

08

“没有好奇心，人就死了”！喜马拉雅鬼王——杨湃的鬼故事哲学..

2022/08/27

标签云

2

0

分享

请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索