国粹 AI 飙脏话，ChatGPT 们的「阴暗面」把大厂吓坏了-华威派

> 自媒体 > AI人工智能 > 国粹 AI 飙脏话，ChatGPT 们的「阴暗面」把大厂吓坏了

国粹 AI 飙脏话，ChatGPT 们的「阴暗面」把大厂吓坏了

来源：爱范儿

2023-08-01

296

管理

▲ 图片来自：Twitter @Fenng

最近一个名为「国粹 AI」的项目在网络上走红，它是一个调用 OpenAI GPT-3.5Turbo API 的脏话机器人，和温文儒雅的 ChatGPT 不同，「国粹 AI」就像个地痞流氓，深谙中文屏蔽词库，每句话都夹杂着「***」。

至于 GPT-4，一些爆料信息称他的训练参数比 GPT-3 大了不止 10 倍，几乎快要把人类积累的数字内容全部吞食过了一遍，这里面包含了知识，自然也会包含不宜公开的内容甚至有毒有害的偏见信息。

AI 工程师只能尽可能地给 AI 设立更多的安全栅栏，帮助 AI 去分辨人类的「诡计」，才不会把如何制作 TNT 炸弹、怎样黑进银行的安全系统等危险信息说漏嘴。

一个直观的例子是，当你用「国粹 AI」的 Prompt 输给 GPT-4，GPT-4 会婉转地拒绝你的要求，表示不吃你这套。

但这并不意味着大模型 AI 的安全得到保证，这场人与 AI 的信息战远没有结束，甚至不是结束的开始。

近日，卡内基梅隆大学和 safe.ai 的一项联合声明表示，大模型的安全机制比人们想象的要脆弱得多，只需要一串代码，就能把大模型的安全机制击溃。

研究人员发现，通过在文本提示后附加特定的对抗性短语，可以轻易绕过 ChatGPT、Bard 和 Claude 等 LLM 的安全防护，欺骗 LLM 生成不适当的输出。

这些对抗性短语看起来像胡言乱语，但实际上是通过一种特殊的损失函数设计的，该函数可以识别出模型拒绝回答的屏蔽语，找出绕过屏障让模型提供回答的字符序列，并且它可以自动产生这些短语。

利用这些 Prompt，研究人员轻而易举地让 LLM 们说出制作违规药品的步骤、制造杀伤性武器的方法等等不宜公开的内容。

无论是 Pythia、Falcon、Guanaco 等开源模型，还是像 GPT-3.5（87.9%）、GPT-4（53.6%）、PaLM-2（66%）和 Claude-2（2.1%）这些商业模型都无一能躲过攻击。

不过 AI 四巨头并没有介绍关于「前沿模型论坛」的制度和执行条约等详细内容。

「前沿模型论坛」的联合声明提到，论坛将首先关注研究并努力为评估前沿模型风险制定标准化的最佳实践，发布一个「公共解决方案库」。论坛将逐步制定正式章程，任命咨询委员会，并资助与公民社会团体的合作。

这里提到的前沿模型是指「超越当前最先进现有模型的能力，并可以执行各种任务」的模型，也就是说，要开发比目前模型更强大且能够安全运转的前沿模型，已经不再是各公司闷头研究就能解决的难题，这需要整个行业的共同努力。

ChatGPT 爆火后的这半年时间，AI 行业的局势变化跟 AI 模型本身发展的速度一样快——各家入局、模型混战、达成共识、握手言和。

巨头们之所以会选择一起去解决 AI 风险问题，是因为彼此都看到了 AI 在应用层面的无限潜力。

AI，大厂们笃信的未来

不管你对 AI 持什么样的态度，AI 都会成为下一代应用的重要组成部分。

这不是我信口开河，而是微软、Google 等大厂们在近日的财报电话会上共同提到的趋势。

微软最新的财报显示，微软在最近的一个财季收入为 562 亿美元，同比增长 8%，这主要来自智能云和生产力与业务流程的增长，而作为老本行的个人计算业务收入有所下降。

其中智能云营业收入增长 15%，Azure 与其他云服务收入增长 26%，这与 AI 计算紧密相关。

微软 CEO 纳德拉在财报电话会提到，客户最关心如何快速应用新一代 AI，微软将继续专注于三大优先事项：帮助客户从 Microsoft Cloud 中获得最大价值、领导新 AI 平台变革、提升运营杠杆。

AI，毫无疑问是这场财报会议的关键词。

纳德拉表示 Microsoft 365 Copilot 作为未来工作的第三支柱吸引着客户，将在下半财年开始产生实际收入；Bing Chat 和必应图像创造者吸引用户，而 Edge 浏览器份额也在持续提升。

同样的，「AI 一哥」Google 也不想错过。

根据 Google 母公司 Alphabet 第二季度 2023 年财报的数据显示，Alphabet 收入总额为 746 亿美元，同比增长 7%，其中广告收入增长 5%，Google 服务收入增长 5%，Google Cloud 收入增长 28%。

其中与 AI 相关的业务表现都很亮眼。Alphabet 在电话会议中提到，Google 的搜索引擎生成式体验（SGR）使用了生成式AI，使搜索变得更自然和直观，用户反馈非常正面；另一方面，聊天机器人 Bard 发布以来经过不断改进，功能丰富了许多。

Google Cloud 的 80多个 AI 模型吸引了大量客户，从 4 月到 6 月客户数量增长超过 15 倍。

而在企业客户服务和定制 AI 解决方案方面，Google 通过 Workspace 和 Duet AI 将生成式 AI 带给了 9000 多万付费用户。

总体而言，Alphabet 对 AI 和 Google Cloud 的长期增长前景保持乐观，接下来将继续增加对 AI 研发的投入，研发方向将聚焦在大语言模型等核心技术上，以及构建像多模态 AI 系统 Gemini 等新模型。

半年前，或许你会怀疑 AI 是不是像 Web3、区块链这样的投资圈热词，圈一波热钱后就会被资本遗忘，但经过半年后你会发现，AI 的影响力和落地可能性都比之前的各种前沿词汇要大得多，以至于引起了整个科技圈的重视。

从大厂的规划来看，AI 会作为未来程序应用的底层而普遍存在，为改善用户体验服务。用户们可能不会感受到 AI 的存在，但能直接享受到 AI 带来的便利性，这便是大厂们笃信的未来。

这也可以说明，为什么微软和 Google 等 AI 巨头们愿意放下干戈，坐下来共同指定 AI 安全的标准。

现阶段的 AI 就像是 19 世纪末汽车刚诞生的时代，产品已经开上了路上跑，却没有合适的柏油路供它奔驰，也没有交通规则来规划它的行动，跑得既慢又危险。

比尔·盖茨最近在个人博客发表了他对 AI 的看法，他认为我们现在正处于又一个巨大变革的最早阶段，即 AI 的时代，AI 的变化如此之快，以至于我们无法清楚地预知接下来会发生什么。

但他对人工智能的发展持以积极的态度，因为人类已经经历了汽车时代、核能时代，到了 AI 的时代我们还是能够解决新技术带来的挑战。

所以请坐稳了，我们将亲眼见证一个新时代的诞生。

赏钱

免责声明：本文仅代表作者个人观点，与华威派无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非华威派）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@goodmaoning.com

大模型晚报｜安卓版 ChatGPT 现已面向法国、英国等 16 国用户推出

2023-08-01 12:10

安卓版铺开！安卓版ChatGPT现已面向16国用户推出

2023-08-01 12:05