迄今“最强大”，谷歌推出人工智能模型“双子座”，它能做些什么？-华威派

> 自媒体 > 星座 > 迄今“最强大”，谷歌推出人工智能模型“双子座”，它能做些什么？

迄今“最强大”，谷歌推出人工智能模型“双子座”，它能做些什么？

来源：上观新闻

2023-12-12

256

管理

在美国人工智能初创公司OpenAI发布ChatGPT、引发人工智能开发竞赛一年后，美国谷歌公司于当地时间12月6日推出一款全新人工智能模型“双子座（Gemini）”。

谷歌毫不掩饰自己的野心。公司当天发布声明，高调宣布“双子座”时代的开始，并将“双子座”形容为谷歌迄今规模最大、能力最强、最灵活的人工智能模型，将应用于从大公司到消费者的各个领域。

与ChatGPT等其他人工智能模型相比，“双子座”具有原生“多感官”的特点，可识别文本、图像、视频、音频和编程代码，具备更强的理解和推理能力，还在“大规模多任务语言理解”测试中首次超越人类专家。

它究竟从何而来？可以做些什么？真能“碾压”ChatGPT？一连串问题引发关注。

绝地反击

一年前，OpenAI的ChatGPT横空出世，让包括谷歌在内的其他科技巨头大吃一惊。

在那之前，谷歌及其母公司Alphabet已花费约十年时间进行人工智能技术开发：2011年成立“谷歌大脑”实验室；2014年以6.5亿美元收购位于伦敦的人工智能初创公司，成立“深度思维”实验室。后者曾推出击败顶尖围棋选手的人工智能机器人“阿尔法狗”，震惊世界。

不过，按照美国科技界人士的说法，谷歌与其他一些科技巨头（如Meta公司）一样，一直不愿轻易发布可能产生偏见、虚假或其他有害信息的技术。

直到ChatGPT的出现，彻底打破市场的平静，掀起全行业对生成式人工智能技术的争鸣。谷歌不得不以前所未有的方式重新思考其开发重点。据称，谷歌当时急于将生成式人工智能添加到搜索引擎中，以阻止ChatGPT的流行。谷歌担心，OpenAI的技术可能会增强其最大“金主”微软的必应搜索引擎所构成的威胁。

今年3月，谷歌发布聊天机器人“巴德”，但反响平平。一个月后，谷歌宣布将旗下汇集2000多名研发人员的两个人工智能实验室“谷歌大脑”“深度思维”合并为“谷歌深度思维”公司。今年5月，谷歌首次宣布正在开发“双子座”，引发外界期待。

7个月后的今天，在OpenAI因高层“地震”出现动荡之际，谷歌高调发布“双子座”，并声称其最高版本在多个关键领域优于OpenAI的最新技术GPT-4。

有评论称，这是谷歌的绝地反击，标志着这家搜索巨头试图重新夺回人工智能赛道的领先地位。也有观点认为，OpenAI的内乱给其他竞争者提供一定的追赶时间和机会。

“多感官”模型

目前，其他的人工智能模型“感官”相对单一，大多依赖插件和集成技术，以实现真正的多模态。比如，ChatGPT擅长与语言相关的任务，包括内容创建和复杂文本分析等，但当它执行图像、音频分析任务时，就要依靠OpenAI的相关插件。

“双子座”则不同。它是一个“高感官”模型，具有原生多模态的特点，可无缝识别、理解和推理文本、图像、视频、音频和编程代码等各种输入，具有强大的综合感知和交互能力。

根据谷歌发布的演示视频，“双子座”在视觉信息处理方面表现突出。它可根据演示者创作的图像进行互动，可按要求创作音乐，还可以迅速筛选海量科学论文，提取关键数据，协助科学研究。谷歌称，“双子座”还能理解、解释和生成世界上主流编程语言的代码，可用作高级编码系统的引擎。

与市面上的其他模型相比，“双子座”另一大特点在于，更聚焦产品的生态融合。

有评论称，其他现有模型（如ChatGPT和Meta的人工智能模型Llama等）更加以服务为导向，可供各种第三方开发人员用于应用程序、工具和服务。

“双子座”更以产品为导向，已被整合到谷歌的生态系统中，为谷歌聊天机器人和谷歌手机提供支持，还将通过谷歌产品推向数十亿用户。

此外，谷歌还将“双子座”描述为公司“最灵活”的模型，能在从数据中心到移动设备等不同平台上运行。

为了更好地体现这种任务可扩展性，“双子座”推出三种版本：其中，Ultra版本功能最强大，适用于高度复杂的任务，预计2024年初发布；Nano版本最高效，用于智能手机等设备端，执行无需连接外部服务器的任务；Pro版本能力中等，能提供快速响应并处理复杂的查询，适用于大规模部署。

当地时间12月6日起，谷歌聊天机器人“巴德”已使用“双子座”Pro版本，目前只支持英语，于全球170多个国家和地区同步上线。谷歌Pixel 8 Pro成为首款运行“双子座”Nano版本的智能手机。从12月13日开始，开发者和企业客户还可通过“双子座”应用程序编程接口访问Pro版本。未来几个月，谷歌将在Chrome浏览器等应用程序中添加“双子座”。

新军备竞赛

谷歌称，“双子座”最高版本Ultra功能强大：在“大规模多任务语言理解”测试中得分为90%，首次超越人类专家，高于包括ChatGPT在内的任何其他模型。这一测试包含数学、物理、历史、法律和医学等数十个科目，用于衡量模型的知识储备和解决问题的能力。

此外，在广泛使用的“大型语言模型”32项基准测试中，“双子座”Ultra版本在30项中达到目前最先进水平。“我们看到，它在全面开拓新的边界。”谷歌研发人员引以为豪。

不过，也有报道指出，“双子座”Ultra版本并没有完全碾压OpenAI的GPT-4，也在其他一些行业基准测试项目中输给GPT-4。

“我们正处于一场针锋相对的新军备竞赛中。”美国华盛顿大学名誉教授奥伦·埃齐奥尼指出，人们有理由相信，“双子座”在一些基准测试中的表现优于GPT-4，但下一个版本GPT-5的表现将会更好。建造像“双子座”这样的巨型模型可能耗资数亿美元，但最终的回报可能是数十亿甚至数万亿美元。因此，这是一场毫无保留、必须胜利的战争。

值得一提的是，作为硬币的两面，围绕人工智能收益和风险的辩论一直如影随形。人们担心，这项技术可能会使人类智慧黯然失色，导致数百万人失业，甚至还可能犯下严重错误、造成更具破坏性的影响，比如触发核武器的部署等。

对此，谷歌首席执行官皮查伊承诺，“我们正在大胆而负责任地开展这项工作……我们追求能为人类和社会带来巨大利益的能力，同时建立保障措施，并与政府和专家合作应对风险。”

“谷歌拥有强大的算法，它对‘双子座’的推进方式似乎很有前景。但‘双子座’仍然会像GPT-4一样，在理解现实世界的复杂性方面存在明显局限性。”美国加州大学伯克利分校教授阿列克谢·埃弗罗斯指出，他和其他研究人员不太可能了解有关谷歌的一切。“这就是所有这些模型的问题所在。我们不知道它们里面究竟有些什么。”

（编辑邮箱：ylq@jfdaily.com）

栏目主编：杨立群文字编辑：杨立群题图来源：视觉中国图片编辑：苏唯

来源：作者：安峥

赏钱

免责声明：本文仅代表作者个人观点，与华威派无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非华威派）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@goodmaoning.com

双子座十二月综合情况解析

11个月前

没错，这才是双子座，比大多数人都干净，不那么精分，但非常难搞

11个月前