在美国人工智能初创公司OpenAI发布ChatGPT、引发人工智能开发竞赛一年后,美国谷歌公司于当地时间12月6日推出一款全新人工智能模型“双子座(Gemini)”。
谷歌毫不掩饰自己的野心。公司当天发布声明,高调宣布“双子座”时代的开始,并将“双子座”形容为谷歌迄今规模最大、能力最强、最灵活的人工智能模型,将应用于从大公司到消费者的各个领域。
与ChatGPT等其他人工智能模型相比,“双子座”具有原生“多感官”的特点,可识别文本、图像、视频、音频和编程代码,具备更强的理解和推理能力,还在“大规模多任务语言理解”测试中首次超越人类专家。
它究竟从何而来?可以做些什么?真能“碾压”ChatGPT?一连串问题引发关注。
绝地反击
一年前,OpenAI的ChatGPT横空出世,让包括谷歌在内的其他科技巨头大吃一惊。
在那之前,谷歌及其母公司Alphabet已花费约十年时间进行人工智能技术开发:2011年成立“谷歌大脑”实验室;2014年以6.5亿美元收购位于伦敦的人工智能初创公司,成立“深度思维”实验室。后者曾推出击败顶尖围棋选手的人工智能机器人“阿尔法狗”,震惊世界。
不过,按照美国科技界人士的说法,谷歌与其他一些科技巨头(如Meta公司)一样,一直不愿轻易发布可能产生偏见、虚假或其他有害信息的技术。
直到ChatGPT的出现,彻底打破市场的平静,掀起全行业对生成式人工智能技术的争鸣。谷歌不得不以前所未有的方式重新思考其开发重点。据称,谷歌当时急于将生成式人工智能添加到搜索引擎中,以阻止ChatGPT的流行。谷歌担心,OpenAI的技术可能会增强其最大“金主”微软的必应搜索引擎所构成的威胁。
今年3月,谷歌发布聊天机器人“巴德”,但反响平平。一个月后,谷歌宣布将旗下汇集2000多名研发人员的两个人工智能实验室“谷歌大脑”“深度思维”合并为“谷歌深度思维”公司。今年5月,谷歌首次宣布正在开发“双子座”,引发外界期待。
7个月后的今天,在OpenAI因高层“地震”出现动荡之际,谷歌高调发布“双子座”,并声称其最高版本在多个关键领域优于OpenAI的最新技术GPT-4。
有评论称,这是谷歌的绝地反击,标志着这家搜索巨头试图重新夺回人工智能赛道的领先地位。也有观点认为,OpenAI的内乱给其他竞争者提供一定的追赶时间和机会。
“多感官”模型
目前,其他的人工智能模型“感官”相对单一,大多依赖插件和集成技术,以实现真正的多模态。比如,ChatGPT擅长与语言相关的任务,包括内容创建和复杂文本分析等,但当它执行图像、音频分析任务时,就要依靠OpenAI的相关插件。
“双子座”则不同。它是一个“高感官”模型,具有原生多模态的特点,可无缝识别、理解和推理文本、图像、视频、音频和编程代码等各种输入,具有强大的综合感知和交互能力。
根据谷歌发布的演示视频,“双子座”在视觉信息处理方面表现突出。它可根据演示者创作的图像进行互动,可按要求创作音乐,还可以迅速筛选海量科学论文,提取关键数据,协助科学研究。谷歌称,“双子座”还能理解、解释和生成世界上主流编程语言的代码,可用作高级编码系统的引擎。
与市面上的其他模型相比,“双子座”另一大特点在于,更聚焦产品的生态融合。
有评论称,其他现有模型(如ChatGPT和Meta的人工智能模型Llama等)更加以服务为导向,可供各种第三方开发人员用于应用程序、工具和服务。
“双子座”更以产品为导向,已被整合到谷歌的生态系统中,为谷歌聊天机器人和谷歌手机提供支持,还将通过谷歌产品推向数十亿用户。
此外,谷歌还将“双子座”描述为公司“最灵活”的模型,能在从数据中心到移动设备等不同平台上运行。
为了更好地体现这种任务可扩展性,“双子座”推出三种版本:其中,Ultra版本功能最强大,适用于高度复杂的任务,预计2024年初发布;Nano版本最高效,用于智能手机等设备端,执行无需连接外部服务器的任务;Pro版本能力中等,能提供快速响应并处理复杂的查询,适用于大规模部署。
当地时间12月6日起,谷歌聊天机器人“巴德”已使用“双子座”Pro版本,目前只支持英语,于全球170多个国家和地区同步上线。谷歌Pixel 8 Pro成为首款运行“双子座”Nano版本的智能手机。从12月13日开始,开发者和企业客户还可通过“双子座”应用程序编程接口访问Pro版本。未来几个月,谷歌将在Chrome浏览器等应用程序中添加“双子座”。
新军备竞赛
谷歌称,“双子座”最高版本Ultra功能强大:在“大规模多任务语言理解”测试中得分为90%,首次超越人类专家,高于包括ChatGPT在内的任何其他模型。这一测试包含数学、物理、历史、法律和医学等数十个科目,用于衡量模型的知识储备和解决问题的能力。
此外,在广泛使用的“大型语言模型”32项基准测试中,“双子座”Ultra版本在30项中达到目前最先进水平。“我们看到,它在全面开拓新的边界。”谷歌研发人员引以为豪。
不过,也有报道指出,“双子座”Ultra版本并没有完全碾压OpenAI的GPT-4,也在其他一些行业基准测试项目中输给GPT-4。
“我们正处于一场针锋相对的新军备竞赛中。”美国华盛顿大学名誉教授奥伦·埃齐奥尼指出,人们有理由相信,“双子座”在一些基准测试中的表现优于GPT-4,但下一个版本GPT-5的表现将会更好。建造像“双子座”这样的巨型模型可能耗资数亿美元,但最终的回报可能是数十亿甚至数万亿美元。因此,这是一场毫无保留、必须胜利的战争。
值得一提的是,作为硬币的两面,围绕人工智能收益和风险的辩论一直如影随形。人们担心,这项技术可能会使人类智慧黯然失色,导致数百万人失业,甚至还可能犯下严重错误、造成更具破坏性的影响,比如触发核武器的部署等。
对此,谷歌首席执行官皮查伊承诺,“我们正在大胆而负责任地开展这项工作……我们追求能为人类和社会带来巨大利益的能力,同时建立保障措施,并与政府和专家合作应对风险。”
“谷歌拥有强大的算法,它对‘双子座’的推进方式似乎很有前景。但‘双子座’仍然会像GPT-4一样,在理解现实世界的复杂性方面存在明显局限性。”美国加州大学伯克利分校教授阿列克谢·埃弗罗斯指出,他和其他研究人员不太可能了解有关谷歌的一切。“这就是所有这些模型的问题所在。我们不知道它们里面究竟有些什么。”
(编辑邮箱:ylq@jfdaily.com)
栏目主编:杨立群 文字编辑:杨立群 题图来源:视觉中国 图片编辑:苏唯
来源:作者:安峥
猜你喜欢