商汤版ChatGPT来袭，中国激战千亿“大模型”-华威派

> 自媒体 > AI人工智能 > 商汤版ChatGPT来袭，中国激战千亿“大模型”

商汤版ChatGPT来袭，中国激战千亿“大模型”

来源：钛媒体APP

2023-04-12

300

管理

首先是国内首个大模型体系。

4月10日，商汤科技正式发布商汤“日日新SenseNova”大模型体系，基于数据、模型训练以及部署的三位一体的飞轮，提供自然语言生成、图片生成、感知模型预标注、模型研发等多种能力，并持续更新多模态大模型，同时结合决策智能大模型，是实现AGI的重要起点。

据悉，商汤“日日新SenseNova”大模型体系的名称取自《礼记·大学》中，汤之盘铭曰：“苟日新、日日新、又日新”，商汤希望在模型的迭代速度及处理问题的能力上可以日日更新，不断解锁AGI更多可能。

实际上，大模型最核心的需求就是构建体系架构。而在前期，商汤前瞻性打造了人工智能基础设施SenseCore AI大装置——27000块GPU（图形处理器）芯片，5000 Petaflops超大规模算力、是亚洲最大的智能计算平台之一、支持20个千亿参数超大模型同时训练、支持最大4000卡并行单任务训练，可持续7天以上不间断稳定训练——这是国内为数不多接近GPT所需算力的重要基础设施公司。

如今，基于AISaaS服务架构，商汤已经打造了CV（计算机视觉）、NLP（自然语言处理）、AIGC（人工智能内容生成）多个AI大模型。未来基于这些核心优势，在“日日新SenseNova”大模型体系和SenseCore AI大装置的支持下，商汤的多模态大模型持续演进，同时结合决策智能大模型，为AGI的实现提供重要起点。

无论是一人一句编故事，还是连续对话能力，“商量”都能准确、快捷的回答出来。

此外，“商量”已经在行业实现了应用，尤其在医疗行业和编程领域。从现场实际demo当中可以看到，基于大模型应用平台，它能够准确、快捷地回答关于腹部痛等关键性问题，给出医疗参考方案。

第三大亮点是生成式AI应用，真正为短视频、直播产业带来生产力提升。

此次，商汤把GPT大模型应用于生成式 AI 领域，重构人与空间在数字时代的结合。商汤基于“日日新SenseNova”大模型体系，自研了包括秒画、如影、琼宇、格物等视频内容的制作和生成工具平台，为短视频、直播产业带来生产力的提升。

以“秒画”为例，其是商汤科技打造的AI内容创作社区平台，可帮助用户轻松地创作高质量的艺术作品，自动生成元素和细节，并可不断学习与提升。其中，“秒画”具备超10亿参数自研文生图生成模型，支持二次元、三次元等多种生成风格；推理速度快，单卡支持每2秒生成1张512分辨率的图片；用户可基于单卡A100，5分钟内定制属于自己的LoRA模型20张训练图片；汇聚了1万开源模型，基于平台发布的模型可设置为ToB服务API，结合商汤大算力对外提供商业化服务，支持用户训练个性化绘模型，满足不同绘画风格需求。

“秒画”带来个性化文生图能力（来源：商汤）

而另一种“琼宇”、“格物” 3D内容生成平台，是商汤科技基于神经辐射场技术（NeRF）的3D内容生成平台，分别是指琼宇大空间3D内容生成应用、格物小物体3D内容生成应用，可基于 3D 内容生成技术实现对空间和物体的复刻与交互。传统人工建模10000人/天的建模任务，通过“琼宇”只需要2天即可完成（算力为1200 TFLOPS）。

商汤表示，上述两套平台生成的各类3D内容都够进行再编辑再创作，通过海量高精度数字资产的生产，满足影视创作、建筑设计、商品营销、数字孪生管理等各类对可交互3D实景内容有强烈需求的应用场景。

最后一个亮点就是独特的行业赋能。商汤让大模型对外提供API接口，以及多元化、多种大模型即服务（MaaS）。

具体来说，在“一平台四支柱”的战略体系下，商汤“日日新SenseNova”大模型体系已全面支持了智能汽车、智慧生活、智慧商业、智慧城市等业务板块，打通了多个领域、行业的应用闭环。

而且，基于“日日新SenseNova”大模型体系，商汤将向客户提供涵盖图片生成、自然语言对话、视觉推理和标注服务等API接口。客户可根据实际应用需求，灵活调用商汤大模型的各项AI技术能力，低门槛、低成本、高效率地实现AI技术在实际业务环节中的部署，或进行二次开发，创造更多价值。

此外，基于商汤AI大装置和大模型体系，商汤将面向客户提供涵盖自动化数据标注、大模型推理部署、大模型并行训练、大模型增量训练、开发者效率提升等多种大模型即服务（Model-as-a-Service），包括自动化数据标注、大模型推理部署、大模型并行训练和大模型增量训练服务、开发者效率提升等。

“这绝对不只是说训练一个参数量非常大的模型，它是一个体系化的大工程。”王晓刚表示。

王晓刚提及，“涌现”这个现象的出现意味着大模型会不断给你惊喜，大模型能有新能力。而商汤在大模型训练本身，以及know-how任务理解都有这样的技术实力。结合自身的特点，具有通用性的商汤大模型，能够真正去帮助客户解决需求和问题。

“未来，我们也是希望能够依靠社区的力量把我们的这些模型进行调教，不只有原始模型，还有各种各样的这样的一些模型存在，能够更好的往前推进。”王晓刚坦言称。

大模型只是起点，奔向 AGI 之路才是重点

对于整个 AI 技术进程来说，大模型绝对不是 AI 发展的终点，而只是起点。

1950年，才华横溢的计算机科学家艾伦·图灵提出了一个他称之为“模仿游戏”的思想实验。面试官通过打字机与两个对象交谈，知道一个是人，另一个是机器。图灵建议，如果一台机器能够始终让面试官相信它是人类，我们就可以说它有能力思考。这就是著名的“图灵测试”。

后来的70年间，整个 AI 行业都为之努力，希望打造通过“图灵测试评估”能力的 AI 技术。如今，AI 算法、算力、数据“三驾马车”同步突破，AI 技术已经蓄能完毕，所有人终于可以大展身手了。

作为中国 AI 领域竞争与发展的核心玩家，商汤拥有 AI 行业全栈性研发能力。

商汤科技联合创始人、大装置事业群副总裁陈宇恒表示，所谓的通用人工智能新的创新范式，可以极高的体现商汤现有的一些 AI 产品的模式和能力。从大的方向上，商汤作为人工智能的头部的企业，未来肯定还是要去挑战更大的模型。因为现在很明显的趋势就是，每一代的大模型 AI 和算力有很大的相关性。

“下一代人工智能比上一代，比如说 GPT-4 比 GPT-3可能是百倍级的算力的需求，甚至它的参数量是十倍以上的需求，对应也需要更多的数据去完成训练。所以要不断地去接近所谓的通用人工智能或者 AGI 的路线上，肯定是要把基础的超大模型越做越大。这是未来 2 到 3 年，整个无论从学术界还是从工业界，还是从我们自己的对 AI 的理解上，都是比较明确的方向。”陈宇恒表示。

此前，商汤科技发布了2022财年报告。

财报显示，2022年，商汤研发支出达38亿元人民币（扣除以股份为基础的薪酬开支），同比增长24%，2018年至今累计研发投入达128.47亿元；人均每年研发模型数相较于2021年进一步提高了90%，累计生产的商用模型数提高了93%，至6.7万个。

当中国大力发展 AI 技术的重要时机下，商汤大量投入技术研发，不断推进数字化、智能化、产业化升级，符合科技创新下的时代特征，如今，商汤高强度的研发投入正在开花结果，在国内大模型军备赛中实现了第一梯队的飞跃，成为行业极稀缺的“头雁”。

英伟达CEO黄仁勋曾表示，当下“我们正处于 Al 的iPhone时刻”。而商汤，也正在迎来属于自己的“iPhone 时刻”。

“AI是生产‘生产力工具’的工具，它将开启软件开发新范式，把我们带入‘新二八定律’的时代，80%的工作由机器完成，20%的工作由人来做。”徐立认为，持续的大规模技术投入带来创新，再有商业模式发展，这是一条罕有人走的路。商汤始终坚信 AI 技术变革带来增量价值，必将推动普惠和公平的智能时代到来。（本文首发钛媒体App，作者｜林志佳）

赏钱

免责声明：本文仅代表作者个人观点，与华威派无关。其原创性以及文中陈述文字和内容未经本网证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。
凡本网注明 “来源：XXX（非华威派）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的，请在一周内进行，以便我们及时处理。
QQ：2443165046 邮箱：info@goodmaoning.com

中国支付清算协会：支付行业人员谨慎使用ChatGPT等工具

2023-04-12 10:06

界面晚报｜文旅部进一步规范旅游市场秩序支付清算协会倡议从业人员谨慎使用ChatGPT等工具

2023-04-12 10:01