> 自媒体 > AI人工智能 > 商汤版类ChatGPT来了!“日日新”大模型体系发布
商汤版类ChatGPT来了!“日日新”大模型体系发布
来源:智东西
2023-04-14
229
管理

五年磨一剑,27000块GPU加持,现场演示AI编程问诊,几分钟训练出港风美人。

作者 | ZeR0

编辑 | 漠影

智东西4月10日报道,今日,商汤科技宣布以AGI(通用人工智能)作为核心发展战略,基于“日日新SenseNova”大模型体系,以“大模型 大算力”持续实现AGI的更多突破。

商汤还在现场展示了其类ChatGPT平台——自研中文语言大模型应用平台“商量”:现场演示写广告词、写邀请函、交替创作儿童故事、看长篇PDF文件并快速做阅读理解、编写代码等多样能力。

此外,商汤一连甩出基于“日日新SenseNova”大模型体系的4款生成式AI应用平台。商汤现场演示了实时的AI文生图、AI创作生动数字人视频的实操过程,并展示了用其3D内容生成平台做的高逼真城市级重建、复杂结构物体的商业广告视频,还用平板电脑演示了流畅的3D内容实时交互。

目前商汤已打造CV(计算机视觉)、NLP(自然语言处理)、AIGC(人工智能内容生成)多个AI大模型。其SenseCore AI大装置是业内稀缺的大模型专用基础设施,现有27000块GPU,可输出5000 PetaFlops算力,能够以最大4000卡规模集群进行单任务训练,并可做到7天以上不间断的稳定训练。

商汤将基于AI大装置,向客户提供涵盖自动化数据标注、大模型推理部署、大模型并行训练、大模型增量训练、开发者效率提升等多种大模型即服务(MaaS,Model-as-a-Service)。

在“一平台四支柱”的战略体系下,商汤“日日新SenseNova”大模型体系已全面支持了智能汽车、智慧生活、智慧商业、智慧城市等业务板块,打通了多个领域、行业的应用闭环。

01.

中文语言大模型露面:AI现编“手写

文档OCR”程序,还充当大夫在线问诊

“商量”是商汤科技自研的中文语言大模型应用平台,支持单轮对话、多轮对话及超长文本理解,能够秒解复杂问题、提供定制化建议、辅助创作文本内容,并具备不断学习进化的特性。

,时长01:26

该平台背后,是商汤研发的千亿参数中文语言大模型,支持企业服务、城市管理、汽车出行等600 个垂直领域。

▲商汤中文语言大模型能理解句意,并尝试判断句子的合理性

据分享,“商量”具备逻辑推演与智能,可在互动式引导过程中精进判断力与创作智能;兼具理解广度与深度,在多轮对话、超长文本知识理解、问诊与编程等垂直领域表现突出,全方位覆盖各种应用。

“商量”还支持知识自动及时更新,能够回答文档中不涉及的知识,生成更可信、更准确、更安全的文本和对话。

现场,商汤还让“AI代码助手”编写“手写文档OCR”的程序,并成功跑通了代码。

“AI代码助手”同时支持中英文及多种编程语言,并能快速适应开发者的个性化编码风格,提高开发效率、减少开发错误,帮助开发人员专注于更有创造性的编程工作与代码设计。

据商汤内部实测,应用“AI代码助手”后,代码编写效率提升62%,HumanEval测试集一次通过率为39%。

面向医疗行业,商汤基于海量医学知识和真实医患互动对话数据打造的中文医疗语言大模型,能够提供导诊、问诊、健康咨询、辅助决策等多场景多轮会话能力,目前在问诊分诊、医疗知识科普、疾病鉴别诊断等领域表现出色。

1、“秒画”AI内容创作社区平台:单卡支持每10秒生成5张512分辨率图片

“秒画”是商汤科技打造的AI内容创作社区平台,可帮助用户轻松地创作高质量的艺术作品,自动生成元素和细节。该平台支持用户训练个性化绘模型,可满足不同绘画风格需求。

“秒画”采用了商汤自研的超10亿参数自研文生图生成模型,方便用户在本地在推理和自训练:1)推理速度快,单卡支持每10秒生成5张@512分辨率的图片;2)单卡支持5分钟内定制属于自己的LoRA模型@20张训练图片。

商汤现场演示了在聊天框输入一连串详细的中文描述,让AI生成港风美女照片。

商汤的生成模型开源社区汇聚了10000 开源模型。基于“秒画”平台发布的模型可设置为to B服务API,结合商汤大算力对外提供商业化服务。

2、“如影”视频生成平台:聊聊天制作出AI数字人,自动生成文案和最终视频

商汤“如影”AI数字人视频生成平台旨在让每个人都能轻松创作视频,支持AI数字人动作表情、AI文案生成、AI跨语言文稿、AI素材生成的全栈式智能创作,且卡通/真实各种风格切换自如。

,时长01:37

整个过程无需专业拍摄设备,如影即可生成高度逼真的数字形象,并通过文字驱动,快速、高效地创作各种人物视频内容。而且创作出的数字人形象逼真、表情自然丰富。

只需在对话框中输入视频创作的粗略想法,商汤如影就能自动产生相应的视频文案,并直接AI驱动各种数字内容生最终视频。

琼宇拥有厘米级重建精度、大场景实时渲染与互动、多源数据融合、超精细化等算法优势,具备城市级大尺度的空间重建生成能力,可生成100平方公里的空间。传统人工建模10000人/天的建模任务,通过琼宇只需2天即可完成(算力为1200 TFLOPS),并能还原真实细节和光照效果。

相较于传统物体建模方式,格物小物体3D内容生成应用可实现各品类物体超细节的复刻还原,带来400%的综合效率提升,实现95%的综合成本降低,覆盖品类全、重建效果好。

凭借商汤NeRF技术,格物可良好支持复杂结构物体复刻,并做到光照精准复刻,材质完美还原,适用于商业广告、商品营销等应用场景。下图是商汤用格物生成的商业广告视频。

在智能驾驶领域,通过大模型生产高精度车端模型,大幅提升了few/one/zero shot在长尾类别中的精度,在重点关注类别上平均精度提升3%。此外,大模型提供了高精度的智能标注能力,为数据闭环提供了核心功能,大大减少了需要人工标注的数据量,加速了模型精度的提升。

得益于大模型能力,商汤实现了BEV环视感知,做到了3000类物体的高精度识别,还构建了感知决策一体化的自动驾驶多模态大模型,带来更强的环境、行为、动机解码能力。

1、5000 Petaflops超大规模算力,是亚洲最大的智能计算平台之一:SenseCore商汤AI大装置目前包含27000块GPU,可输出5000 Petaflops算力,是亚洲最大的智能计算平台之一。

2、支持20个千亿参数超大模型同时训练,并提供一条龙基础设施服务:商汤AI大装置当前算力可支持20个千亿参数量的超大模型同时训练,并提供涵盖数据、训练工具、推理部署、性能优化一条龙的大模型基础设施服务体系。

3、支持最大4000卡并行单任务训练,可持续7天以上不间断稳定训练:不仅支持了商汤自身的大模型训练项目,而且还训练了其他企业自定义的模型。商汤将力争在4000卡规模集群的训练关键指标达到世界领先,为万亿级参数提供基础。

据悉,在AI大模型时代,衡量算力能力和核心指标不是简单的数字,其一是多卡并行状态下的有效利用率,即能够支撑大模型训练的实际算力;其二是系统能够持续稳定运行的时长。

商汤AI大装置融合了AI、超算与大数据的核心能力,通过为AI优化的高性能计算、高性能存储及缓存、高性能网络,以存算分离,大规模弹性、容错调度等特征,支撑大模型在数千张卡、PB级存储上,完成万亿级参数大模型训练。

SenseCore AI平台产品还提供了模块化、全链条的数据、训练及推理能力。可实现百亿级数据管理及检索,人工标注服务,加速AI大模型研发效率。一键量化、一键部署、一键应用,提供了大模型快速上线验证的工具,加速创新。

06.

结语:以“大模型 大算力”战略布局

剑指AGI时代的基础设施服务

过去十年,深度学习掀起的AI技术革命在很多领域突破了“工业红线”,但在广泛复杂的场景需求下,定制化AI模型的开发模式依然面临研发成本高、周期长等问题。

如今,将语言、视觉等信息和能力融为一体的多模态大模型正催生新的研究范式,通过强化学习和人类反馈不断解锁基模型新的能力,从而更高效地解决海量的开放式任务。

AI新的技术革命已经到来,它的影响注定深远。今天,商汤通过展示“日日新SenseNova”大模型体系和业界稀缺的大模型专用基础设施商汤AI大装置,交出了迈向AGI目标的阶段性答卷。

基于“日日新SenseNova”大模型体系,商汤自研了中文语言大模型应用平台、革新的人机协作模式,以及包括AI内容创作、2D/3D数字人视频生成、大场景/小物体生成的一系列视频内容的制作和生成工具平台。

这些平台将为医疗问诊、短视频、直播、商业广告、商品营销、数字孪生、影视创作、文旅等产业带来生产力的提升。而商汤提供的多种API接口、MaaS服务等,又将进一步助攻大模型AI技术在各行各业的规模化普及。

3
点赞
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与华威派无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
凡本网注明 “来源:XXX(非华威派)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。
QQ:2443165046 邮箱:info@goodmaoning.com
关于作者
冷熙(普通会员)
点击领取今天的签到奖励!
签到排行
3
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索