> 自媒体 > AI人工智能 > ChatGPT 点燃向量数据库赛道,刚刚,Zilliz Cloud 云服务重磅发布!
ChatGPT 点燃向量数据库赛道,刚刚,Zilliz Cloud 云服务重磅发布!
来源:CSDN
2023-07-13
144
管理

自 OpenAI 在去年 11 月发布 ChatGPT 以来,AI 市场被彻底引爆,国内外科技企业纷纷发布自家的 AI 大模型。国内大模型的发展也迎来前所未有之机遇,“百模”激战正酣。在刚闭幕的世界人工智能大会上,国内外科技公司全线加入,三十余款大模型集中亮相,“国家队”尘埃落定,并正式启动大模型测试国家标准制订,掀起新一轮大模型热浪。而作为“大模型记忆体”、AIGC 应用开发新范式的重要组成部分,向量数据库的演进也逐渐达到了前所未有的新高度。

Milvus 自 2019 年正式开源以来,已经成长为全球最大、最活跃的向量数据库开源项目与开发者社区。作为 Milvus 背后的开发者与运营者,Zilliz 一直走在向量数据库的最前沿,始终秉承为开发者提供易用性强、性价比高的向量数据库服务的理念。经过五年的持续打磨,终于在国内推出了基于 Milvus 的全托管向量数据库云服务产品——Zilliz Cloud。

高性能 高性价比,性能优异远超同类产品

当前主流的向量数据索引算法是内存算法或内存/SSD 混合,算法内核以矩阵计算为主(类似 HPC),大规模向量检索与分析是计算/内存双重密集的任务。这意味着向量数据库作为基础设施,对于性能与成本更加敏感。

从性能方面来看,Zilliz Cloud 在 QPS 和降低查询延迟方面远超其他同类产品。我们将 Zilliz Cloud 、Milvus、Pinecone、ElasticCloud 4 个常见的向量数据库(ElasticCloud 严格来说不属于向量数据库,但附带向量能力,在传统文本检索领域受众最广,可以视为目前传统数据库支持向量检索的代表)在同等资源及 6 组向量查询任务的同等条件下进行了对比(测试框架已开源,详见 VectorDBBench,Leaderboard)。

对比结果如下:

在查询吞吐方面,Zilliz Cloud 在全部6组查询任务中全面力压向量数据库 Pinecone,整体性能平均超越2倍以上。与此同时,Zilliz Cloud 相比 Milvus,也有将近一倍的提升,表现令人眼前一亮。ElasticCloud 作为传统文本检索服务的代表,向量查询能力主要为补充能力,这 6 组查询任务的 QPS 均在 50 以下。

性价比方面,主要考察 Queries per dollar (高并发情况下,单位成本所能支持的查询请求数量)。相较 Pinecone、Elastic,Zilliz Cloud 的优势十分明显。指标相比第二位的 Pinecone 最多可以高出 1 个数量级(Q1, Q2),在剩下的四组任务中普遍可以高 3 倍左右。(由于 Milvus 为开源方案,难以和商业化服务在相同标准下比较,我们在这组测试中将其移除。)

打破 “CAP” 不可能三角,给用户灵活选择

向量数据库技术发展到现在并不完美,通常情况下,业务需要在成本(Cost)、查询效果与准确度(Accuracy)、查询性能(Performance)之间做权衡,即向量数据库的 CAP 问题。目前来看,CAP 是一个不可能三角,Zilliz 的解法是在典型的位置给出局部最优解,并给用户以灵活的选择。

事实上,用户的普遍场景可以归纳为性能需求型、容量需求型与成本敏感型。为此,Zilliz Cloud 在向量数据库实例中也相应提供了三类支持:性能型、容量型和经济型。不同的实例类型由不同的算法与硬件资源组合而成,适用于不同的业务场景。

支持大模型与非结构化数据处理全生态覆盖

没有任何一套系统可以满足使用者业务上的所有需求,向量数据库也是如此。在以向量数据库为支撑的业务中,往往需要处理多道流程,包括:

业务数据的语义结构化,如从文本数据中梳理标题 embedding、内容段落的embedding、一二级主题、阅读时间;

面向端到端效果的模型选型,如寻找能带来最佳效果的 embedding 模型选型;

模型与向量数据库的集成,如向量数据库查询驱动的原始数据召回以及后续 LLM 对召回内容的总结或重构等。

为了进一步降低应用构建成本,提供标准化组件,Zilliz Cloud 为开发者提供了双重支持:

大模型生态对接。2023 年 3 月,Zilliz 作为 OpenAI 首批向量数据库合作伙伴,完成了 Milvus 与 Zilliz Cloud 的插件化集成,被纳入官方推荐的向量数据库插件名单。不止如此,Zilliz 还与 LangChain、Cohere、LlamaIndex、Auto-GPT、BabyAGI 等热门项目进行了深度集成。此外,与国产大模型如文心一言、通义千问、智谱 AI、MiniMax、360 智脑等对接工作正在进行中,近期将会有更多成果发布。

面向非结构化数据处理流水线。Zilliz Cloud 提供了开源的 Towhee 工具框架。开发者可以在熟悉的 Python 环境,以类似 Spark 的算子语法编写自己的流水线,轻松处理文本、图片、音频、视频、化合物结构等非结构化数据的 ETL 过程。Towhee 同时提供自动化编排工具,一键在 Python 环境验证过的流水线组织成基于 Triton、TensorRT、ONNX 以及一系列硬件加速算法的服务镜像,面向如文本近似搜索、智能问答、知识库等典型场景。当然,Towhee 也提供深度优化的标准流水线。

目前,Zilliz Cloud 提供 SaaS 和 PaaS 服务,其中 SaaS 已覆盖 AWS、GCP、阿里云,PaaS 覆盖 AWS、GCP、Azure、阿里云、百度智能云、腾讯云和金山云。国内官网已同步上线,更多详情和案例可以访问 Https://zilliz.com.cn(海外官网和云服务入口:Https://zilliz.com)。

为了加速打磨业界最佳实践,我们即将启动「寻找 AIGC 时代的 CVP 实践之星」 专题活动,Zilliz 将联合国内头部大模型厂商一同甄选应用场景, 由双方提供向量数据库与大模型顶级技术专家为用户赋能,一同打磨应用,提升落地效果,赋能业务本身。如果你的应用也适合 CVP 框架,且正为应用落地和实际效果发愁,可直接申请参与活动,获得最专业的帮助和指导。(注:CVP 即 C 代表以 ChatGPT 为代表的 LLMs,V 代表 Vector DB,P 代表 Prompt Engineering,联系方式参见 business@zilliz.com)

2023 年伴随着 AGI 和 LLMs 的爆发已经过半,加速探索大模型落地之路已经迫在眉睫。行业的高度共识推动着 AI 奇点的来临,大模型将重构企业级应用,重塑人工智能产业的发展方向。Zilliz 表示,未来将持续聚焦向量数据库行业发展的最前沿,以各行各业的智能化演进为目标,为大模型时代的企业和开发者提供最具竞争力的“大模型记忆体”。

0
点赞
赏钱
0
收藏
免责声明:本文仅代表作者个人观点,与华威派无关。其原创性以及文中陈述文字和内容未经本网证实,对本文以及其中全部或者 部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
凡本网注明 “来源:XXX(非华威派)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对 其真实性负责。
如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。
QQ:2443165046 邮箱:info@goodmaoning.com
关于作者
卿嫣(普通会员)
点击领取今天的签到奖励!
签到排行
0
0
分享
请选择要切换的马甲:

个人中心

每日签到

我的消息

内容搜索