阿里云PolarDB完成 “AI就绪”关键一跃
创始人
2026-01-28 13:49:20

从关系模型的提出,到大数据的奔涌,再到如今大模型的崛起,数据库技术经历三轮深刻的范式重构。现在,站在Agentic AI的时代路口,数据处理的方向将被引向何方?Data Infra最核心且无法绕开的挑战究竟是什么?以Agent为代表的下一代应用,究竟在呼唤怎样的数据库?

▲阿里云资深副总裁、数据库产品事业部负责人李飞飞

恰逢良辰吉日,上海冬雪与北极熊巧妙呼应( PolarDB品牌LOGO是一个北极熊形象),阿里云数据库完成“AI就绪”的关键一跃。在阿里云PolarDB年度开发者大会上,阿里云资深副总裁、数据库产品事业部负责人李飞飞以一句“连上海都下雪了,PolarDB的时代真的来了”,开启了对未来的展望。

至于,他为什么更强调“AI就绪”,而非轻言“AI原生”?在李飞飞看来,AI本身仍在高速演进,“就绪”才是符合当下数据库与AI融合进程的务实姿态。阿里云PolarDB锚定的未来,是真正的AI原生数据库。只不过,从云原生到AI-Ready,再到AI原生,并非一蹴而就。如何穿越技术、成本和生态的重重关卡,让大模型的智能交互在数据最深处发生?答案已然清晰!如果说AI原生是数据库进化的“终极形态”,那么AI就绪才是当下每家企业必须直面、必须要攀爬的“第一座高山”!

如今,宣称“AI原生”的数据库厂商并不少见,但究竟谁才配得上“国家队”级别的实力?李飞飞提出了两项关键指标:一是真实的Token消耗规模;二是实际支持海量Agent使用数据库的能力。正是基于这样的反向推演,PolarDB正从平台架构到AI能力集成持续迭代,致力于将AI真正内化为数据库的核心能力,而非表面嫁接。

打通“数据墙”,老问题的新面孔

在通往超级人工智能的道路上,算力已不再是唯一的瓶颈,真正的挑战已转向数据存储与处理能力的边界,尤其是长短记忆问题正在重新凸显。

李飞飞认为,数据及其处理能力是驱动超级智能的“燃料”与“引擎”。当前,大模型正在“吞噬”一切数据,无论是冷数据、温数据还是热数据。然而,随着DRAM价格大幅上涨,存储成本飙升30%-40%甚至更高,一个AI就绪的数据库首先必须能够有效降低使用成本。

存储成本的周期性上涨,意味着过去客户依赖自建低成本服务器的时代已经终结。面对硬件涨价与技术普惠之间的现实矛盾,PolarDB选择以技术创新与规模效应双轮驱动破局:一方面,通过池化、多租、弹性等手段提升资源使用效率;另一方面,依托规模化部署降低边际成本——规模越大,弹性调度的空间越大,越能为客户释放真正的成本红利。

如果说数据是超级智能的“基石”,那么高质量、实时的“热数据”才是维持引擎持续运转的关键燃料。尽管大模型能处理海量数据,却无法实时对热数据进行增删改查。因此,企业数据库中持续产生的实时交易数据,在很长一段时间内仍将具备不可替代的价值。

从数据库支撑AI负载演进的角度来看,如何推动大模型实现从“学习人”到“辅助人”再到“超越人”的跨越?关键在于将热数据及其处理能力与大模型深度结合!在“学习人”阶段,依赖的是历史与公共数据;“辅助人”阶段,则要通过自然语言交互实时处理热数据,将高质量私域数据与通用大模型融合;而迈向“超越人”,需进一步支持多模态数据处理,最终实现实时记忆与模型智能的有机统一。

那么,PolarDB所构建的AI就绪数据库究竟有何不同?最显著的特征在于 “AI in DB”!不同于外挂式AI方案,PolarDB将大模型能力深度嵌入数据库内核,重点攻克了两大难题:一是化解“数据重力”,通过极简架构与零时延感知,让数据就地可计算、无需反复迁移;二是捍卫“数据主权”,在提供高效数据服务的同时,确保用户隐私安全与能源效率的极致平衡。

四大演进,PolarDB的AI化重构

从云原生向AI就绪演进,今天的PolarDB在架构上已实现AI化的重构。至于,什么是AI就绪数据库?李飞飞给出了清晰的“4+1”能力框架:

首先,存储层走向湖仓一体。 AI时代,处理的数据类型极其丰富,embedding、特征提取、多模态检索成为标配,湖仓一体架构是必要前提。PolarDB将数据库、数据湖和数据仓库有机结合,支持多模态AI数据湖库。

第二是元数据的统一管理。 AI时代数据源特别多:日志、交易数据、图片、文本、音视频,不仅同一类型的数据量大,纷繁复杂的异构数据源也加大了数据管理的难度。当元数据从以前的几百兆变成上T级别,统一管理成为关键抓手。PolarDB可以将Zero ETL技术集成到元数据管理上,做到元数据信息的实时同步。

第三是多模态检索与处理能力。 结合embedding能力、向量检索、全文检索等多模态能力,PolarDB可以实现从结构化到半结构化以及非结构化数据的融合处理。

第四是模型算子化与Agent AI支持。 在数据库内部做模型推理服务,PolarDB让模型调用和token消耗场景化。未来的数字世界一定是token的世界,token消耗量的增长可能会是成百上千倍,但如果你直接给用户token,就像给出了“铁、铜、金”,用户不知道如何用,你需要给他们的是”金项链、金手镯”这种成品,才能真正满足用户需求。

除了上述四大能力,AI就绪数据库的能力框架还需要“+1”,那就是跟上硬件发展步伐。 数据库必须结合硬件特点持续迭代。从硬件涨价这件事来看,今天“内存墙”这个“幽灵”又回来了。AI节点要与传统通用计算节点有机整合,实现CPU与GPU计算池的统一调度,支持多租户弹性部署,实现交易、分析、推理的全面融合。从OLTP到OLAP再到OLIP,三者的融合是PolarDB向AI演进的核心思路。

落地,从AI能力打通到客户体验升级

为了实现AI就绪目标,PolarDB除了在架构上全面AI化,在阿里内部产品能力打通上,也做了诸多努力,比如:与阿里百炼和PAI的深度结合。

▲阿里云数据库产品事业部产品管理与技术架构部负责人王远

过去短短几个月内,阿里云瑶池数据库(含PolarDB、RDS、ADB等产品)通过调用百炼、模型算子化服务以及PAI平台所产生的Token消耗量,实现了超过100倍的增长。正如阿里云数据库产品事业部产品管理与技术架构部负责人王远所言:PolarDB今天的表现,不仅证明了AI与数据库结合的需求是真实且迫切的,更显示出“AI in DB”这一路径的强大生命力。

为了实现AI能力的深度集成,阿里云在三个层面进行了重点投入:

1)核心AI服务集成。首先是与集团内部的“百炼”大模型平台和“PAI”的深度打通。百炼提供通用的基础模型能力,而PAI则提供了定制化的模型推理服务与微调能力,形成互补。

2)自研模型算子化服务。这是PolarDB实现“AI就绪”的关键一步。通过将模型推理能力封装为数据库内置算子,PolarDB自身就具备了在数据库内部进行高效AI推理的能力。这不仅提升了性能,更重要的是保障了在高并发、弹性突发场景下的服务稳定性与SLA,实现了自主可控的算力溢出处理。

3)极简的调用方式。目前,开发者已可通过熟悉的SQL语句或标准API,无缝调用这些内嵌的AI能力。而下一步的重点,是支持更符合直觉的自然语言交互,让开发者乃至业务人员能用“说人话”的方式,完成从事务处理(TP)到混合负载(HP)再到智能推理(IP)的全链路操作。

在王远看来,AI与数据库的融合,正在从根本上改变数据库的用户群体和交互范式。

对于传统数据库开发者,PolarDB沿着“一体化”的技术路径,从云原生关系型数据库,演进为支持Lakehouse架构的AI就绪数据库。这意味着,同一个PolarDB实例不仅能处理传统的结构化数据,还能原生支持非结构化、半结构化等多模态数据。

面向AI应用开发者,PolarDB正系统性地提升体验。首先,在基础能力上,提供原生的向量数据处理能力。在AI时代,如果数据库不支持向量,基本上不能称之为AI时代的数据库,但这仅是起点。其次,针对高阶能力,提供一体化的多模态数据管理,支持图数据、全文数据等,并在此基础上构建一体化RAG能力。同时,通过在SQL中引入模型算子,让开发者能以透明、统一的方式调用无论是内嵌还是远程的模型服务。

未来,数据库还可以直接服务于 “普通用户”,大模型将让数据库具备直接服务非技术背景用户的能力。在交互方式上,会实现颠覆式创新,从命令行、图形界面转向自然语言和多模态交互。从管理思维来看,数据库的管理将从对“数据模式(Schema)”的管理,升级为对“知识”和“记忆”的管理。PolarDB致力于帮助企业管理系统性的工作记忆、事实记忆与经验记忆,让数据组织更贴近人类的认知方式。同时,可以实现智能体原生支持。PolarDB的目标是成为以数据为中心的AI基础设施,深度优化对Agent应用开发的支持,通过数据存取、记忆管理到多Agent协作,成为构建企业级智能应用的主流选择。

相关内容

热门资讯

原创 特... 特朗普执政满一周年之际,白宫官网锣鼓喧天地推出了一份自吹自擂的成绩单,长长的一份文件上赫然列出了所谓...
原创 美... 1991年的圣诞节,对美国人来说,比中了头奖彩票还要狂喜。 当克里姆林宫上空的红旗在寒风中缓缓降下,...
特斯拉官宣2026年3月31日... IT之家 1 月 21 日消息,特斯拉官方已宣布一项颇具争议的 FSD 相关计划的终止日期。 就在...
山东赫达股价涨5.03%,华商... 来源:新浪基金∞工作室 1月23日,山东赫达涨5.03%,截至发稿,报17.75元/股,成交1.44...