随着大模型的规模落地,AI发展的主战场正从“模型训练”转向“行业推理”,解决推理效率瓶颈成为释放AI产业价值的关键。近日,在由中国信息通信研究院组织的“存力中国行-北京站”活动中, 华为数据存储产品线副总裁樊杰在接受工信智媒体记者专访时指出,AI大模型正从通用大模型向细分行业小模型渗透,数据的归集、清洗、精调是关键,华为通过端到端的存储技术方案,解决行业模型落地中的存力、运力、算力瓶颈,持续赋能千行百业。
华为数据存储产品线副总裁樊杰(右)接受
工信智媒体总编刘启诚(左)专访
01
行业模型落地仍处于“爬坡阶段”
当前,我国存力建设成效显著,截至2024年底存力总规模已达1580EB,先进存储占比28%,今年6月底更是增至1680EB,国产存储在技术研发与产业应用上已具备领先实力。但行业模型的落地仍处于“爬坡阶段”,高质量数据集建设、数据可信流通、跨行业应用适配等诸多领域仍需探索。
据悉,模型发展中数据处理有三个关键阶段。
汇集阶段:打破孤岛,构建AI数据湖
这一阶段的核心是将分散在多园区、多院区、多数据中心的异构数据进行数字化、标准化汇聚。这些数据格式各异、存储分散,形成了“数据孤岛”。要让行业模型获得充足的训练素材,就必须打破这些壁垒,将各类数据归集形成统一的“AI数据湖”,为后续的模型训练奠定基础。
训练阶段:突破瓶颈,提升算力利用率
数据汇集后,需经过清洗、加载、训练、存档的反复循环过程。传统存储方式难以应对这一阶段的高频数据读写需求,导致GPU或NPU的利用率仅能达到30%左右,70%的时间都在等待数据加载与存档,形成了“算力闲置”的浪费。此时,单纯堆砌算力已无济于事,必须通过高性能的存储与高速运力网络,解决数据“供给不畅”的问题。
推理阶段:优化体验,实现高效实用
训练成熟的模型进入实际应用后,推理阶段的性能直接决定用户体验与商业价值。如今的推理场景已从简单的短句问答,转向长文档分析、复杂业务决策等需求,比如让AI通读上万字的博士论文或上百页的医疗案卷。这不仅要求模型具备超长文本处理能力,还需解决响应延迟、并发处理、重复计算等问题,让AI真正成为行业从业者的得力助手。
02
华为端到端解决方案:
破解全流程痛点
针对行业模型落地的核心需求,华为推出了覆盖数据全生命周期的组合解决方案,从语料汇集到推理应用,全方位提升效率、降低成本。
比如在语料归集环节,华为可提供AI数据服务,帮助行业客户高效整合异构数据,打破数据孤岛,实现数据的标准化与统一管理,为模型训练提供高质量、高可用的“原料”。
在训练阶段,华为推出OceanStor A800、OceanStor A600等高性能AI存储产品,凭借极致的性能表现破解训练瓶颈。其中,OceanStor A800在MLPerf Storage V1.0基准测试中,以整系统性能、单机性能和单位空间性能三项指标全球第一的成绩,成为全球AI数据存储领域的标杆产品。通过这一系列高性能存储方案,模型训练的算力利用率从30%提升至60%,大幅缩短了训练周期,减少了算力空转浪费。
在推理阶段,华为的“双引擎”——UCM推理记忆数据管理技术与AI SSD,构建了软硬件协同的优化方案,系统性解决了“内存墙”与“容量墙”难题。
据介绍,UCM并非简单的缓存,而是智能的数据调度与管理系统,通过三大核心特性实现推理加速:一是连接生态,提供插件式灵活对接多样引擎与多元算力;二是记忆管理,通过KV Cache动态多级管理,系统化创新加速算法;三是存储协同,高性能数据直通与PB级容量分级,实现KV记忆数据卸载。
作为硬件支撑,华为AI SSD并非通用存储,而是为AI工作负载深度优化的专用硬件。其中OceanDisk SP 560高性能盘的随机写性能最高可达1500K IOPS,随机写时延低于7μs,为推理数据提供极速读写通道。它与UCM协同构建HBM-DRAM-AI SSD三级缓存架构,将非活跃的KVCache从昂贵的显存智能卸载至大容量AI SSD中,使推理序列长度提升2.5倍,让模型具备处理超长文本的记忆能力。
对于不同规模的推理场景,华为方案也具备灵活适配性,比如边缘场景如县级医院的小型推理需求,仅需在服务器中挂载几块高性能AI SSD即可满足;大型推理场景则可采用AI存储整机,保障大规模并发处理能力。
03
开源与生态:
推动AI推理技术普惠落地
为降低行业应用门槛,华为已将UCM核心技术在魔擎社区正式开源并在GitHub上开放下载。这一举措不仅让广大开发者和企业能以更低成本、更便捷的方式获得领先的AI推理加速能力,更推动了推理加速领域的技术标准化与接口统一,避免生态碎片化,为全产业协同创新搭建了开放平台。
在开源基础上,华为将进一步完善数据存储、数据管理、AI工具链以及资源管理的全链条能力,以平台化赋能千行百业。同时,华为也积极参与“先进存力AI推理工作组”,与产业链伙伴共同推进技术研究、方案落地、标准制定与生态构建,凝聚产业合力。
AI时代的到来,让数据从“成本”转变为“核心资产”,高质量数据的留存率大幅提升,为存储产业带来了蓬勃发展的机遇。未来,随着技术的持续迭代与生态的不断完善,存力将成为支撑金融、电信、医疗、能源等行业转型升级的关键力量。华为将持续以技术创新与开放合作,降低AI推理应用门槛,让高效、经济的AI推理能力走进更多细分场景,助力千行百业实现智能化转型,释放AI产业的真正价值。