智能时代,数据已然成为核心要素。数据量呈指数级增长,先进数据存力一跃成为发展的关键。
然而,随着AI应用的爆发,数据存在“孤岛”,共享需求满足率仅约10%,数据中用于AI的占比仅约7%……
面对数据存储方面的难题,各方该如何破局?在2025中国算力大会上,华为数据存储产品线副总裁肖德刚分享了华为在先进数据存力方面的思考:先进存力,正是破解这些困局的关键引擎。
智能时代的数据烦恼
AI应用的爆发,让数据成为“刚需”,却也带来了一系列棘手难题。首先,规模与性能的双重拷问:EB级数据已成常态——气象预测年增22EB数据、油气勘探年增60EB数据,海量数据对存储容量的吞噬力惊人;同时,AI训练与推理对数据访问速度要求苛刻,热温数据界限模糊,传统存储性能难以跟上节奏。
其次,数据孤岛与流通壁垒:城市各部门数据“各自为战”,共享满足率仅约10%;行业数据流通中,安全与可控成为痛点,数据价值难以跨领域释放;企业中,仅7%的留存数据能服务于AI,大量数据沉睡在“数据坟墓”中。
最后,AI落地的基础设施短板:数据基础设施是AI行业化的基石,既要支撑语料库与知识库共建,服务智能客服、智慧城市等场景,又要保障数据随时可用。当前存储体系在“聚、治、用”全流程中存在断点,难以支撑AI大规模落地。
先进存力,破解困局的核心引擎
面对上述挑战,肖德刚强调:先进存力并非简单的“存储容量”,而是能支撑数据全生命周期的“智慧枢纽”,是释放数据价值的核心动力。
大家疑惑,存力为何成“破局关键”?对此,肖德刚指出,在智能时代,数据的价值释放依赖“聚数、治数、用数”三个环节的无缝衔接。
聚数:打破孤岛,实现多源数据高效汇聚;治数:通过清洗、加密等手段,让数据规整可用;用数:挖掘分析数据,最终应用于实际场景创造价值。
而先进存力正是这一链条的核心支撑——它既能承载海量数据,又能保障高速访问,更能构建安全可信的流通环境,让数据从“资源”真正转化为“资产”。
如何实现三大环节打通?肖德刚表示,需从城市、行业、企业三个维度协同发力。
第一,城市级:建存力中心,破“聚数之困”。针对城市数据孤岛问题,存力中心是关键解法。通过汇聚政府各委办局多源数据,打造数据储备流通基地与开发基地,打破数据壁垒,加速全域产业数智化跃迁。
第二,行业级:造语料库,解“用数之痛”。以汽车行业为例,建设行业级语料库,搭配数据交换空间,既能实现数据安全、可信、可控流通,支撑新能源汽车安全监管,又能让数据在金融保险、汽车销售等领域“变现”,释放跨场景价值。
第三,企业级:筑AI数据湖,化“治数之难”。企业AI数据湖覆盖数据处理、模型开发、算法测试到模型发布全流程,可大幅缩短智能驾驶等场景的数据训练准备时间,提高AI应用上线效率,让更多数据服务于AI创新。
各方携手,完善先进数据存力生态
先进存力的发展,离不开生态的协同。肖德刚呼吁从四方面发力:其一,加强国家顶层规划。肖德刚呼吁国家制定统一的先进存力中心建设规划,结合“东数西算”等战略,优化全国数据存储资源分布。
其二,加大技术创新投入。肖德刚认为,行业需聚焦闪存技术、AI融合等关键领域,加强存力与算力协同发展,探索量子存储等先进技术应用,打造存算一体化示范项目。
其三,完善数据治理体系。肖德刚提出,行业需建立健全数据安全法律法规,完善数据治理机制,明确数据长期保存机制,保障数据价值安全流通。
其四,培育专业人才。肖德刚认为,行业需建立人才培养基地和实训平台,开设相关专业课程;以先进存力中心为核心,打造数据产业生态集聚区,形成完整数据产业链。
我们不难发现,华为围绕数据全生命周期,从理念、实践到生态建设全方位布局先进数据存力,助力我国从数据大国迈向数据强国。