当使用企业数据的从「人」变成「AI」，阿里云重做了一套基础设施_科技资讯

当使用企业数据的从「人」变成「AI」，阿里云重做了一套基础设施

创始人

2026-06-27 00:09:25

大模型越来越强，但 Agent 还缺一套「实时感知系统」。

作者｜连冉

编辑｜郑玄

过去一年，Agent 成为了 AI 行业最热门的关键词。

从自动写代码、整理信息，到端到端完成具体任务，整个行业都在见证 AI 从「回答问题」走向「完成工作」。

但当 Agent 真正进入企业生产环境，一个新的问题开始浮现：Agent 的最终质量，本质上取决于喂养它的数据质量与流转效率。模型再强，如果拿到的数据是滞后的、碎片化的、不同步的，也发挥不出应有的价值。

现实世界并不会等 AI 准备好。

金融市场每秒都在变化，直播间里不断产生新的内容，企业系统每天都会生成海量日志、交易记录和用户行为。对于一个真正工作的 Agent 来说，困难并不只是生成一个答案，而是在不断变化的环境中持续获得信息、理解变化，并做出下一步决策。

这也意味着，未来企业级 Agent 的形态需要发生变化：从过去「用户提出问题，AI 给出回答」的对话式交互，走向由真实世界事件不断驱动的 Event-driven Agent。

在 Flink Forward Asia（FFA）2026 上，阿里云宣布 Apache Flink 全面进入 Agentic Streaming 时代，回应的正是这一双重命题：AI 正从对话交互迈向事件驱动。Agent 的竞争力，本质上是数据供给质量与流转效率的竞争。底层数据基础设施的升级，已不是选项，而是前提。

过去支撑业务决策的实时数据流系统，正在成为 AI Agent 连接现实世界的核心入口。

大模型之后，数据基础设施需要变化

在过去的 BI 和实时计算时代，数据基础设施的核心任务，是帮助企业更快地理解已经发生的事情。

以 Flink 为代表的实时计算系统，解决的是如何处理不断产生的数据流：订单变化、用户行为、交易记录、系统日志等结构化数据经过实时计算后，被转化为业务决策所需要的信息。

这个阶段，数据的主要使用者是人——数据开发工程师编写任务，分析师查看报表，业务人员基于结果做判断。

但随着 AI 进入生产环境，数据基础设施正在面临一次新的变化。

在阿里云开源大数据平台负责人王峰看来，Flink 向 Agentic Streaming 演进，是流计算技术自身优势与 AI 时代需求的一次结合。过去流计算解决的是数据实时流动的问题，而 Agent 时代需要解决的是，如何让智能系统持续感知现实世界。

变化首先来自数据本身。

过去企业的数据主要是结构化信息，围绕数据库和业务系统产生；但 AI 时代，大模型和 Agent 需要处理的数据范围正在快速扩大。文本、图片、音频、视频、传感器信号，以及来自各种业务系统的实时事件，都成为 AI 理解世界的一部分。

王峰提到，过去系统更多处理日志、订单、交易这样的数据，而未来需要承接的是摄像头、车联网、直播流、消息队列中持续产生的信息。数据规模没有只是简单增长，而是从单一形态走向全模态、从静态信息走向动态事件。

更重要的变化，是数据的使用者变了。

过去，数据最终服务的是人：工程师写 SQL，分析师做分析，运营人员制定规则。但进入 Agent 时代，数据开始直接服务 AI 系统。一个真正工作的 Agent，并不只是等待用户输入后生成答案，而需要持续获得新鲜、准确、完整的数据，根据环境变化不断调整判断。

这也是为什么 Agent 的能力上限，越来越取决于背后的数据质量和处理效率。

大模型提供的是理解和推理能力，但如果 Agent 无法及时获得正确的上下文，就很难真正参与复杂业务。无论是智能运维、金融风控，还是内容分析，本质上都要求 AI 能够接住现实世界不断产生的事件，并基于这些变化做出行动。

因此，AI 时代数据基础设施的核心命题正在发生变化：过去解决的是「如何把数据及时送到人的手里」，而现在需要解决的是「如何让数据持续驱动智能」。

这也是 Flink 进入 Agentic Streaming 时代背后的核心逻辑。

从实时计算到 Agent，

Flink 正在重做 AI 的「基础设施层」

当下行业讨论的 Agent，大多集中在编程助手、个人效率工具这类场景，本质还是「人提出需求，AI 完成任务」的对话式交互，触发源始终是人的指令。但在更广阔的企业生产场景里，绝大多数触发源，是系统自发产生、永不停歇的事件。

在王峰看来，未来 To B 领域会走出一条独立的赛道——事件驱动型 Agent。它不需要人发起对话，而是由海量持续产生的业务事件触发，7×24 小时自主运行、异步响应、自主决策，是真正能嵌入生产流程的 AI 形态。

这类 Agent 已经在多个场景里显现出价值。

比如智能运维，企业 IT 系统每秒产生海量日志、指标与异常事件，过去靠人工运维和固定规则排查故障，现在事件驱动 Agent 可以实时收集全量运行数据，结合大模型诊断性能瓶颈，自动调整资源并发、完成故障自愈。阿里云内部已经实现了「用 Flink Agent 运维 Flink」，数千个计算任务的扩缩容、异常修复全程无需人工介入。

Flink 能支撑这类场景，核心在于把流计算沉淀十几年的原生能力，变成了 Agent 运行的基础底座。

在王峰看来，这正是 Flink 和主流多模态计算引擎的核心差异：很多引擎擅长处理离线批量的多模态数据，但 Flink 作为纯流式引擎，既能承接存量批量数据，也能对接无限流淌的实时数据流，覆盖的场景边界更广。它的流水线架构实现了 CPU 与 GPU 全链路流水运转，数据不落盘、网络直传，让 GPU 资源持续满负荷运行。

另一方面是原生的状态管理与多流对齐能力。王峰解释道，这部分能力其实是流计算的原生积累——BI 时代沉淀的分布式状态管理系统，可以直接复用为 Agent 的短期记忆载体，再对接外部向量数据库承载长期知识，不用从零搭建上下文体系。而水位线、窗口机制天然能解决多模态数据速率不一致、到达有时间差的问题，把多路数据按时间轴精准对齐，避免 AI 拿到碎片化的「拼图碎片」。

计算能力之外，Agent 持续运行还需要稳固的存储底座，这也是 Flink 生态正在补齐的关键一环——由 Flink 社区孵化的 Apache Paimon 与 Apache Fluss 共同构成的 Agentic Lake，实现了湖流一体的完整架构。

其中 Paimon 作为下一代流式数据湖，负责全模态数据的沉淀与统一管理；Fluss 作为专门的流存储系统，负责实时数据流转与 Agent 上下文供给。两者双向自动互通，一个管「数据沉淀」，一个管「实时输送」，让 Agent 永远有新鲜、完整的上下文可以调用，形成了从存储到计算的完整闭环。

事实上，To B 生产级 Agent 对可靠性的要求远高于消费级产品：个人 Agent 出问题重启即可，但承载业务的 Agent 必须支持 7×24 小时稳定运行、具备故障自愈能力，这正是 Flink 多年企业级场景沉淀的核心长板。

说到底，Agent 从 Demo 走向生产，瓶颈在于能不能长时间、稳定、可靠地跑在业务里。Flink 想做的，就是通过孵化 Flink Agents 项目，把自己沉淀多年的可靠性、一致性与容错能力，变成事件驱动 Agent 的通用运行底座——也就是 Streaming Agent-OS。

Agent 时代，基础设施竞争才刚刚开始

回看技术产业的竞争脉络，云计算时代，企业比拼的是计算与存储的资源效率；大模型爆发初期，行业关注的是参数规模与榜单成绩；而当 AI 开始真正走进业务、走向落地，竞争的重心正在从「大脑有多聪明」，转向「能不能持续感知真实世界」。

Flink 提出 Agentic Streaming，本质是给实时计算重新下了定义。

它不再只是大数据团队的专用工具，而是 AI 时代的通用基础软件：向上，通过全模态数据流处理为大模型输送高质量的实时燃料；向内，通过 Streaming Agent-OS 支撑事件驱动 Agent 的稳定运行；向下，通过 Agentic Lake 的湖流一体架构，筑牢永远在线的数据底座。

王峰谈到，目前 Flink 开源社区的项目管理委员会已经在推进 3.0 版本的规划讨论，面向 AI 与全模态的升级是全球社区的共识，国内外多家头部科技公司都已参与共建。从计算引擎到存储生态，整个技术栈都在围绕 Agent 场景持续演进。

如果说大模型是 AI 的「大脑」，负责思考与决策，那么一套完整的实时数据体系就是 AI 的「神经系统」——它持续感知外界变化，把分散的信号整理成有序的信息，精准传递给大脑，再把决策同步到执行端。Flink 正在做的，就是把这套神经系统的基础设施做扎实。

大模型的能力迭代还在继续，但 AI 应用的竞争，早已从单点的模型能力，扩展到了全链路的系统能力。未来能真正规模化落地在千行百业的 Agent，靠的不只是更聪明的模型，更是足够稳定、高效、实时的数据底座。

从这个角度看，AI 与 Agent 的基础设施的竞争，其实才刚刚拉开序幕。

*头图来源：阿里云 FFA

本文为极客公园原创文章，转载请联系极客君微信 geekparkGO

极客一问

你如何看待 AI 与 Agent 的基础设施的竞争？

上一篇：GPT-5.6紧急叫停！OpenAI最强模型被迫「一客一审」

下一篇：华为赵振龙：AI赋能网络新质生产力，华为无线网络智能体激活网络新动能

当使用企业数据的从「人」变成「AI」，阿里云重做了一套基础设施

相关内容

热门资讯