大模型越来越强,但 Agent 还缺一套「实时感知系统」。
作者|连冉
编辑| 郑玄
过去一年,Agent 成为了 AI 行业最热门的关键词。
从自动写代码、整理信息,到端到端完成具体任务,整个行业都在见证 AI 从「回答问题」走向「完成工作」。
但当 Agent 真正进入企业生产环境,一个新的问题开始浮现:Agent 的最终质量,本质上取决于喂养它的数据质量与流转效率。模型再强,如果拿到的数据是滞后的、碎片化的、不同步的,也发挥不出应有的价值。
现实世界并不会等 AI 准备好。
金融市场每秒都在变化,直播间里不断产生新的内容,企业系统每天都会生成海量日志、交易记录和用户行为。对于一个真正工作的 Agent 来说,困难并不只是生成一个答案,而是在不断变化的环境中持续获得信息、理解变化,并做出下一步决策。
这也意味着,未来企业级 Agent 的形态需要发生变化:从过去「用户提出问题,AI 给出回答」的对话式交互,走向由真实世界事件不断驱动的 Event-driven Agent。
在 Flink Forward Asia(FFA)2026 上,阿里云宣布 Apache Flink 全面进入 Agentic Streaming 时代,回应的正是这一双重命题:AI 正从对话交互迈向事件驱动。Agent 的竞争力,本质上是数据供给质量与流转效率的竞争。底层数据基础设施的升级,已不是选项,而是前提。
过去支撑业务决策的实时数据流系统,正在成为 AI Agent 连接现实世界的核心入口。
01
大模型之后,数据基础设施需要变化
在过去的 BI 和实时计算时代,数据基础设施的核心任务,是帮助企业更快地理解已经发生的事情。
以 Flink 为代表的实时计算系统,解决的是如何处理不断产生的数据流:订单变化、用户行为、交易记录、系统日志等结构化数据经过实时计算后,被转化为业务决策所需要的信息。
这个阶段,数据的主要使用者是人——数据开发工程师编写任务,分析师查看报表,业务人员基于结果做判断。
但随着 AI 进入生产环境,数据基础设施正在面临一次新的变化。
在阿里云开源大数据平台负责人王峰看来,Flink 向 Agentic Streaming 演进,是流计算技术自身优势与 AI 时代需求的一次结合。过去流计算解决的是数据实时流动的问题,而 Agent 时代需要解决的是,如何让智能系统持续感知现实世界。
变化首先来自数据本身。
过去企业的数据主要是结构化信息,围绕数据库和业务系统产生;但 AI 时代,大模型和 Agent 需要处理的数据范围正在快速扩大。文本、图片、音频、视频、传感器信号,以及来自各种业务系统的实时事件,都成为 AI 理解世界的一部分。
王峰提到,过去系统更多处理日志、订单、交易这样的数据,而未来需要承接的是摄像头、车联网、直播流、消息队列中持续产生的信息。数据规模没有只是简单增长,而是从单一形态走向全模态、从静态信息走向动态事件。
更重要的变化,是数据的使用者变了。
过去,数据最终服务的是人:工程师写 SQL,分析师做分析,运营人员制定规则。但进入 Agent 时代,数据开始直接服务 AI 系统。一个真正工作的 Agent,并不只是等待用户输入后生成答案,而需要持续获得新鲜、准确、完整的数据,根据环境变化不断调整判断。
这也是为什么 Agent 的能力上限,越来越取决于背后的数据质量和处理效率。
大模型提供的是理解和推理能力,但如果 Agent 无法及时获得正确的上下文,就很难真正参与复杂业务。无论是智能运维、金融风控,还是内容分析,本质上都要求 AI 能够接住现实世界不断产生的事件,并基于这些变化做出行动。
因此,AI 时代数据基础设施的核心命题正在发生变化:过去解决的是「如何把数据及时送到人的手里」,而现在需要解决的是「如何让数据持续驱动智能」。
这也是 Flink 进入 Agentic Streaming 时代背后的核心逻辑。
02
从实时计算到 Agent,
Flink 正在重做 AI 的「基础设施层」
当下行业讨论的 Agent,大多集中在编程助手、个人效率工具这类场景,本质还是「人提出需求,AI 完成任务」的对话式交互,触发源始终是人的指令。但在更广阔的企业生产场景里,绝大多数触发源,是系统自发产生、永不停歇的事件。
在王峰看来,未来 To B 领域会走出一条独立的赛道——事件驱动型 Agent。它不需要人发起对话,而是由海量持续产生的业务事件触发,7×24 小时自主运行、异步响应、自主决策,是真正能嵌入生产流程的 AI 形态。
这类 Agent 已经在多个场景里显现出价值。
比如智能运维,企业 IT 系统每秒产生海量日志、指标与异常事件,过去靠人工运维和固定规则排查故障,现在事件驱动 Agent 可以实时收集全量运行数据,结合大模型诊断性能瓶颈,自动调整资源并发、完成故障自愈。阿里云内部已经实现了「用 Flink Agent 运维 Flink」,数千个计算任务的扩缩容、异常修复全程无需人工介入。
Flink 能支撑这类场景,核心在于把流计算沉淀十几年的原生能力,变成了 Agent 运行的基础底座。
在王峰看来,这正是 Flink 和主流多模态计算引擎的核心差异:很多引擎擅长处理离线批量的多模态数据,但 Flink 作为纯流式引擎,既能承接存量批量数据,也能对接无限流淌的实时数据流,覆盖的场景边界更广。它的流水线架构实现了 CPU 与 GPU 全链路流水运转,数据不落盘、网络直传,让 GPU 资源持续满负荷运行。
另一方面是原生的状态管理与多流对齐能力。王峰解释道,这部分能力其实是流计算的原生积累——BI 时代沉淀的分布式状态管理系统,可以直接复用为 Agent 的短期记忆载体,再对接外部向量数据库承载长期知识,不用从零搭建上下文体系。而水位线、窗口机制天然能解决多模态数据速率不一致、到达有时间差的问题,把多路数据按时间轴精准对齐,避免 AI 拿到碎片化的「拼图碎片」。
计算能力之外,Agent 持续运行还需要稳固的存储底座,这也是 Flink 生态正在补齐的关键一环——由 Flink 社区孵化的 Apache Paimon 与 Apache Fluss 共同构成的 Agentic Lake,实现了湖流一体的完整架构。
其中 Paimon 作为下一代流式数据湖,负责全模态数据的沉淀与统一管理;Fluss 作为专门的流存储系统,负责实时数据流转与 Agent 上下文供给。两者双向自动互通,一个管「数据沉淀」,一个管「实时输送」,让 Agent 永远有新鲜、完整的上下文可以调用,形成了从存储到计算的完整闭环。
事实上,To B 生产级 Agent 对可靠性的要求远高于消费级产品:个人 Agent 出问题重启即可,但承载业务的 Agent 必须支持 7×24 小时稳定运行、具备故障自愈能力,这正是 Flink 多年企业级场景沉淀的核心长板。
说到底,Agent 从 Demo 走向生产,瓶颈在于能不能长时间、稳定、可靠地跑在业务里。Flink 想做的,就是通过孵化 Flink Agents 项目,把自己沉淀多年的可靠性、一致性与容错能力,变成事件驱动 Agent 的通用运行底座——也就是 Streaming Agent-OS。
03
Agent 时代,基础设施竞争才刚刚开始
回看技术产业的竞争脉络,云计算时代,企业比拼的是计算与存储的资源效率;大模型爆发初期,行业关注的是参数规模与榜单成绩;而当 AI 开始真正走进业务、走向落地,竞争的重心正在从「大脑有多聪明」,转向「能不能持续感知真实世界」。
Flink 提出 Agentic Streaming,本质是给实时计算重新下了定义。
它不再只是大数据团队的专用工具,而是 AI 时代的通用基础软件:向上,通过全模态数据流处理为大模型输送高质量的实时燃料;向内,通过 Streaming Agent-OS 支撑事件驱动 Agent 的稳定运行;向下,通过 Agentic Lake 的湖流一体架构,筑牢永远在线的数据底座。
王峰谈到,目前 Flink 开源社区的项目管理委员会已经在推进 3.0 版本的规划讨论,面向 AI 与全模态的升级是全球社区的共识,国内外多家头部科技公司都已参与共建。从计算引擎到存储生态,整个技术栈都在围绕 Agent 场景持续演进。
如果说大模型是 AI 的「大脑」,负责思考与决策,那么一套完整的实时数据体系就是 AI 的「神经系统」——它持续感知外界变化,把分散的信号整理成有序的信息,精准传递给大脑,再把决策同步到执行端。Flink 正在做的,就是把这套神经系统的基础设施做扎实。
大模型的能力迭代还在继续,但 AI 应用的竞争,早已从单点的模型能力,扩展到了全链路的系统能力。未来能真正规模化落地在千行百业的 Agent,靠的不只是更聪明的模型,更是足够稳定、高效、实时的数据底座。
从这个角度看,AI 与 Agent 的基础设施的竞争,其实才刚刚拉开序幕。
*头图来源:阿里云 FFA
本文为极客公园原创文章,转载请联系极客君微信 geekparkGO
极客一问
你如何看待 AI 与 Agent 的基础设施的竞争?