从有概念出现开始,短短的两三年内智能体已经泛滥成灾了。
马克·扎克伯格曾预测,未来人类将生活在一个有数亿甚至数十亿AI智能个体的世界中,最终AI智能体的数量可能会比人类还多。
这种看似激进的说法,现在看来有点保守了,智能体的数量正在爆炸式增长。
AI智能体(AI Agent)是具备自主决策与执行能力的智能代理系统,结合大模型、自动化工具和行业知识库,不仅能理解指令,拥有记忆能力,还能规划任务、调用工具(如API、数据库),被业内认为是大模型深入产业的重要桥梁。
之前,9.11和9.9谁更大这么一道简单的数学题,难倒了国内外多个顶级大模型。其实要是能“调用”个计算器或者什么工具,这个问题就很容易解决。这一个小问题,反映出了大模型的技术局限性。尤其是在解决一个实际任务的时候,这种局限性就会更加凸显。
具有自主驱动、任务规划、工具调用等技术特点的智能体正在成为大模型领域新的热点,甚至在国外有盖过大模型之势。比尔·盖茨认为:“智能体会改变每个人与计算机交互的方式。”
可以看到,国外的Open AI、Meta、微软、谷歌等巨头都在大规模投注智能体。
近期,谷歌发布了开源AI智能体Gemini CLI,将AI问答、内容生成等功能集成至开发者的终端界面,大大提升了开发效率。几乎是前后脚,Open AI也陆续发布了Operator、云端AI编程等智能体。
在国内,我们的智能体供应更是“量大管饱”。IDC数据显示,截至2024年9月,通义、讯飞星火、豆包等平台的智能体数量分别超过1.6万个、1.1万个、9000个,到2024年12月,头部综合类AI原生应用智能体数量已超10万个。
进入到2025年,智能体依旧保持增长的态势,基本上每个月都有新产品发布。
1月,科大讯飞发布一系列智能体。在C端,升级发布了讯飞智文、讯飞文书、讯飞绘文和讯飞绘镜,聚焦智能PPT制作、文书写作、自媒体运营和视频创作。在B端,发布星火纪要、星火投标、星火陪练和星火快答,聚焦会议总结、投标、培训和接待等业务场景效率。
2月,复星医药发布PharmAID决策智能体平台,聚焦医药领域的智能问询。
3月,智谱AI发布AutoGLM沉思智能体,它能够模拟人类的思维过程,完成从数据检索、分析到生成报告。
4月,百度发布文心快码Coding智能体Zulu,支持多模态高效交互,上传图片,即可一键生成完整代码。
5月,联想发布法思AI智能体律师助手、想想帮服务智能体、天禧个人超级智能体、乐享企业超级智能体。
6月,百度智能云推出覆盖金融、电力、交通等多个行业的“场景智能体”解决方案。
这些都只是冰山一角,市场上还有很多“散养”的智能体根本无法统计。
不知不觉间,智能体这么高大上的前沿科技,已经在“批量化”生产了,这对技术发展而言究竟是好还是坏呢?
首先说好的一面。智能体能够走量,很大程度上显出了在技术领域深厚的技术沉淀和庞大的人才储备。再加上我们这几年在算力、模型和数据的基础设施层面,砸下了至少几千亿的资金。这些不计成本的资金和技术投入,最终引发了智能体的大爆发。
现在,搭建一个智能体的门槛被大大降低,哪怕是不懂编程的人,也能基于完善的智能体平台搭建一个智能体。根据自己的业务属性,哪怕是职能部门的同事,也能无障碍搭建招聘智能体、面试智能体、合同审核智能体、财务智能体以及运营智能体等。有企业向数据猿反映,一个部门人均能达到三五个智能体,在某些场景下对于日常办公会起到提质增效的作用。
但是,这种“走量”现象的背后,必然存在一些非理性的一面。
以金融领域为例,金融是数字化程度最高的领域,也是业务场景最为庞大的领域之一,这为智能体提供了绝佳的用武之地。
翻开2024年上市银行的财报,AI与智能体几乎成了共有的关键词。中国银行2024年新增超900个大模型及智能体业务场景;建设银行落地193项场景应用;工商银行建成企业级千亿金融大模型技术体系“工银智涌”,赋能20余个主要业务领域、200余个场景……
这些国有大行领天下先,用实践探索智能体的落地路径。但很多银行的智能体建设画风却是另外一番景象。
“不得不承认,布局大模型已经是一个必须完成的任务。‘用不用’暂且不论,前提首先是你得有这些大模型。”一位某股份制银行的领导不讳言的说道。
事实上,很多智能体只会存在于宣传或者演示中,某城商行就发生过这样的事情。上面有领导要来视察银行拥抱人工智能的成果,消息传出后,银行提前一两个月突击作战。基于外购的智能体平台,调几个参数,设计一些场景,增加一些本地的数据和知识,作出几个“热腾腾”的智能体。比如做一个银行数字人,领导来的时候能跟领导互动一下。设计一个智能客服智能体,给领导展示一下先进的客户服务能力。
但领导走后,这些智能体可能就束之高阁了。
这种情况并不只存在于银行领域,这种因为别人有,我也必须得有的情况,在其他领域可能更甚。
在其他领域,很多智能体根本都算不上智能体,充其量就是大模型外挂了一个知识库。还有很多企业的基础大模型是买的,智能体是外包商帮着搭建的。搭建完了以后,还得有人专门指导怎么使用智能体。像这样的产品,指望它能发挥多么大的价值,那真是想多了。
但是量就这么堆上来了,现在打开百度搜索“智能体”,你会看到五花八门智能体产品。这些智能体除了名称不一样以为,根本找不到明显的差异。
分析机构Gartner认为,今年以来愈演愈烈的AI智能体概念热潮在很大程度上是炒作的结果,很多项目的“智能体化”仅仅是品牌名称重塑,在市场冷静后将会出现一波退潮。
到2027年底将有超40%智能体/代理人工智能 (Agentic AI) 项目将被取消。
这个数字我们认为是合理的,最终也许被淘汰的智能体会超过这个数字。这种淘汰不是一件坏事,我们可以把它看成是一种市场自我优化的正常出清。
智能体在各个领域的规模化入侵,反映出人们对于创新的焦虑。别管有没有用,需不需要,因为这个概念很新潮,必须要大干快上。但数量的堆叠并不能带来价值的提升,反而会流于形式,久而久之也会抑制大模型创新的动能,误导创新的方向。
而且,低效、混乱的智能体堆叠在系统中,还会带来巨大的治理成本和潜在风险。
The Futurum Group的CIO实践负责人Dion Hinchcliffe将智能体的泛滥比作RPA在其鼎盛时期不受控制的扩散。RPA最开始也是从一些细小的场景开始蔓延,比如自动化发票处理、客户入职等,但很快就演变成了一堆脆弱、重叠的机器人。如果智能体不加以节制,它们就会相互碰撞、重复工作,让用户和系统都感到困惑。
因此,一些低效、低应用价值的智能体,它们的消失并不是一件坏事,市场也无需为此感到紧张,这并不影响智能体向下一个阶段进化的历史大势。
当下最关键的问题是,如何让智能体实现“质”的有效增长。
智能体是技术进步的成果,但技术只是表象,其本质还是业务。因为智能体天然就是植根于场景和业务而生的,它不同于大模型,大模型的价值在于内容生成,不管是文字、代码还是视频图片,其主要能力在于交互,在于“chat”。而智能体的独特价值,是让AI从交互走向业务的精准实施,真正让AI服务于业务和物理场景。所以它不能悬在业务之上,更不能脱离业务之外,要不偏不倚,润物细无声的嵌入到业务中。
所谓善战者无赫赫之功,我们不能本末导致,让智能体唱了主角。
吴恩达曾发表过这样的观察:太多人在争论什么是真正的智能体,什么不是。这种争论往往陷入"这个系统是否真正自主"的哲学讨论,而非专注于解决实际问题。
因此,吴恩达提出了一个更加实用的框架:将智能体视为一个连续的光谱,不同系统具有不同程度的自主性。在这个框架下,一个只能执行简单任务的系统和一个能够进行复杂决策的系统,都可以被称为"agentic系统",只是智能化程度不同而已。
当前,大多数成功的智能体应用都是相对简单的线性工作流,而非复杂的自主决策系统。偶尔有一些分支判断,但整体上并不复杂。
吴恩达的观点非常有启发性,也更符合当前的实际情况。我们花了太多的时间和资源去讨论智能体的神圣性,厂商们似乎每一个都在憋着大招,隔三差五就想发布一个惊天动地的产品。但智能体恰恰在一些细小的场景下更能发挥价值。
比如,在法务、财务、行政、销售等部门,合同审核是一项艰巨的工作。有些合同厚得跟书一样,除了密密麻麻的汉字,还掺杂大量的数字、英文以及一些特殊符号。依靠人工比对不仅费时费力,还容易出错,所以往往一份合同需要多人多次审核才行。这么几圈审核下来,人被搞得疲惫不堪,不信你看看每个公司的财务都是什么精神状态。
这种机械化的事情,正好适合AI。 这是一个基于合同审核的场景,依托智能体搭建的一个工作流。可以看到,整个工作流逻辑简单、步骤清晰,是一个典型的小而美、细而短的工作流,这种工作流往往实用性更强。
合同审核工作流,引自网络
细而小的智能体那还能叫智能体吗?或者还有必要必须冠以名号吗?就像人类的毛细血管一样,我们不需要为每一根血管都单独起一个名字,这个是肾脏毛细血管,那个是脑神经毛细血管。
作为独立产品的智能体也许会消亡一批,也会隐匿一批,但是更多的智能体会以另外的方式焕发新生,以工作流的形式嵌入业务中。正如Gartner 2024报告显示:80%企业将“智能体能力”纳入采购标准,但仅15%要求独立产品。
在未来,智能体作为一个“单品”的存在样态可能不是最主要的,它将像神经系统一样,是一个庞大的系统,而且是动态变化的。智能体逐渐摆脱孤立的工具的角色,充分融入“人机环境”的体系中,在业务的驱动下实现多智能体协作。比如,在智慧交通的场景下,在未来可能需要几万个智能体紧密协作。
如果真如马克·扎克伯格所预料的那样,智能体的数量将超过人类,那么我们将被一个充满智能体的环境包围,也许“消失”是一个适合智能体生存的最佳状态。当一项技术开始“消失”,往往意味着它已从新奇玩具进化为不可或缺的基础设施——这恰是智能体走向成熟的标志。我们不需要刻意强调智能体的存在,因为它已经无处不在了。