DeepSeek又一论文上新
创始人
2026-02-27 21:01:45

钛媒体App 2月27日消息,在业界对新一代旗舰模型DeepSeek V4的翘首期盼中,DeepSeek团队却悄然放出了一篇新的学术论文。这篇论文由DeepSeek联合北大、清华共同撰写,将研究方向投向了决定大模型实际应用落地的关键一环——推理速度,为日益复杂的AI智能体,提供一套高效的底层系统解决方案。具体来说,新论文介绍了一个名为DualPath的创新推理系统,专门针对智能体工作负载下的大模型(LLM)推理性能进行优化。通过引入“双路径读取KV-Cache(类似记忆缓存)”机制,重新分配存储网络负载,将离线推理吞吐量最高提升1.87倍,在线服务的每秒智能体运行数平均提升1.96倍。论文在引言部分提到,大模型正从单轮对话机器人和独立推理模型,快速演进为智能体系统 ——能够自主规划、调用工具,并通过多轮交互解决实际任务。这种应用范式的转变,推动大模型推理工作负载发生重大变革:从传统的人类-大模型交互,转向人类-大模型-环境交互,交互轮次可达数十甚至数百轮。(第一财经)

相关内容

热门资讯

民易行取得多功能电池箱体专利,... 国家知识产权局信息显示,上海民易行能源科技有限公司取得一项名为“一种多功能电池箱体”的专利,授权公告...
ChatGPT测试“成人语言”... AIPress.com.cn报道 2月28日消息,据科技媒体Android Authority报道,...
富联裕展申请散热中框及移动终端... 国家知识产权局信息显示,富联裕展科技(深圳)有限公司申请一项名为“散热中框、移动终端及基于3D打印的...
无需外力,神奇超材料可自行收放 荷兰莱顿大学物理学家在25日的《自然》杂志刊发研究报告称,他们制造出一种神奇的超材料,无需任何外力驱...
恶意Go加密模块窃取密码并部署... 网络安全研究人员披露了一个恶意Go模块的详细信息,该模块旨在窃取密码、通过SSH创建持久访问权限,并...