🤖 由 文心大模型 生成的文章摘要
阿里巴巴开源了最新一代旗舰编程模型
7月23日,阿里巴巴Qwen团队有了大动作,开源了其最新一代旗舰编程模型Qwen3-Coder-480B-A35B-Instruct。Qwen团队表示,这是他们目前最强大的开源智能体编程模型。其拥有480B参数,激活参数为35B,原生支持256K上下文,并且通过外推的方式,能够将上下文扩展至100万(输入),最大输出可达6.5万token。
在基准测试中,Qwen3-Coder在编程和智能体任务方面展现出了卓越的性能。在AgenticCoding(智能体编程)、AgenticBrowser-Use(智能体浏览器使用)和AgenticTool-Use(智能体工具调用)这三类任务中,Qwen3-Coder成绩优异,达到了开源模型中的最优水平,超越了Kimi K2、DeepSeekV3等开源模型,甚至比GPT-4.1等闭源模型表现得还要出色,能与以编程能力闻名的ClaudeSonnet4模型一较高下。
Qwen3-Coder将推出多种尺寸,此次开源的是其最强大的变体。它的参数量超过了阿里旗舰模型Qwen3的235B(2350亿),不过小于Kimi K2的1T(1万亿)。据阿里官方介绍,借助Qwen3-Coder,刚入行的程序员一天就能完成资深程序员一周的工作,生成一个品牌官网最快只需5分钟。
除了模型本身,Qwen还开源了一个基于GeminiCode分叉而来的智能体编程命令行工具——QwenCode。这个工具进行了定制提示和函数调用协议的适配,能让Qwen3-Coder在智能体编程任务上的能力得到更充分的发挥。
目前,这一模型已在阿里云旗下大模型服务平台百炼上线,其API采用阶梯计费方式,根据输入token量调整价格。在256K-1M这一档,输入价格为6美元/百万token,输出价格为60美元/百万token。与之对比,ClaudeSonnet4的输入输出价格分别为3美元/百万token、15美元/百万token,与Qwen3-Coder128k-256k一档的价格相同。