【深度】登顶全球最强开源模型:阿里宣布开源Qwen3
创始人
2025-04-30 18:40:57

4月29日凌晨,阿里巴巴(BABA/09988)宣布,新一代通义千问大模型Qwen3正式发布并全部开源8款混合推理模型。

该模型采用国内首创的混合推理架构,参数量仅为DeepSeek-R1的1/3,成本大幅下降,在数学推理、代码生成等核心指标超越DeepSeek-R1及OpenAI开源模型,登顶全球最强开源大模型榜单。

Qwen3采用混合专家架构(MoE),总参数量235B,激活参数仅22B,其“快思考”与“慢思考”模式可根据需求动态分配算力,如秒级响应简单问题,多步骤处理复杂任务,显著降低推理成本。在数学(AIME25 81.5分)、代码(LiveCodeBench 70+分)、人类偏好对齐(ArenaHard 95.6分)等评测中,Qwen3均刷新纪录,部分指标甚至超越Grok3和OpenAI-o1。

阿里此次开源包含235B、30B MoE及0.6B-32B等8款模型,其中30B版本以3B激活量实现上代Qwen2.5-32B模型性能,32B稠密模型跨级超越Qwen2.5-72B。全系支持“思考预算”配置,适配手机(4B)、汽车(8B)、企业级(32B)等场景。结合Qwen-Agent框架及MCP(模型上下文)协议,开发者可低代码调用工具功能,加速智能体(AI Agent)应用落地。

据阿里2024年财报,截至2024年12月31日止9个月,云业务收入同比增长9%至879亿元,AI相关收入占比持续提升。Qwen3的开源将进一步增强阿里云对大模型企业的吸引力,推动其“模型即服务”(MaaS)生态扩张。

目前,通义系列模型全球下载量超3亿次,衍生模型超10万,已超越美国Llama成为全球第一开源模型。

相关内容

热门资讯

谷歌苹果强烈警告!H-1B员工... 新智元报道 编辑:桃子 【新智元导读】谷歌、苹果两大巨头,内部紧急提醒H-1B员工:此时离境,或因...
原创 欧... 把顾客当上帝的甜头,再次被蜜雪冰城尝到了。 最近,雪王在美国卖超甜奶茶火上热搜,其在洛杉矶的门店十分...
一组数据看懂我国数字消费潜力 中国互联网络信息中心近日发布《数字消费发展报告(2025)》。报告显示,今年上半年,我国数字消费总额...
申科股份拟设立风电业务全资子公... 来源:证券时报e公司 申科股份(002633)12月21日晚公告,公司拟在上海市设立全资子公司(以下...
开悟世界模型3.0发布,让机器... 近日,大晓机器人公司在上海发布了开悟世界模型3.0。这个开源大模型在研发范式上有所创新,研发团队将人...