字节跳动:2025年思考模型Seed-Thinking-v1.5技术报告
创始人
2025-08-22 16:20:55
0

今天分享的是:字节跳动:2025年思考模型Seed-Thinking-v1.5技术报告(英文版)

报告共计:19页

Seed1.5-Thinking技术报告总结

字节跳动推出的Seed1.5-Thinking是一款具备卓越推理能力的混合专家模型(MoE),其激活参数为200亿,总参数达2000亿。该模型在多个基准测试中表现优异,如AIME 2024获得86.7分,Codeforces取得55.0分,GPQA为77.3分,在STEM和编程领域展现出强大实力,同时在非推理任务上也有出色的泛化能力,相较于DeepSeek R1,胜率高出8%。

在模型开发方面,数据、强化学习(RL)算法和RL基础设施是三个关键要点。数据上,监督微调(SFT)依赖链式思维(CoT)数据,过多非CoT数据会降低模型探索能力;RL训练数据包含STEM问题、代码任务等四类,其中数学数据泛化能力强,能广泛提升各任务性能。

RL算法上,模型训练存在不稳定性,而团队研发的VAPO和DAPO框架分别针对演员-评论家及策略梯度范式,解决了这一问题,保障了训练的稳健性。

RL基础设施采用混合引擎架构, Streaming Rollout System(SRS)能缓解长响应生成中的滞后问题,结合多种并行机制和内存优化策略,提升了训练效率与可扩展性。

评估结果显示,Seed1.5-Thinking在数学推理的AIME 2024中与OpenAI的o3-mini-high持平,但在AIME 2025和BeyondAIME仍有差距;在科学领域GPQA接近o3水平;编程方面接近Gemini 2.5 Pro;逻辑推理的ARC-AGI上表现突出。人类评估中,其在非推理场景的整体胜率超DeepSeek R1 8.0%,更贴合人类偏好。

未来,团队计划探索更高效的强化学习方法,挑战更复杂任务,并研究通用奖励建模,以进一步提升模型智能边界。同时,还将公开BeyondAIME和Codeforces等内部基准,助力相关领域研究。

以下为报告节选内容

相关内容

热门资讯

携手国际通信专家,三维旗下海卫... 2025-08-22 15:53:11 作者:狼叫兽 记者 杨源 近日,三维通信旗下子公司海卫通举...
北医三院联手蚂蚁开发智能体,患... 8月22日,蚂蚁集团与北京大学第三医院达成战略合作,成立AI医疗联合创新实验室。顶级医院携手领先技术...
现在开进口车只剩下面子了吗? 文 | 新能源观 在新能源渗透率超50%的今天,大家买车更看重驾乘体验和性价比,所以国产车进入了千...
山西数据流量谷为转型注入数字动... 8月21日,在山西数据流量谷内,一位设计师正借助园区搭建的AI应用服务平台,沉浸式研习“AI赋能设计...
鼎图精密取得快速定位夹具专利,... 金融界2025年8月22日消息,国家知识产权局信息显示,东莞市鼎图精密机械设备有限公司取得一项名为“...
安全为锚,算力为基:云从科技与... 大模型技术正快速渗透千行百业,其变革力量令人瞩目,但伴随而来的安全与落地挑战——数据泄露、模型后门、...
明年亮相!小米玄戒O2正在开发... 近期,数码博主“智慧皮卡丘”爆料称,小米正在开发兼具主动散热系统的“玄戒 O2”电竞。该机型主打长时...
“成都高新造”机器人+AI产品... 8月21日, 成都第二批机器人与人工智能 实景验证活动正式启动, 来自6家企业的13款前沿产品 在成...
南卡 OE Mix2 开放式蓝... 出行不管是坐地铁还是开车,都离不开耳机的陪伴,然而市面上很多耳机戴起来不舒服,戴时间久了夹的耳朵酸痛...
追觅携AI扫地机进入韩国!目标... 【CNMO科技消息】近日,中国家电品牌追觅科技在韩国首尔中区酒店举行"2025追觅新品发布会",首次...
第三位“星际访客”正加速靠近太... 太阳系第三位“星际访客”3I/ATLAS正加速靠近太阳。这颗7月初穿过木星轨道时被发现的系外天体,自...
数据公司Databricks冲... 在近期美股IPO市场的狂热浪潮推动下,私募股权市场的水位也随之不断攀升。全球领先的数据、分析和人工智...
巨一科技获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示巨一科技(688162)新获得一项实用新型专利授权,专利名为“...
开普勒452b:地球“大表哥”... 在浩瀚的宇宙中,一颗名为开普勒452b的行星引发了人们的无限遐想。这颗被亲切地称为“地球大表哥”的系...
中建海龙取得多功能重载产品调度... 金融界2025年8月22日消息,国家知识产权局信息显示,广东海龙建筑科技有限公司、中建海龙科技有限公...
错误的充电方法影响手机寿命,警... 人们对手机充电的强烈需求,也让市面上催生出许多噱头产品,但到底什么才是手机充电的“正确姿势”呢? ...
原创 投... 近年来,AI Agent(智能体)赛道迎来爆发式增长。从AI编程工具到垂直行业解决方案,从通用型智能...
从本土深耕到全球布局,华为云数... 近日,第十六届中国数据库技术大会(DTCC 2025)在北京隆重召开。会议期间,大会特邀数据库领域专...
原创 火... 火星上那些干涸的河床,你说怪不怪?就像有人用巨斧在星球表面劈出一道道沟壑,有的地方还能看出水流冲刷的...
中信博获得外观设计专利授权:“... 证券之星消息,根据天眼查APP数据显示中信博(688408)新获得一项外观设计专利授权,专利名为“吊...