MiniMax训练推理模型仅花384万,售价对标豆包
创始人
2025-06-17 16:00:43
0

DeepSeek掀起推理模型热潮近半年之后,MiniMax于6月17日发布并开源其首款推理模型M1。按照官方说法,M1一项显著优势是支持目前业内最高的100万Token的上下文输入长度——为DeepSeek R1的8倍,以及业内最长的8万Token的推理输出。

据MiniMax解释,这主要得益于模型架构的创新。技术报告显示,M1模型采用了混合专家(Mixture-of-Experts, MoE)架构,并结合了一种新型的“闪电注意力”(Lightning Attention)机制。

MoE架构类似于“专家咨询小组”,当用户有问题输入,模型会“邀请”(激活)最适合的几个专家参与“讨论”(推理输出),从而节省资源。而“闪电注意力”机制意在突破transformer传统架构记忆瓶颈,优化长文本推理时对计算资源的利用效率,提升长文本处理能力。技术报告显示,“闪电注意力”机制驱动下,生成10万token时,M1所需推理算力仅为DeepSeek R1 的25%。

长文本处理能力对AI智能体的发展至关重要,可增强智能体的长期记忆力,实现多步骤操作。MiniMax此前提到,不管是单Agent的系统需要持续的记忆,还是多Agent的系统中Agent之间大量的相互通信,都需要越来越长的上下文。

基于架构等技术上的创新,MiniMax透露,M1模型的整个强化学习训练阶段,仅在512张英伟达H800 GPU上用时三周完成,租赁成本仅为53.47万美元(约为384万元人民币)。

MiniMax表示,因为相对高效的训练和推理算力使用,公司以业内最低的价格在官网提供M1模型的API服务。具体而言,在0-32k的输入长度的时候,输入0.8元/百万token,输出8元/百万token;在32k-128k的输入长度的时候,输入1.2元/百万token,输出16元/百万token;在最长的128k-1M 的输入长度的时候,输入2.4元/百万token,输出24元/百万token。

记者注意到,MiniMax采取的“区间定价”的策略,和近期豆包大模型1.6的做法类似。豆包将价格区间为0-32k、32K-128K与128K-256K。256K即为豆包大模型1.6支持的最大上下文长度。此外,MiniMax三个区间的价格和豆包大模型1.6的价格完全一致。

火山引擎总裁谭待6月11日公开解释说,一些模型厂商会根据是否启用深度思考或多模态功能来差异化定价。然而,对于同结构、同参数的模型而言,真正影响成本的关键因素并不是这些功能,而是上下文窗口的长度——成本随长度增加而递增。实践中,企业的大部分模型调用,其输入长度范围都在32K以内。

谭待认为,区间定价的新模式,能够让多模态深度思考模型得到更广泛的调用,从而加速AI智能体的大规模应用。这是因为,Agent执行任务的Token消耗量大,降低Token成本尤为关键。

值得一提的是,MiniMax在B端上走纯API的商业模式,不会像另一家大模型头部公司智谱那样提供定制化服务。

MiniMax内部模型团队大致分为文本模型、视觉模型(视频图像模型)和语音模型三大板块,每一模型类别下目前均有对应的C端产品。

除了此次发布的推理模型M1,MiniMax预告接下来连续四个工作日会有其他更新。据记者了解,其他更新与MiniMax的语音、视频等模型相关。

采写:南都记者 杨柳

相关内容

热门资讯

华为发布《智慧园区WLAN通感... 2025年6月6日,在华为数据通信创新峰会2025亚太站期间,华为联合世界无线局域网应用发展联盟(W...
两度飞天!费俊龙亮相国新办讲述... 新征程上的奋斗者 南都讯记者潘珊菊 发自北京 6月17日,国新办举行的“新征程上的奋斗者”记者见面会...
中国科学院院士王赤:通过国际大... 记者 张峥 2024-2025年太阳活动峰年,马斯克旗下太空探索技术公司超过300颗星链卫星从天而降...
智防护林海 科技固屏障 6月15日,随着林区森林防火期正式结束,历时93天的春季森林防灭火工作画上圆满句号。今年以来,龙江森...
原创 华... 6月12日晚,湖南华民控股集团股份有限公司(简称“华民股份”300345)公告称,华民股份与广东天太...
从通用到垂类:大模型产业攻坚进... 6月16日,国家统计局发布数据显示,2025年5月,中国规模以上工业增加值同比增长5.8%,累计增速...
伊拉克油气与可再生能源开发国家... 6月13日,19个共建“一带一路”国家的40余名学者、科学家走进西南石油大学,探讨国际能源领域科研合...
原创 为... 在地球这个蓝色星球上,生命的脉络以一种独特的形式存在 —— 碳基生命。从海洋深处的神秘生物,到陆地上...
周口市中医院召开科研大会 近日,周口市中医院召开科研大会,系统规划医院科研发展蓝图,标志着该院科研工作迈入新阶段。周口市中医院...
摩尔线程申请数据传输技术相关专... 金融界2025年6月17日消息,国家知识产权局信息显示,摩尔线程智能科技(北京)股份有限公司申请一项...
上海移动开启5G-A 2.0时... 6月17日,中国移动通信集团上海有限公司宣布开启5G-A 2.0时代,进一步提升5G-A网络能力,创...
权威发布:金秋九月(9月3-5... 2025中国(杭州)国际低空经济博览会暨无人系统嘉年华9月3-5日在杭州国际博览中心举办。这场即将在...
南方德尔取得缓速器电控板测试设... 金融界2025年6月17日消息,国家知识产权局信息显示,深圳南方德尔汽车电子有限公司取得一项名为“一...
珠海移动携手中兴通讯,5G-A... 近日,珠海移动携手中兴通讯,成功运用5G-A通感一体多源感知融合方案,结合AI大数据能力,实现对飞鸟...
工作动态 | 结古公路段开展公... 为推动公路养护工作向智能化、科技化迈进,全面提升养护人员无人机实操与应用水平,结古公路段近日组织开展...
我们孤独吗?为何科学家热衷于探... 由中国科学院云南天文台研究员顾盛宏领衔的国际联合研究团队首次利用凌星中间时刻变化反演技术,在类太阳恒...
宜林则林、宜草则草 “沙退绿进... 央视网消息:三北地区生态环境的持续向好,不仅是一代代中国人接力奋斗的成果,更是源于科学治沙经验的深厚...
助力深圳打造全球科创高地 【深圳商报讯】(记者 刘娥)继港之龙科技园专家服务驿站启动后,科创汇智|2025年深圳市科技专家服务...
首期人工智能特训营正式开营:聚... 2025年6月6日,由北京大学信息技术高等研究院(以下简称“北大信研院”)与北京大学南昌创新研究院(...
中国领跑自然指数2025:科研... 近日,自然指数2025年度科研领导者榜单正式发布,中国再次以显著优势位居全球第一,巩固了其作为科研超...