K2发布后,Kimi研究员集体在X和知乎上搞起了“团建”
创始人
2025-07-18 11:42:11
0

作者|周一笑

KimiK2的发布几乎没什么预兆。

2025年7月11日深夜,月之暗面直接开源了这个万亿参数模型,整个AI圈子一下子就热闹起来。模型的能力很强,尤其是在代码和Agent任务上,没多久,它就和Grok4一起出现在了马斯克转发的热门模型趋势榜单上。

热度是有了,但这次的感觉和以往很不一样。

很多人还记得月之暗面曾经在市场投放上花巨额预算的那段时期。根据公开信息,当时为了给产品引流,公司曾在多个平台进行过激进的竞价广告投放,高峰期月预算达到数亿元。

这次Kimi的方式显然变了,取而代之的是一场更热闹也更有趣的线上派对,主角就是Kimi背后那群工程师和研究员。方式就是在国内外技术讨论度更高的几个社交媒体上用自己的方式,热烈地讨论着这个新诞生的“模型”,和自己在其中引以为傲的工作。

这让我们有机会看到这家公司的一些侧面。

更通透开放的介绍K2

这场“团建”其中一个重要舞台在知乎。

在一个提问“Kimi发布首个万亿参数开源模型K2,哪些信息值得关注?”的页面下,月之暗面的“接生群”成员们,开始陆续下场回答。这里说的“接生群”,是月之暗面内部对K2研发的一个戏称。

月之暗面Infra团队的刘少伟没有绕弯子,他直接承认K2在架构上“大体上是复用了DeepSeek-V3的架构”,并且贴了一张清晰的对比图。图里能看到Kimi选择的路线是“fewerheads,moreexperts”,也就是用更少的注意力头和更多的专家模块。他解释说,这么做是为了在和V3差不多的成本下,拿到更低的loss。

研究员FloodSung的分享则充满了对结果的兴奋。他觉得K2最值得关注的有两点,一个是MuonClip优化器带来的漂亮loss曲线,另一个就是Agent能力。为了做好Agent,他说团队建了一个“一生二,二生三,三生万物”的大规模自动化数据生产工厂。这个比喻听起来就很有画面感。这其实也正体现了在“未来谁更接近AGI”这个问题上,Kimi更激进的方向——试图通过复杂的Agent框架,来直接锤炼模型的思维能力。

负责后训练的研究员Dylan也带来了一点不一样的声音。他很坦诚地说,K2“实际上就是一个刚出生的baby”,虽然有灵性,但缺点也不少,他自己甚至觉得“略感惭愧”。这些声音拼在一起,让隐藏在技术细节背后的K2变得立体起来。

这些分享很快在社区里有了回响。HuggingFace的研究主管LeandrovonWerra就在X上说,他个人更喜欢工程师和研究员这种随性的网络帖子和讨论,因为“这样更容易愉快地理解他们决策背后的思考过程”。

一个更有意思的现象是,过去很长一段时间,都是国内开发者翻译国外的技术博客。这次,一些海外开发者开始翻译阅读Kimi团队成员的文章,然后分享到社区。有人评价说,这是一篇“对模型背后思考过程的优美总结/描述”和一篇“基于能力营销的精彩反思/宣言”。

这种话语权的微妙变化,都来自Kimi终于“想通了”,从过往对外在技术上并不怎么讨论,到开始营造某种类似lab的气氛,鼓励大家对外“写博客”。

Moonshot的Taste

技术分享之后,Kimi的研究员们开始给这些被吸引来的同行推介自己的公司。方式上主打一个AI创业圈最近很爱聊的“品味”。

月之暗面的团队成员Crystal在X上的一段话,被很多人转发。她说“我们的模型叫Kimi,但公司名叫Moonshot——灵感来自PinkFloyd的专辑《月之暗面》。我们是一群热爱摇滚(电台司令、平克·弗洛伊德)和电影(昆汀、库布里克)的科学家团队。我加入的一个重要原因就是觉得味道很对味”。

这种味道渗透在公司的各个角落。比如,他们的会议室,名字都取自传奇乐队,A到D区是TheRollingStones、Metallica、Bowie、Queen,E到G区则是Radiohead、GunsN'Roses、Nirvana。

“品味”也直接影响着他们的产品哲学。Crystal在一篇博客里复盘了KimiResearcher的UI设计历程,讲述了团队如何从模仿精致但平庸的风格,到逐渐意识到真正有价值的设计必须敢于突破常规。他们把这称为“惨痛教训”,最终形成的美学标准是拒绝模板化,追求能激发用户感受的独特体验。

类似的细节甚至延伸到了AppStore的版本更新历史里。

有网友挖出,Kimi的更新日志里引用了哲学家维特根斯坦和记者菲利普·格雷厄姆的话,把这些细节也与Kimi的品味结合起来,称它是“所有AI实验室中品味最佳”的。

工程师们的日常分享也充满了幽默感和人情味。有人会玩技术谐音梗,在一条讨论PyTorch新优化器Muon的推文下,俏皮地回复“tothe‘Muon’”。

也有一些能展现内部工作状态的段子。比如,Kimi用来推理的GPU在深夜会进入一种叫“潮汐GPU”的闲置状态,用来跑训练任务。但K2火了之后,“残酷现实”是“TideGPU已售罄”。还有人分享内部对话,说想找个速度更快的K2爽一下,被告知“不行,因为没卡”,想加钱也被拒了,理由还是“因为没卡”。

Kimi团队的这场线上“团建”,就这样持续了几天。它既有来自Infra和算法团队的技术硬核,也有贯穿在各个细节里的文化品味。但更多的,可能是那种团队上下都藏不住的喜悦和自豪感。蛰伏许久之后,他们终于有了再一次证明自己技术实力的机会。

这种情绪,也体现在团队成员们在X上刷屏似地转发着各类KOL和开发者对K2的赞赏。

“年初DeepSeek-R1暴涨之后,很多人说kimi是不是不行了,你们是不是恨死DeepSeek了?恰恰相反,不少同事都认为DeepSeek-R1的爆火是个大好事,它证明了硬实力就是最好的推广,只要模型做的好,就会获得市场认可;他证明了那条我们相信的路不仅能走通,而且是一条康庄大道。唯一的遗憾就是:这条路不是我们走通的。”Kimi的研究员“熊狸”在博客里写道。

“在年初的反思会上,我提出了一些相当激进的建议,没想到植麟后续的行动比我想的还要激进,比如不再更新K1系列模型,集中资源搞基础算法和K2。”他写道。

“2025年,智能的上限仍然完全由模型决定,作为一家以AGI为目标的公司,如果不去追求智能的上限,那我一天也不会多呆下去。”

与过往靠投放来放大产品上的声量相比,回归到一个预训练模型竞技场里,硬碰硬和最主流模型竞争,然后把自己的研究体验和成果分享给整个技术社区,显然是这些研究员们更能有成就感的方式。而这种方式也是整个技术社区最容易接受和喜欢的方式。

就像团队成员Haobing在他的推文里写下的那句“Nostructure,justpureintelligence.I'mtrulyproudtobeapartofKimi”。K2对于月暗的意义不只是一个模型,它让这家公司的人们又“活”了起来。

相关内容

热门资讯

华西妇幼数字医生:医生的第二智... 封面新闻记者 邱添 导语:近年来,人工智能作为新质生产力的核心驱动,正以前所未有的态势重塑着各个领域...
繁花有声|高德与阿里云一起,开... 2025-07-18 10:06:48 作者:狼叫兽 作为阿里云AI生态伙伴计划-"繁花计划"首批...
原创 小... 小米公司的宣传能力远超其它厂商,所以同类机型中,小米手机的热度和销量一般都比较高,例如6月30号发布...
众多“硬科技”项目扎堆来深路演 【深圳商报讯】(记者 周良成)7月17日,2025中国(深圳)独角兽企业大会开幕。大会以“新质驱动·...
H20芯片解禁幕后:黄仁勋向特... “英伟达CEO黄仁勋是如何说服特朗普向中国出售人工智能芯片的”?美国《纽约时报》17日披露了黄仁勋如...
推广中国文化 促进商务往来(孔... 二〇二四世界中文大会上,科林获颁“孔院之光”荣誉奖。 今年5月,科林主持“人工智能及其影响”专题论...
海尔智家获得实用新型专利授权:... 证券之星消息,根据天眼查APP数据显示海尔智家(600690)新获得一项实用新型专利授权,专利名为“...
受试者凭脑机接口实现“意念说话... 《科创板日报》17日讯,上海岩思类脑人工智能研究院近日与复旦大学附属华山医院合作,在脑机接口领域取得...
工信部:服务机器人上半年产量同... 南都讯 记者李玲 发自北京 “以5G、人工智能大模型等为代表的数字技术迅速发展,数字产业完成业务收入...
工信部:截至今年6月底,我国5... 中新网7月18日电 国新办18日就2025年上半年工业和信息化发展情况举行新闻发布会。工信部信息通信...
人工智能技术助力诊疗资源扩容—... 随着AI(人工智能)快速发展,相关技术正加快应用于诊疗一线。   去年11月,国家卫生健康委联合国家...
华为擎云亮相联通合作伙伴大会 ... 随着人工智能、5G、卫星互联网等前沿技术融合创新,数字基础设施正以技术迭代为引擎开启全新变革篇章,而...
2000元内拥有全能便携Hi-... 在千元级便携音乐播放器市场正被中高端“小尾巴”解码耳放逐步挤压的当下,飞傲旗下子品牌翡声推出的JM2...
原创 英... 当英伟达CEO黄仁勋在北京高调宣布“获批重启对华销售”时,华盛顿的政客们或许正咀嚼着一枚苦涩的果实—...
科技企业发布仿生机械手能完成精... 科技企业发布仿生机械手:引领精细手术新时代 近日,国内一家前沿科技企业正式推出其自主研发的仿生机械...
全球首个AI驱动科学大奖揭晓:... 凤凰网科技讯 7月18日,天桥脑科学研究院与美国科学促进会今日联合公布首届“天桥脑科学研究院与《科学...
原创 特... 前言 美国释放积极信号,又开始对华出口高端芯片了,为什么说特朗普这是在玩套路呢?从中美贸易战开打至今...
智慧园区系统:构建未来城市发展... 随着城市化进程的加速和科技的飞速发展,智慧园区系统作为城市现代化建设的重要组成部分,正逐渐成为推动区...
原创 5... 现在手机动不动就是几十GB的照片、几个G的游戏,别说128GB了,256GB都让很多朋友有“存储焦虑...
深圳宝安智造:为顶流机器人提供... 当特斯拉Optimus的灵巧手精准拿起勺子搅拌锅,Figure AI的多个机器人一起做家务,宇树科技...