小红书揭秘:FinOps实践下的云成本优化与资源效率提升策略
创始人
2025-08-31 11:03:08
0

在云计算日益成为互联网企业业务运行重要支柱的当下,如何高效管理和优化云资源成本,成为了行业内普遍面临的挑战。近日,在QCon全球软件开发大会(北京站)上,小红书混合云资源管理负责人梁啟成,分享了小红书在云成本优化领域的实践经验,详细阐述了他们如何通过技术创新,实现资源使用效率的大幅提升,进而节省数亿成本。

小红书自2013年成立以来,便与云计算结下了不解之缘,从最初的站点部署,到后来大规模使用EMR产品,再到跨云环境下的异地多活容灾建设,小红书的云计算之旅可谓丰富多彩。目前,小红书在公有云上的资源规模已达到千万核CPU和万张GPU卡的级别,每天处理的云产品账单金额巨大。

面对如此庞大的云资源体量,小红书在成本优化方面遇到了诸多难题,如成本增速过快、成本归属不清晰、缺乏有效的成本控制手段等。为了破解这些难题,小红书借鉴了FinOps框架的解题思路,从成本洞察、成本优化和成本运营三个方面入手,进行了一系列探索和实践。

在成本洞察方面,小红书遇到了资源使用现状不清、成本构成不明等问题。为了解决这些问题,小红书启动了技术商品化项目,通过对自研中台产品进行产商品上架管理,实现了内外账的分离。这一举措不仅让公司能够看清成本并实现精细化运营,还明确了采购、中台技术和业务技术各方的权责,提高了协作效率。

在成本优化方面,小红书针对CPU和GPU两类算力资源进行了重点优化。对于CPU资源,小红书通过在线业务混部、大VM小Pod策略等方式,提升了资源使用效率。他们发现,内存访问延迟的差异是导致CPU利用率分层的关键因素,因此通过优化虚拟机资源分配、避免跨NUMA节点和跨Socket分配等方式,解决了CPU利用率分层和抖动问题。同时,通过混部策略,让VM上运行的业务更加丰富多样,多业务混跑,减少了资源共振导致的抖动。

对于GPU资源,小红书则在内容大模型方向进行了降本增效实践。他们通过替换数据存储格式、增加数据加速层、自动调参、模型量化和知识蒸馏等方式,降低了GPU资源的使用成本。例如,在模型量化方面,他们利用FP8低精度格式进行后训练加速,实现了训练效率的大幅提升。在知识蒸馏方面,他们通过将大模型的知识传授给小模型,降低了模型的复杂性和计算资源需求。

梁啟成表示,小红书在云成本优化方面的实践探索取得了显著成效。通过多部门协同践行FinOps理念,从成本洞察、成本优化和成本运营三个方面入手,小红书实现了资源使用效率的大幅提升和成本的有效控制。未来,小红书将继续深化AI for FinOps的实践探索,利用AI技术更好地进行成本优化和成本洞察。

相关内容

热门资讯

小米15Ultra翻译音频的技... "这期英文科技播客提到的AI芯片架构,到底和国产芯片差在哪?"上周通勤路上,同事小王对着手机抓耳挠腮...
2026深圳国际智能安防展览会... 2026深圳国际智能安防展览会-ISE安博会 Shenzhen International Inte...
燕赵钢铁实验室亮出首份“成绩单... 解决40项关键核心技术难题,50项科研成果落地应用 燕赵钢铁实验室亮出首份“成绩单” 河北日报客户端...
因为降价背刺,蔚来李斌被车主围... 刚提车没多久就遇上新款降价,不少蔚来老车主最近心里很不是滋味。针对大家热议的 "政策调整像背刺" 的...
2025年Q2全球PC GPU... 2025-09-01 01:20:41 作者:狼叫兽 2025年第二季度,全球PC GPU出货总...
高性价比VR制作公司 —— 打... 在数字化浪潮汹涌而至的今天,虚拟现实(VR)早已不仅仅是科技爱好者的“黑科技”,而是广泛渗透到教育、...
小米16正式曝光!但“时间”成... 如果你现在是小米的忠实粉丝,又或者你现在用的手机就是小米13系列、小米15系列,那么讲实话今天这个消...
顺德小程序UI设计优化|高颜值... 顺德小程序UI设计优化|高颜值界面,用户留存率提升50% 在数字化的浪潮中,小程序已成为很多企业和商...
给芯片降温“开空调” 转自:贵州日报 贵州日报天眼新闻记者 杨学安 2025中国国际大数据产业博览会于8月28日在贵州省贵...
第十届“创客中国”智能机器人中... 8月30日,第十届“创客中国”智能机器人中小企业创新创业大赛决赛在普陀“海聚英才”路演大厅拉开帷幕。...
“爆改”蚕宝宝有了“数字字典” 八月二十六日,西南大学,彩色茧育种的研究成果。记者 李雨恒 摄\视觉重庆 用饲料代替桑叶...
浙江清华团队研发微型涡轮发动机... 2025-08-31 14:00:12 作者:狼叫兽 近日,有消息透露,浙江清华长三角研究院海纳...
科技文旅融合新纪元:金鹰机器人... 在临沂汉墓竹简博物馆1号馆内,一场别开生面的媒体分享会于8月29日精彩上演。这场名为“星汉灿烂金鹰机...
“上合峰会气象台”:风、温、湿... 天津北方网讯:8月31日,天津进入了“上合时间”。为积极强化对气象预报服务技术的科技支撑,天津市气象...
中国Z世代智能体白皮书2025 《中国Z世代智能体白皮书》显示,Z世代作为“数字原住民”,对智能技术接受度高,消费潜力巨大,注重性价...
车主喊贵、险司喊亏,电车车险怎... 中汽协最新数据显示,截止到 7 月底,2025 年新能源汽车新车销量已达新车总销量的 45% 。随着...
真我高管坐地铁被拍:真我GT8... 来源:市场资讯 (来源:快科技) 快科技8月30日消息,realme副总裁王伟乘坐地铁时被同事拍到,...
美国撤销三星、SK海力士、英特... 8月29日,美国商务部将英特尔半导体(大连)有限公司、三星中国半导体有限公司以及SK海力士半导体(中...
Meta豪掷143亿美金,AI... meta的超级智能实验室(MSL)近期陷入了一系列风波,从Llama 4的“作弊刷分”丑闻,到斥资1...
微信明确:发布的内容为AI生成... “微信珊瑚安全”公众号今天(31日)发布《关于进一步规范人工智能生成合成内容标识的公告》(以下简称《...