运行LIama2得8400万元!最快AI推理芯片成本推算引热议
量子位
2024-02-21 14:30:10
0

原标题:运行LIama2得8400万元!最快AI推理芯片成本推算引热议

白交 发自 凹非寺

量子位 | 公众号 QbitAI

想实现史上最快大模型推理,得要1171万美元(8410万元)???

同等项目下,使用英伟达GPU成本只需30万美元……

关于最强AI芯片易主Groq,可能得让子弹再飞一会儿了。

这两天,Groq惊艳亮相。它以号称“性价比高英伟达100倍”的芯片,实现每秒500tokens大模型生成,感受不到任何延迟。外加谷歌TPU团队这样一个高精尖人才Buff,让不少人直呼:英伟达要被碾压了……

喧嚣过后开始出现一些理智讨论,其中主要还是针对Groq的效益成本问题。

网友粗略一算,现在演示Demo就需要568块芯片,花费1171万美元。

于是乎,业内业外各界人士不约而同地展开了一场算术大法。

甚至出现了位分析师,拿着表格现身说法……

并感叹了句:OK,everybody is doing public math this week.

不过Groq也第一时间在社交网络上进行了回应。

“每个人都在做数学”

参与到Groq成本问题讨论的,有计算机学生,也有同提供推理服务的云厂商,甚至还有Groq前员工大战现员工……好不热闹。

摘取几个有代表性的,我们来看看大家都是如何看待的。

首先一个粗略估计,一张卡的价格约为2万美元,内存又仅为0.23GB。

那么为单个LLama 70B模型服务,就需要购买大约320张卡(实际上更多),包括服务器在内大约花费1千万美元……

而要是跟英伟达的H100对比,情况又是如何?

Lepton的贾扬清也参与进来,算了一笔账。除了基本价格,他还从能源功耗、性能、运营成本等角度进行了分析。

最终总结出这几个核心观点:

  • 对于LLaMA 70b模型,使用572张卡来计算,每年电费将花费25.4万美元;
  • 使用4张H100卡可以实现Groq一半的性能,如今8卡H100盒子的价格约为30万美元。
  • 如果运营三年,Groq 的硬件采购成本为1144万美元,运营成本为76.2万美元。相比起来H100采购和运营成本更低。

值得一提的是,在Groq给出的基准测试中,也包括了Lepton在内,推理速度大概是Lepton的三倍。

贾扬清还透露,他跟Groq创始人是旧相识了:

在谷歌时就相互知道。

不过在这些讨论中,也有其他算法。

比如有网友反应,按照单个Token价格这个维度来计算,情况又是如何呢?

没关系,还有更专业的分析师会出手。

不过根据他的计算,每100万Tokens的花费,Groq性价比是要高一些。

除此之外,还有一些其他的讨论,像是否支持加速任何Transformer?

Groq在线答疑

由于大家过于关注,Groq忍不住亲自下场解答。

是时候再发一个常见问题帖子来澄清了。

主要有以下几点:

  • 采用开源模型,适应我们的编译器,然后运行它,仅此而已。
  • 我们token价格很实惠很高效,因为从芯片到系统都自己搞,没有中间商;
  • 不会出售芯片,但第三方供应商除外;公布的销售数据有偏差。
  • 我们的目标客户不是单卡用户。

另外还在持续地在线答疑中……

所以Groq是否能真的撼动住英伟达的地位,估计还得再等一等。

不过昨天英伟达股价倒是异动了一波……

参考链接:

[1]https://twitter.com/GroqInc/status/1760113134566576558

[2]https://twitter.com/swyx/status/1760065636410274162

[3]https://news.ycombinator.com/item?id=39428880

[4]https://twitter.com/JayScambler/status/1759372542530261154

[5]https://twitter.com/DZhang50/status/1759839771487297637

报名中!

2024年值得关注的AIGC企业&产品

量子位正在评选2024年最值得关注的AIGC企业2024年最值得期待的AIGC产品两类奖项,欢迎报名评选!

评选报名截至2024年3月31日

中国AIGC产业峰会同步火热筹备中,了解更多请戳:在这里,看见生成式AI的应用未来!中国AIGC产业峰会来啦!

商务合作请联络微信:18600164356 徐峰

活动合作请联络微信:18801103170 王琳玉

点这里👇关注我,记得标星噢

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

相关内容

热门资讯

月亮为啥会“红脸”?“红月亮”... 本文转自【央视新闻客户端】; 等待近3年,天象奇观“红月亮”将再现天宇。 北京时间今天(7日)午夜至...
原创 我... 1 六月的风,像一双无形的手,把整座城市的燥热都搅拌得粘稠起来。 我叫林辰,是“寰宇科技”一名刚转...
促进智能产业蓬勃发展 让智能成... 9月5日,国家主席习近平向2025世界智能产业博览会致贺信。连日来,习近平主席贺信在我市各界引发热烈...
地拓精科公布“一种用于精密仪器... 天眼查APP显示,近日,大连地拓精密科技股份有限公司申请的“一种用于精密仪器的内置主动减振系统”专利...
山西数据交易中心入选验证试点典... 日前,记者从山西数据交易中心获悉,在全国数据标准化技术委员会开展的涵盖6个重点方向的15个标准和2个...
原创 手... 第一梯队:Redmi —— 千元机里的“性能卷王” Redmi这几年把“性价比”三个字刻进了骨子里。...
贝叶斯启示录:从概率到信念的进... 1️⃣ 贝叶斯定理:信仰的数学表达式 贝叶斯定理(Bayes’ Theorem)看似简单,却蕴含深意...
我国将实施小行星动能撞击演示验... 近日召开的第三届深空探测天都国际会议上,中国探月工程总设计师吴伟仁介绍,我国正在规划对一颗小行星实施...
东北亚具身智能创新中心成功发布 (来源:沈阳日报) 转自:沈阳日报 本报讯(沈阳日报、沈报全媒体记者黄超)9月6日,在2025全球工...
“首次”“首创”不断 我国科学... (来源:中国环境网) 转自:中国环境网 近期 我国科学家首次确证火星存在固态内核 我国科学家揭示植物...
罗永浩“唠嗑”,为何成了B站的... 最近,全网都在看罗永浩唠闲嗑。 “真还传”告一段落之后,罗永浩以“罗永浩的十字路口”的IP重新开启新...
打造绿色发展“新名片” 在落实“双碳”目标的大背景下,电力特别是绿色电力受到更多关注。构建新型电力系统,是助力实现“双碳”目...
全国首个“商圈IP+自研机器人... 小朋友与机器人赛跑。 “机器人川剧变脸、机器狗舞狮……科技时尚和传统非遗相结合,太震撼了!”9月7日...
消息称阿里云首次出手具身智能,... IT之家 9 月 8 日消息,据晚点 LatePost 报道,具身智能公司自变量机器人(X Squa...
惠普Z2 Mini G1a迷你... 【ZOL中关村在线原创评测】在桌面Mini电脑领域,惠普一直以来有着非常深入的产品布局,并且深受企业...
送药、助行、陪聊、量血压 机器... 浙江省发布行动计划 三年建成人工智能医疗应用基地 送药、助行、陪聊、量血压 机器人越来越能干了 本报...
神二十乘组工作日志“上新” 多... 央视网消息:九月伊始,国家太空实验室内,由陈冬、陈中瑞、王杰组成的神舟二十号航天员乘组承担的各项空间...
西工大实现航天器柔性传感系统首... 9月5日19时39分,我国在酒泉卫星发射中心成功发射谷神星一号运载火箭,将“基于柔性传感的卫星关键折...
特斯拉人形机器人,有新动向! 【大河财立方消息】9月8日消息,特斯拉近日开通了名为“TeslaAI”的微博账号,并于9月7日发布首...
智博会上的重庆智“治” 9月5日,2025世界智能产业博览会在重庆开幕。如何以“数智”赋能超大城市现代化治理?上游新闻带你走...