腾讯音乐天琴实验室MUSELight加速框架再升级,助力科技生产力进一步解放
砍柴网
2024-01-30 11:46:12
0

原标题:腾讯音乐天琴实验室MUSELight加速框架再升级,助力科技生产力进一步解放

1月29日,腾讯音乐正式发布了奇喵相机应用,用户可以上传单张图片,无需训练等待即可在10秒内生成好玩的形象复刻照片。而奇喵相机领先行业水平的绘图速度背后,则是得益于腾讯音乐娱乐集团(TME)旗下天琴实验室深耕多时的MUSE FaceIn形象复刻能力,以及MUSELight 大模型加速框架。在MUSELight的加持下,奇喵相机获得了 30%+ 的性能提升,极大缩短了出图时间,提升用户体验的“丝滑感”。

奇喵相机主页图

近日,天琴实验室正式发行MUSELight 2.0版本,这一业内领先的大模型推理加速应用,将从技术层面协助行业解决大语言模型(Large Language Models,LLMs)及Stable Diffusion(SD)模型在实际部署应用上的难点,为LLM和SD模型在多个领域的应用落地提供了有利支持,助推企业和机构更好实现数字化转型和智能化升级。

助力解决大模型部署难点,MUSELight 2.0版技术再升级

近一年来,在自然语言处理(Natural Language Processing,NLP)领域,随着ChatGPT等大语言模型问世,国内外开源大语言模型生态逐渐丰富,在不同领域均出现了庞大的需求和应用落地案例。此外,SD模型也在视觉生成领域掀起了一场“工业革命”,带动了一批新的AI画图需求和落地应用。然而,大模型部署所需的成本及硬件要求,让多数企业望而却步。如何提高模型的推理速度,并在一卡难求的情况下提高显卡利用率,降低大模型部署成本,已成为业内关注的热点问题。

作为腾讯音乐首个音视频实验室,天琴实验室针对大模型应用落地的痛点,已于今年5月发布了MUSELight大模型推理加速框架1.0版本,获得业内诸多好评。

据了解,天琴实验室本次研发的MUSELight加速框架2.0版本引入了Flash Attention 2、Flash Decoding,启发式自动选择不同的 Attention 实现算子等技术,支持多个主流开源LLM及SD模型的推理加速,且加速速度在业内遥遥领先。MUSELight通过对模型重新进行自顶向下的独创性优化,合理安排显存内存间数据交换、显存复用、优化计算流程,针对不同GPU架构,对不同类型计算层进行数据和计算线程的重排,以及特别的推理场景算子优化等技巧,使得其能够大幅提升显存利用率和计算效率,减少大量非必要的访存、计算开销,为解决模型推理部署中的瓶颈问题提供了强有力支持。

助推多个模型应用落地,MUSELight 2.0版广受认可

据悉,MUSELight 2.0版对SD模型加速版本lyraSD也进行了升级,新增了支持所有SD1.X 以及SDXL 版本模型加速的功能,且加速性能与业内其他加速框架相比提升了5%-40%不等。此外,lyraSD还支持多种主流SD绘图场景以及插件,如文生图、图生图、模型热切换,各种插件热切换(如Lora,LCM Lora,ControlNet,IPAdapter)等,并支持stable-diffusion-webui和diffusers框架下的推理。

lyraSD与目前开源的、使用广泛加速框架测速对比图

在奇喵相机之外,MUSELight更与腾讯云进行深度合作,向行业合作伙伴进行赋能,助力行业提供更快的大模型推理体验,同时大幅度降低成本。此外,MUSELight还与作为全球数字科创领域独角兽的APUS达成了云上云下全方位合作,提升绘图中台能力30%-40%,APUS负责人评价道:“MUSELight的加速效果和使用都非常好,很好地满足我们的需求。”

LLMs方面,升级版的MUSELight推理加速引擎可实现对ChatGLM-6B模型进行5.5倍加速,最大吞吐量达9000+ tokens/s。除了实现更高效的计算外,MUSELight 2.0版本还支持长序列场景下的推理,能满足更高的推理需求,扩充了LLM产品的应用场景,为用户提供更优秀的使用体验。

以lyraLLaMA-13B为例,MUSELight与行业内其他加速框架测速对比图

在实际应用落地方面,MUSELight为微信键盘的文本润色模块提供了部署支持,模型加速收益显著,达到了大语言模型的上线标准。具体而言,短文本可以基本“秒”生成,用户“几乎”无需等待;同时产品场景也得到扩充,能够支持长文本润色,排版优化等功能,进一步提升了用户体验。微信键盘文本润色模块相关负责人表示:“整体上看MUSELight为微信键盘文本润色模块带来了大约100%的速度提升以及50%的成本降低,很好地满足了业务快速上线的需求”。

除微信键盘外,天琴实验室还与腾讯会议、科恩实验室等业务团队合作完成了多个模型的大规模部署上线,得到了客户的广泛认可和高度评价。同时,MUSELight 2.0版本已为直播礼物实时绘图、壁画悬浮歌词音箱绘图等提供了解决方案。通过应用MUSELight加速框架,部署LLM及SD模型的成本大幅降低,让更多企业承担得起大模型的部署和应用费用,进一步推动了科技成果有效落地转化,“智赋”各行各业。天琴实验室表示,“未来会持续同步新功能和支持的新模型”,进一步降低企业大模型部署成本,助推大模型应用落地。

作为中国在线音乐娱乐服务开拓者,腾讯音乐娱乐集团始终致力于推动科技创新,通过技术和数据的赋能,为用户带来更好的产品体验。未来,AI领域和数字音乐产业势必将面临诸多新挑战,相信天琴实验室能够为行业的大模型应用带来更多案例与赋能,引领数字音乐行业高质量发展。

相关内容

热门资讯

大磡社区开展手机摄影培训,解锁... 深圳商报·读创客户端记者 郑恺 8月17日,大磡社区联合南山区关工委 “五老” 讲师团,举办了《搬砖...
我国首次载人航天器地外天体着陆... (来源:中国妇女报) 转自:中国妇女报 近日,传来一则振奋人心的消息:揽月月面着陆器着陆起飞综合验...
总长218公里!GIS系统赋能... 城市供水,关乎千家万户的日常生活。如何提高供水管网安全水平、降低管网漏损?8月16日,记者对此进行走...
苹果采摘机器人在山西万荣进行首... 苹果多臂采摘机器人正在进行采摘作业。山西经济日报全媒体记者 杨永生 摄 8月12日,由国家农业智能装...
漂亮的“店面”图原来10元生成... 外卖大战的硝烟还未散去,外卖店用AI图骗点单现象又引发舆论关注。 近日,多位消费者在社交平台上爆料称...
疑似魅族22真机曝光 后置方形... 【CNMO科技消息】8月18日,有数码博主曝光了即将发布的魅族22系列真机照片。从图片来看,该机采用...
200余名国内外学者在冰城研讨... 如何把林木生物技术领域的实验室成果转化为实际生产力?日前,来自美国、加拿大、比利时等10余个国家和地...
苹果2026年Mac将迈入5G... 苹果公司的创新步伐再次迈出重要一步,据知名苹果记者Mark Gurman的最新爆料,苹果计划在202...
医疗器械企业政策扶持:所得税按... 在医疗健康产业蓬勃发展的当下,医疗器械企业作为其中的关键一环,对提升医疗服务水平、推动行业进步发挥着...
固态电池板块8月18日涨1.5... 证券之星消息,8月18日固态电池板块较上一交易日上涨1.5%,紫建电子领涨。当日上证指数报收于372...
干法极片:固态电池产业化的关键... 在新能源产业飞速发展的浪潮中,固态电池凭借更高的能量密度、更优的安全性和更宽的温度适应性,被视为下一...
年轻人主动“回炉”提升技能 寻... 中新网重庆8月17日电 (钟旖 吴婧媛)“虽然是跨专业从零开始学,挑战大,但老师讲得很细,我上手也快...
全球最长LED屏点亮背后:“世... 办赛与兴业,如何实现共生共荣?刚刚闭幕的成都世运会,提供了一个路径。 在汇集了116个国家和地区参与...
2025物联网大会在江苏无锡隆... 8月16日-17日,2025物联网大会在江苏无锡顺利召开。大会由中国电子学会、中国通信学会联合主办,...
时隔4年,华为新机再度显示麒麟... 近日,部分华为Pura 80系列手机用户在社交媒体上发文表示,鸿蒙系统升级后可在设置中查看麒麟芯片信...
“光子”化身秦俑击鼓起舞 首届世界人形机器人运动会上湖北摘首金 “光子”化身秦俑击鼓起舞 光谷东智研发的“光子”人形机器人...
“黄河之滨科普行”系列活动在兰... 8月17日,中国化学会组织院士、专家来到兰州一中,为学校师生举办了第一季“无处不化学”主题科普活动。...
别惊讶!油车的魅力正在大幅上升 当“现在这个时代谁还买油车”“开了电车再也不想碰油车了”成为不少车企领导人的口头禅,当社交媒体评论区...
天工再夺冠 钢铁飞人诞生 本报讯(记者 曹政)继今年4月勇夺全球首个人形机器人半程马拉松冠军后,北京集聚多方力量研发的人形机器...
从骗捐寻亲到退款 P 图,为什... 前段时间刷抖音的时候,小雷看到了一则 “2 岁女童王喵喵走失” 的寻人启事。可谁能想到,这是一场彻头...