欢迎阅读 OSCHINA 编辑部出品的开源日报,每天更新一期。
# 2024.2.29今日要点阿里发布肖像视频生成框架 EMO
来自阿里巴巴的团队发布了音频驱动的肖像视频生成框架 EMO(Emote Portrait Alive),相关论文同步发表于 arXiv。
输入一张参考图像和声音音频,该框架能够生成具有丰富面部表情和头部姿势的声音肖像视频。
字节跳动打造 MegaScale:用于训练 LLM 的单一 “万卡集群”
MegaScale 将大语言模型训练扩展到超过 10000 个 GPU,在 12288 个 GPU 上训练 175B LLM 模型时,MegaScale 实现了 55.2% 的模型 FLOP 利用率(MFU),与层内模型并行技术 Megatron-LM 相比,MFU 提高了 1.34 倍。
今日观察
今日推荐
开源之声
每日项目榜
每日 GitHub 精选
欢迎扫码下载新版「开源中国 APP」
随时在线阅读完整日报内容
这里有最新开源资讯、软件更新、技术干货等内容
点这里 ↓↓↓ 记得 关注✔ 标星⭐ 哦