Diffusion Models专栏文章汇总:入门与实战
本文提出了一种新的视频帧插值(VFI)方法,名为MoMo,它通过解耦运动建模来增强视频的视觉流畅性和质量。MoMo采用两阶段训练过程,首先训练一个帧合成模型生成输入对和它们光流的帧,然后提出一个运动扩散模型,使用新颖的扩散U-Net架构来产生帧间的双向光流。这种方法利用运动的简化低频表示,以较低的计算需求实现了优于像素空间生成模型方法的感知质量。
上一篇:threejs+vue 省份3D可视化地图
下一篇:Vue+Element Ui实现el-table自定义表头下拉选择表头筛选