金融界2024年3月2日消息,据国家知识产权局公告,清华大学申请一项名为“扩散模型的轻量化方法、装置、电子设备和存储介质“,公开号CN117634586A,申请日期为2023年11月。
专利摘要显示,本公开提供了一种扩散模型的轻量化方法、装置、电子设备和存储介质,涉及神经网络技术领域,旨在得到轻量化的扩散模型。所述方法包括:获取目标数据和预训练的老师模型;将所述目标数据输入所述老师模型,得到所述多个中间块分别输出的第一结果;将每个所述中间块的输入,输入所述中间块对应的所述块,得到每个所述块在采用不同的路径操作的情况下,输出的多个第二结果;根据每个所述中间块输出的第一结果,以及所述中间块对应的所述块输出的多个第二结果,对每个所述块进行分块搜索,得到每个所述块对应的目标块;根据每个所述目标块,生成子网;对所述子网进行子网重训,得到训练好的目标子网;根据所述目标子网,建立目标扩散模型。
来源:金融界