图像复原“黑科技”!深圳科学家团队1.7秒复原高清大片
创始人
2025-08-01 05:01:33
0

图像复原领域长期面临一个难题:要么追求质量却耗时漫长,要么追求速度却牺牲细节。如何把一张老照片修复得又快又好?

近日,中国科学院深圳先进技术研究院数字所董超研究员团队发布了一项名为HYPIR的图像复原大模型,不仅比现有的图像复原技术快数十倍,更在高清分辨率、文字保真、理解能力、用户控制灵活性等方面展现出了优异性能,为图像复原技术的实际应用提供了更高效的解决方案,更为文化传承与保护、影视修复等领域带来新的可能性。

董超研究员(左)介绍HYPIR大模型。

突破传统技术瓶颈,图像修复更高效

传统方法中,基于预训练扩散模型的复原技术显著提升了图像复原效果,但存在计算复杂度高、推理速度慢、训练资源消耗大以及生成结果可控性不足等问题,成为了限制图像复原技术发展的瓶颈问题。

去年,董超团队提出了智能画质增强大模型SUPIR,将低质量的图像恢复到接近原始状态的高清图像,有效修复多种退化类型的图像。而此次图像大模型HYPIR作为升级版,舍弃了迭代式的扩散模型训练,改用单步的对抗生成模型训练方式,将原有的算法速度提升了数倍,同时采用更新的文生图基模型进一步提升算法效果,实现了8K级别的细节生成,在生成图像的稳定性和可控性方面远超SUPIR大模型。

董超介绍,HYPIR主要有两个创新点,一是使用预训练扩散模型初始化复原网络;二是从理论角度出发解释这一简单方法背后蕴含的深刻原理。实验数据显示,在单张显卡(图像处理器)上,HYPIR仅需1.7秒即可完成一张1024x1024分辨率图像的复原。相比现有的图像复原方法,研究人员提出的HYPIR在复原图像的质量上性能更优,且能够适用于各种尺寸的预训练扩散模型,为不同应用场景提供了灵活性。

1985年的深圳南头半岛(下图,摄影:陈宗浩)与4倍超分修复(上图)后的对比图。

多种性能优异,应用前景广阔

在应用层面,研究人员介绍,HYPIR在图像高清分辨率、文字保真、理解能力、用户控制灵活性等方面均展现出了优异的性能。

例如,在老照片修复方面,研究人员运用HYPIR修复了国内外经典电影、电视剧老照片,让模糊的影像重现清晰的细节,为文化记忆传承提供了技术支持。在高分辨率图像修复领域,HYPIR同样表现出色,因其兼具速度与效果,HYPIR成功攻克了传统方法在生成8k分辨率图像时往往面临速度慢或效果不佳的难题。

在文字保真方面,传统基于扩散模型的方法常导致复原出的文字模糊或扭曲,缺乏精确性,而HYPIR则能够使复原出的文字保持高保真度和清晰度,无论是简单的标识还是复杂的文档,HYPIR都能精准地还原其原始形态,使图像中的文字清晰可读。

值得一提的是,HYPIR还具备了突出的自然语言理解能力,能够精准捕捉和理解用户的输入指令,在图像复原过程中准确地反映用户的意图。此外,用户可以根据需求灵活调节生成与复原的平衡,或精细控制图像细节程度,从而获得符合自身偏好的结果。这种用户友好的设计使得HYPIR不仅适用于专业领域,也能满足普通用户的需求。

HYPIR不仅展示了图像修复技术上的创新性,也体现了对实际应用需求的理解。通过打破传统思维定式,该技术在文化传承与保护、影视修复、高分辨率图像生成等领域提供了切实可行的解决方案,为图像复原技术的发展注入了新的活力。

一直以来,董超带领团队致力于底层视觉技术研究,在图像处理领域取得了多个重要突破,并出版了人工智能专著《底层视觉之美》。在他看来,做科研要坚持“三心”,即“初心、良心、爱心”,不仅要保持纯粹的好奇心,也要坚守实事求是的底线,更要秉持科技向善的责任。

“真正的科研成果要尊重事实真相,经得起反复推敲。”董超介绍,目前HYPIR大模型的开源代码和模型已上传至GitHub开放使用并已成功部署于明犀科技平台中,同时与深圳市南山区档案馆合作对部分馆藏照片进行修复,后续该大模型还将进一步推进产业化,让社会公众亲身体验科技魅力。

文:伍曼娜

相关内容

热门资讯

三大运营商统一营销号码,骚扰电... 21世纪经济报道记者肖潇 北京报道 一通自称运营商员工的电话打来,声称“回馈老用户,额外赠送流量和话...
南 玻A获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示南 玻A(000012)新获得一项发明专利授权,专利名为“一种...
全球首个,正式启用!“熊猫眼”... 由北京市人民政府、中央广播电视总台等联合主办的世界人形机器人运动会将于8月14日在北京开幕。7月30...
尚伟笔业取得一种双珠笔头专利,... 金融界2025年8月1日消息,国家知识产权局信息显示,温州尚伟笔业有限公司取得一项名为“一种双珠笔头...
骁龙2025游戏技术赏:携生态... 【环球网游戏综合报道 记者 心月】7月31日,2025骁龙游戏技术赏在上海举办。高通(中国)联合iQ...
超聚变:智能体时代,AI原生重... 来源:袁大善人 2025 世界人工智能大会(WAIC)世博展览馆内,超聚变展台前人头攒动,其展示的A...
天马研究院申请显示面板及显示装... 金融界2025年8月1日消息,国家知识产权局信息显示,天马新型显示技术研究院(厦门)有限公司申请一项...
圣邦股份获得发明专利授权:“斜... 证券之星消息,根据天眼查APP数据显示圣邦股份(300661)新获得一项发明专利授权,专利名为“斜坡...
南都电源获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示南都电源(300068)新获得一项发明专利授权,专利名为“一种...
埃迪玻璃机械取得风刀装置专利,... 金融界2025年8月1日消息,国家知识产权局信息显示,佛山市顺德区埃迪玻璃机械有限公司取得一项名为“...
星空有约丨双黑洞背后藏了啥?听... 宇宙中的双黑洞已令人惊叹,但中国科学院上海天文台科研人员最新研究发现,双黑洞的背后,还可能隐藏了更为...
英纳法取得滑动限位结构等相关专... 金融界2025年8月1日消息,国家知识产权局信息显示,英纳法企业管理(上海)有限公司取得一项名为“滑...
点亮童心 科技一“夏” 7月30日上午,七贤岭街道科海社区关工委2025年暑期活动第二课热力开启,创之巅峰“智创星航”人工智...
南昌友星电子电器取得可调节线束... 金融界2025年8月1日消息,国家知识产权局信息显示,南昌友星电子电器有限公司取得一项名为“一种可调...
5G手机挑选指南:这五款高性价... 在5G时代的大潮中,挑选一款手机已不再是简单的通讯工具选择,而是寻找一位全能的生活伴侣。它需具备强大...
生升农业取得定量扁嘴包装机专利... 金融界2025年8月1日消息,国家知识产权局信息显示,广东省生升农业有限公司取得一项名为“定量扁嘴包...
中国锂电池头部企业用上海尔高效... 眼下,制造业正发生显著转变:企业不再只追产量与速度,节能降碳意识全面觉醒。 8月1日,从国内一家锂电...
德立华取得移动电源专利,装配简... 金融界2025年8月1日消息,国家知识产权局信息显示,深圳市德立华电子科技有限公司取得一项名为“一种...
杭州市西湖区联手阿里打造全球A... 黄冉、谢雯艳、孟迪 人工智能浪潮下,杭州市西湖区乘势而上——7月31日,西湖区与阿里巴巴集团正式签署...
新奥聚变科学家石跃江:10年内... 本报(chinatimes.net.cn)记者李未来 实习生 杨梓涵 北京报道 可控核聚变正从概念变...