来源:IT时报
作者/ IT时报记者 郝俊慧
编辑/ 郝俊慧 孙妍
“Who’s China Telecom(谁是中国电信)”7月3日,在儒勒·凡尔纳的故乡——法国南特,低低的疑问声在2025国际多媒体与博览会议(ICME 2025)颁奖现场不同角落里响起,台上的领奖者,是经过三轮严格盲评、击败全球3737篇投稿、拿下本届唯一“最佳论文奖”的年轻人常建慧,她的Affiliation(归属)写着“中国电信”。
ICME,图像、视频、AI生成等多媒体技术领域的国际顶级会议,由IEEE主办,历来被誉为“AI+视觉”交叉研究的风向标,今年的年会,无论投稿篇数还是到场学者规模,都堪称史上之最。
走下领奖台,常建慧被团团围住,来自全球的同行们实在太好奇了:此次斩获最高奖项的,竟然不是高校的精英实验室,也不是硅谷的大厂研究室,而是来自中国的电信运营商研究院。
这是中国电信第一次以第一单位身份在ICME上获奖。尽管早已是全球最早打出“科技型企业”旗号的电信运营商,但在“老本行”通信之外,尤其是ICME所在的多媒体领域,中国电信还是一位“陌生人”。
此次获奖,不仅标志着电信运营商正向更具主动性和前瞻性的科研引领者转变,也彰显了央企科研体系在技术创新源头的突破潜力,而常建慧,这位刚入职中国电信云计算研究院一年的北大博士,她的故事,更是一场关于技术、理想与央企创新的生动叙事。
一次视觉世界的“重生”
“我们不是传统意义上的压图,而是在重画世界。”常建慧说道。
想理解这篇顶会最佳论文的意义,需要先回到一个既日常又棘手的问题:我们每天在手机上浏览的图片、观看的视频,是如何被压缩并在网络上传输的?
长久以来,为了节约传输带宽,传统的编码技术通过各种数学手法去除图像中的冗余信息,从而把文件变小。但在高倍压缩下,这种方法损失的信息在接收端无法增补,导致图像模糊、失真,或者出现马赛克。
近几年来,随着AI技术的成熟,基于GAN(生成对抗网络)和VAE(变分自编码器)的生成式编码技术开始出现,但在控制力、稳定性及重建质量方面仍有一定限制。在极低码率下,很多图像的原始信息,系统并不知道,只能靠“猜”,很多“看起来不错”的画面,一旦放大,便会发现边缘模糊、纹理失真,有时候甚至会“画蛇添足”。
“你可以把它理解为一个‘知识库’。”常建慧另辟蹊径,提出了一种基于预训练扩散模型(Diffusion Model)的生成式图像编码新框架。当一幅经过高度压缩、信息严重受损的图像数据传输过来时,模型能够凭借自己对“真实世界应该是什么样子”的理解,智能“脑补”出丢失的细节,重新生成一幅高清图像。
与GAN不同,扩散模型是通过逐步“去噪”的方式从随机噪声中恢复图像,它生成的图像结构更严谨、纹理更清晰、保真度更高。为了追求“高保真”,常建慧还特别设计了“交叉注意力机制模块”和“分布重整化”(Distributn Renormalization)方法,让压缩潜变量和扩散模型的中间特征交互,并在解码后校正图像的色彩分布,从而强化了纹理细节对齐,进一步提升了重建的准确性,避免了图像“模糊”或“伪造”的现象。
“不能说这条技术路线没人走,但我的方式视觉保真度的确更高一些。”领奖后,一位评委告诉常建慧,他的想法与她不谋而合,于是从第一轮评审开始,这位评委便一直力挺常建慧,这种来自同行的认可,让常建慧备受鼓舞。
实验数据显示,在0.01~0.2比特/像素下,常建慧的方法比国际最新的H.266/VVC标准,能节省高达79%的码率。在论文的定性对比中,当VVC的画面已经出现明显块效应、其他先进算法的画面变得模糊时,根据常建慧论文中的方法重建出的图像依然纹理清晰、细节锐利,无论是人物的皮肤纹理还是风景的枝叶脉络,都实现了高度逼真的还原。
一次恰逢其时的获奖
对于中国电信而言,这项前沿性技术成果来得恰逢其时。
长期以来,通信网络的目标是“更快、更高、更稳定”,然而,随着5G普及和物联网爆发,全世界正在经历一场“数据海啸”。IDC报告显示,2025年,中国市场将产生51.78 ZB(泽字节,1ZB=10亿TB)数据,2029年将增长至136.12ZB。
其中,视频数据呈指数级增长。从高清监控、视频会议到智慧城市的万物互联,再到未来的低空经济,千行百业的“视频化”趋势带来了海量的数据洪流。这给作为国家信息基础设施建设者和运营者的中国电信带来巨大的挑战:网络带宽压力剧增,互联网企业和城市运营者的成本也随之节节攀升,并由此影响到终端用户的体验。
“通过高效压缩,即便在带宽有限的网络环境下,视频数据也能实现高清、流畅的传输,同时一些访问频率较低的‘冷数据’通过超高倍率的高保真压缩,可以使其占用的存储空间变得微乎其微,从而为企业节省巨额的存储开销。”中国电信首席科学家、云计算研究院院长吴杰告诉《IT时报》记者,新型场景正在倒逼基础设施形态发生深刻变革,很多AI应用需要跨域部署、边缘场景要求就近响应,单一资源维度的优化已难以满足业务的动态性与复杂性,为此,中国电信目前正在创新性研发新一代云计算架构——“智能泛在云”,而常建慧的成果将为推动这朵“云”上计算资源与网络资源的统一协同调度,起到关键性作用。
城市治理便是最为典型的应用场景。近几年来,视觉大模型被广泛应用于城市管理体系中,但高质量数据集却往往成为治理的瓶颈:一些摄像头已部署多年,图像清晰度较低,而刚兴起的无人机航拍监测产生的数据量巨大,传输和存储成本都很高。
常建慧的研究成果针对的正是这些“痛点”,实测显示,在高倍压缩情况下,航拍场景下的目标检出率依然达到了89%。
尤其是论文中提到的“轻量级适配器+预训练扩散模型”机制,可以使编码器灵活地与各种预训练大模型相结合,而无需对庞大的模型本身重新训练,大大提升了编码的灵活性和效率,同时也大幅降低了训练和迁移的算力成本。
AI时代,这是云网从“搬运数据”向“理解数据”转型中的一个典型侧面,而站在全球范围来看,下一代通信标准(6G、未来AVS、ITU-T视频标准)同样悄然走向“模型驱动编码”与“语义压缩”,这个领域正成为全球学术界的研究热点。
会后,许多国外的教授和学者主动找到常建慧,和她详细交流论文中的技术细节,甚至当她来不及一一作答时,有的学者会热情地帮她向其他人解读,“说明他们都非常认真地研究过我的论文和方法”。
据了解,IMT-2030(6G)标准化进程已进入第二阶段(2026年前完成需求评估),多媒体编码相关标准预计在2030年前正式发布。作为全球最大电信云服务商的中国电信,亦正不断推进传统网络向AI原生网络的演进。
一所“非典型”的研究院
此次获奖,是中国电信云计算研究院在原创性基础研究、关键核心技术攻关、战略性新兴技术前瞻布局和研发等方面的一次“小试牛刀”。这家中国电信最年轻的研究院,亦是这个老牌电信运营商面向未来科技创新的核心力量之一。
2024年1月,时任美国天普大学讲席教授、计算研究中心主任的吴杰受中国电信集团领导力邀回国,担任中国电信首席科学家、云计算研究院院长,专注于下一代云与云网融合的前瞻性、战略性基础研究。
吴杰
学术界有一种经典的“磁石效应”,指的是具有极高专业声望和国际影响力的科学家,能够像一块强磁铁般吸引优秀人才、聚集优质资源、催生高质量成果,对整个研究院形成核心向心力和扩散力。
常建慧便“因人而来”。她“师出名门”,师从高文院士与马思伟教授,并曾在2023年获得字节跳动奖学金(全国共13人)。2024年从北京大学数字视频编解码技术国家工程实验室毕业时,手握高校和互联网公司Offer的常建慧,被吴杰的国际化视野和对学术的热情打动,“院长的学术水平非常高,而且对我们的研究不设限,一直鼓励我们做最前沿的学术和基础研究。”
常建慧
这个新机构被中国电信赋予了极大的自主权,“尤其在高端人才引进方面,待遇在央企研究院里是最好的。”吴杰亲自出马,不仅引进了像常建慧这样顶尖高校的毕业生,也引入了像他自己一样有着多年海外科研和管理经验的领军人物,同时研究院也正与北京大学、上海交通大学等国内顶尖高校探索联合培养工程博士的路径,“我们是中国电信向科技型企业转型的一个试点”。
更关键的是,云计算研究院提供了一种独特的科研环境——一种介于高校和企业之间的“中间态”。
“如果我在互联网公司,可能探索的问题会更加具体化。”常建慧坦言,在中国电信云计算研究院这个小而精的团队里,她不仅拥有广阔的学术空间,而且研究院作为央企旗下的学术机构,有更令人振奋的产业空间供成果验证。
这种“中间态”,对一个热爱科研的年轻人来说,极具吸引力。
常建慧获奖之后,研究院的成果转化机制立刻运转起来。吴杰第一时间与集团科创部、天翼云、天翼视联网等相关专业公司取得联系,常建慧回国后也马不停蹄地赶往天翼云公司,与这里的科研人员一起探讨论文成果如何落地于中国电信遍布全球的云网基础设施中。
“在这里工作感觉很有意义,”常建慧说,想到她的“纸上谈兵”未来可能通过中国电信的云网基础设施,服务于智慧城市、公共安全、物联网等千行百业或者进入千家万户,甚至成为每个人手机中都会用到的“外挂”,“那种成就感和满足感还是不太一样的”。
这种从实验室到市场的无缝衔接,是传统学术机构难以比拟的优势,央企研究院背后强大的产业生态,使研究院的学术成果可以有快速落地的渠道,“这对我们非常重要。”吴杰说道。
如今,这个成员平均年龄不到30岁的“创新特区”,正吸引和凝聚着更多像常建慧一样的年轻人。今年入职的两名复旦和上海交大的博士,同样是放弃了其他大厂更为丰渥的待遇,选择了云计算研究院。在这里,他们既能仰望星空,进行自由的学术探索,又能脚踏实地,将智慧融入千行百业的数字化转型脉络中。
“我们认为,人工智能是关系云网未来发展的全局性、战略性和根本性问题,AI将对网络架构、运营模式和客户体验进行新一轮的重塑。”今年6月19日举行的2025 WBBA云网宽带发展大会(上海)上,中国电信董事长柯瑞文如是说。
“AI+通信”的新范式正在快速到来,推动它的,不是公式与算法本身,而是一家央企面向未来的全新姿态:打造以科研为牵引、以人才为根本、以成果为导向的创新体系,实现主动定义未来标准、构建核心能力的中国式科技跃迁。
中国电信,终不再是那个的“陌生人”。
排版/ 季嘉颖
图片/ 中国电信 采访对象