如何让AI“识破”AI?这项研究给出答案
创始人
2025-08-27 00:02:40
0

随着大模型逐渐变成学习、工作中不可或缺的生产力工具,其伴生的问题也日益凸显。AI经常会“一本正经地胡说八道”,生成看似合理的虚假信息;一些人利用AI工具代写作业甚至毕业论文,极大冲击着学术诚信和规范;AI生成内容的流畅性和逻辑性越来越强,人类识别困难,但论文AI率检测系统有待完善,论文被误判的问题时有发生……如何精准识别AI生成内容,成为亟待解决的问题。

南开大学计算机学院媒体计算实验室近日取得的一项研究成果,或为解决这些难题提供可行方案。该成果创新性地提出直接差异学习(DDL)优化策略,教会AI用“火眼金睛”辨别人机不同,实现AI检测性能的巨大突破。相关成果论文已被ACM MM 2025(第33届ACM国际多媒体会议)接收。

目前AI生成内容检测主要有两种路线。一种是基于训练的检测方法,使用特定数据训练一个专用的分类模型;另一种是零样本检测方法,直接使用一个预训练的语言模型并设计某种分类标准进行分类。多项研究表明,现有检测方法在应对复杂的现实场景时面临困境。

为何现有的AI检测工具会“误判”?“如果把AI文本检测看作一场考试,那么现有检测方法就好比机械刷题、死记硬背答案的固定套路,难以学会答题逻辑,一旦遇到全新难题,准确率就会显著下降。”论文第一作者、南开大学计算机学院计算机科学卓越班2023级本科生付嘉晨解释道,“要想实现通用检测,理论上需收集所有大模型的数据进行训练,但这在大模型迭代飞速的今天几乎不可能。”

让检测器学会“举一反三”,提升其泛化性能,是增强AI文本检测能力的关键。为此,研究团队另辟蹊径,提出DDL方法,通过直接优化模型预测的文本条件概率差异与人为设定的目标值之间的差距,帮助模型学习AI文本检测的内在知识。这种方法可精准捕捉人机文本间的深层语义差异,从而大幅提升检测器的泛化能力与鲁棒性。

“使用DDL训练得到的检测器如同有了‘火眼金睛’,即便只‘学习’过DeepSeek-R1的文本,也能精准识别像GPT-5这样最新大模型生成的内容。”付嘉晨说。

团队还提出了一个全面的测试基准数据集MIRAGE,该数据集使用13种主流的商用大模型以及4种先进的开源大模型,生成了接近10万条“人类—AI”文本对。

“MIRAGE是目前唯一聚焦商用大语言模型检测的基准数据集。如果说之前的基准数据集是由少且能力简单的大模型命题出卷,那么MIRAGE则是由17个能力强大的大模型联合命题,形成一套高难度、又有代表性的检测试卷。”论文通讯作者、南开大学计算机学院副教授郭春乐说。

在MIRAGE的测试结果显示,现有检测器的准确率从在简单数据集上的90%骤降至约60%;而使用DDL训练的检测器仍保持85%以上的准确率。与斯坦福大学提出的AI生成文本检测工具DetectGPT相比,使用DDL方法训练的检测器性能提升71.62%;与马里兰大学、卡内基梅隆大学等共同提出的AI生成文本检测方法Binoculars相比,性能提升68.03%。

“AIGC发展日新月异,我们将持续迭代升级评估基准和技术,致力于实现更快、更准、更低成本的AI生成文本检测。”研究团队负责人、南开大学计算机学院教授李重仪说。

相关内容

热门资讯

中外观众齐欢呼,1.2万架无人... 8月26日晚,深圳人才公园,深圳经济特区建立45周年无人机灯光秀表演在此上演,市民游客纷纷高举手机记...
上海科技奖“瘦身”,三个“新高... 2024年度上海市科学技术奖今天(8月26日)揭晓。这一上海科技界的年度盛事,不仅是对所有获奖单位和...
AIGC创新赛在莞收官!滨海湾... 8月25日下午,2025中国高校计算机大赛-AIGC创新赛决赛总结暨颁奖仪式在东莞迎宾馆举行。本届A...
双碳研究 | 中国在南极洲发现... 中国在南极洲发现“冰冻能源”—— 运行速度达186英里/小时,有望为南极洲供能 【ecoticias...
被全球AI预测为诺奖大热门作家... 在这光影交织、细语低喃的世界里,万物皆有灵魂。树木拥有树木的灵魂,花朵拥有花朵的灵魂,空气有它的灵魂...
亿纬锂能取得一种电池包专利,简... 金融界2025年8月26日消息,国家知识产权局信息显示,惠州亿纬锂能股份有限公司取得一项名为“一种电...
开学在即,情绪有波动?中小学生... 青岛日报社/观海新闻8月26日讯 夏日时光悄悄过去,岛城的中小学生即将回到可爱的校园,想到马上就要见...
船底座星云奇观:巨型尘埃柱内,... 近日,天文学界传来了一则令人惊叹的发现:在遥远的船底座星云中,一座巨型尘埃柱成为了科学家们关注的焦点...
AI专题:2025年中国AI ... 今天分享的是:AI专题:2025年中国AI Agent(智能体)最佳实践应用榜单(1) 报告共计:1...
6G时代:高通庄思民展望边缘A... 在近期的一次深度访谈中,高通技术公司工程技术高级副总裁庄思民博士,在北京高通办公室内,详细阐述了6G...
DC240V转DC48V全桥直... 山东科嘉电气的DC240V转DC48V全桥直流变换器是一款高效、稳定、可靠且适应性强的电力电子设备,...
人形机器人“撞”出保险新场景 机器人也会“撞人逃逸”?在不久前落幕的全球首届人形机器人运动会上,出现了一幕火到国外的“名场面”:在...
华为Pura70 Pro+全能... 近期,华为智能手机市场迎来了一波令人瞩目的价格波动,尤其是华为Pura80 Pro系列,其价格在短时...
虚实结合,互联网的下一站 传统意义上的互联网模式,正在经历新一轮的转型和升级。无论是从技术上,还是从商业模式上,无一不是如此。...
世窗信息:科技赋能智慧仲裁 云... 在数字化转型浪潮中,仲裁作为多元化纠纷解决机制的重要组成,正经历着从“线下奔波”到“云端办结”的深刻...
AI可能改变世界的7大希望 最近,我写了关于AI最大风险的文章,从数百万人失业到灾难性误用的可能性。即使作为乐观主义者,我也承认...
如何让AI“识破”AI?这项研... 随着大模型逐渐变成学习、工作中不可或缺的生产力工具,其伴生的问题也日益凸显。AI经常会“一本正经地胡...
重新发现人性:原住民智慧如何引... 当人工智能重塑我们的世界时,我们发现自己陷入了一个奇特的困境。 同样的技术既承诺解决我们最复杂的全球...
杭州跑出的AI独角兽,突围大模... 不仅是杭州六小龙,更是空间智能“破壁者”。 作者|Iris 编辑|王博 进入2025年,AI行业正经...
深入实施“人工智能+”行动,重... 21世纪经济报道见习记者冉黎黎 北京报道 人工智能处在应用落地的关键窗口期。为深入实施“人工智能+”...