学生用AI写作业怎样识别?专家:用AI“打败”AI
创始人
2025-06-05 11:02:12
0

你怎么知道这是AI写的

如果要问DeepSeek、ChatGPT、文心一言、豆包、Kimi等生成式大模型最广泛的用法是什么,学生党的回答可能是:写作业。很多人发现,AI生成的文字,可能比自己写得更优美、更流畅、更严谨。但这种便利无疑给学校管理者带来了麻烦——如何监督学生,不把自主思考让位给人工智能?在操作层面,这个难题就是——如何精准识别AIGC(AI生成内容)?

专家也难辨真假

记者调研发现,现如今,大学生利用AI辅助完成作业、毕业论文(设计)的情况已非常普遍。对此,全国多所高校都在试行或出台相关规定办法,规范大学生对AI工具的使用。今年毕业季,部分高校提出要求,学生的毕业论文除了要通过查重外,还需检测AIGC工具使用情况。

但现实中,不少学生反映,一些AI检测工具存在误判问题:有的学生在同一平台对同一文档进行AI检测,第一天的检测率为10%,第二天上升至20%多;有的学生论文中的原创内容被系统判定为AI生成;更有学生发现,即便论文主要内容是公式、著名作家的经典文章,系统也会显示AI检测率超标……

AIGC,很难选、很难评?确实如此。

发表在《应用语言学研究方法》上的一则研究,讨论了顶级期刊的语言学家、评论家能够在多大程度上区分AI写作和人工写作——72位专家参与了这项调研,结果专家的正确率不足40%。

从共同处找不同

目前,如何精准识别AIGC,已经成为人工智能学术界研究的热点。这不单单是为了督促学生们认真学习,更在科研、法律、政策、经济管理等方面,有巨大的潜在需求。那么,如何研发出一款“靠谱”的检测工具呢?

西湖大学自然语言处理实验室负责人张岳认为,要在共同处找不同。

他说:“尽管我们作为‘人’,很难准确揪出AI生成的文字,但面对AI撰写的文字时,总有一种说不上来的‘别扭’。这种别扭,或许是来自潜意识里的直觉判断,但却说不清道不明。”

事实上,机器生成的文本与人类生成的文本看起来很像,但在语义、语法、用词习惯等细节处理上,存在许多不同。

“人类的思考是‘因果性’的,而机器的思考则偏向‘统计性’。”张岳进一步解释,“以写文章为例,AI的写法是学习现有数据,从中挑选最‘安全稳妥’的词,也就是按照概率高低来选词,这和人写作的创造性是有本质区别的。”

如果现在有一个数据库,里面装着人类历史上100位著名作家的文章。当AI用“统计性”学习这个数据库,它学到的不是这些作家的“神来之笔”,而是他们之间共用的、出现频率更高的词。

这个词,叫“平庸”。

因何如此?

张岳认为,症结在于AI缺少“泛化性”,即模型的“适应能力”。换言之,模型不能借助训练数据中学到的因果逻辑举一反三,并将这种能力拓展应用至未曾接触过的领域。

用AI识别AI

日前,西湖大学自然语言处理实验室研发出的一款AI程序Fast-DetectGPT,试图用AI“打败”AI。而这款工具,本质上就是“找不同”。

张岳介绍,目前已知主要有三类技术来识别AI生成的内容:监督分类器法、零样本分类器法、文本水印法,用起来各有利弊。

监督分类器法比较实在,它需要收集大量的已知数据并做分类学习,就像学生上课,碰到没有见过、学过的数据,就会找不着北,导致准确率下降。

零样本分类器法,顾名思义无需收集数据,它主要是学习AI写的文本有什么特征,以此来做区分判断。但是,AI写文章到底有什么特征呢?如果AI写得越来越像人,特征越来越不明显怎么办?这便是其中难点。

文本水印法,与前两种方法的逻辑不同,它是在AI生成的文本上打上水印,准确率比前两种都要高,但可能存在水印被人为弱化甚至移除的风险。

作为Fast—DetectGPT主要研发者,西湖大学博士研究生鲍光胜选择用零样本分类器法完成这项实验。

他提出一种假设——在给定上下文情况下,人类和AI在选择词汇时会存在明显差异,但不同AI模型之间的差异并不明显。研究团队针对这种差异,开发了一种自动化的指标进行区分。

“我们可以把它理解成,面对一篇文章,Fast—DetectGPT作为AI会先想想,自己会怎么写?然后根据这个自问自答的参考答案,去比对原文,看看重合度有多高——以子之矛,攻子之盾。”鲍光胜说。

他进一步解释,当程序接收到一个文本片段,首先会在不改变原意的情况下进行改写,把局部的同义词替换掉,再将这份替换后的文本与原始文本进行对比,如果是AI写的,两者之间的相似性会比较明显。

简单来说,AI对AI写的内容更“熟悉”,可以“认出”同类的作品。

效果怎么样?

张岳介绍,目前,Fast—DetectGPT及其私有模型扩展Glimpse能够支持26种语言。2024年4月上线至今,已经有450多万人次用它做过“是AI还是人”的检测。与上一代DetectGPT相比,Fast—DetectGPT在速度上提升了340倍;在检测准确率上相对提升约75%——在ChatGPT生成文本上,检测正确率为96%;在GPT—4生成的文本上,检测的正确率达到了90%;针对DeepSeek—v3生成文本的检测,正确率则达89%。

“当然,面对当前不断迭代更新的大模型,科研团队将持续研究,以帮助公众精准识别AIGC。”张岳说。

来源:光明日报

作者: 晋浩天

相关内容

热门资讯

谷歌CEO劈柴震撼预言:203... 新智元报道 编辑:英智 【新智元导读】AI让每个人都能成为创作者!谷歌CEO劈柴震撼发声,称AI是...
咸阳:数字技术赋能传统产业转型 渭河沿岸,咸阳高新区高楼林立。厂房里,自动化生产线有序运转;电子屏幕上,数据如流水般涌动。 近年来,...
原创 华... 华为智选与IAM的联动创研,是科技与健康两大领域深度结合的推动者,更是健康智能家电创新的引领者。他们...
蔚来申请逆变器故障诊断响应方法... 金融界2025年6月6日消息,国家知识产权局信息显示,蔚来汽车科技(安徽)有限公司申请一项名为“逆变...
新闻分析丨AI时代的物流创新:... 本文转自【新华社】 新华社德国慕尼黑6月5日电 新闻分析丨AI时代的物流创新:人类依然是决策核心 新...
江西省社以数字化引擎驱动农业服... 省供销联社监事会办公室/文 在乡村振兴战略深入实施的时代浪潮下,农业领域的数字化转型成为提升生产效率...
移动端赋能:数商云B2B系统如... 引言 在当今快节奏的商业环境中,时间和效率是企业竞争的关键因素。特别是在B2B(Business-...
能扛能打还聪明的千元AI手机!... 一、前言:魅族Note的全新使命 打造国民严选手机 如今的千元机市场大家都在卷续航和耐用性,而魅族日...
乐动机器人拟赴港上市 阿里巴巴... 央广网北京6月6日消息(记者 齐智颖)深圳乐动机器人股份有限公司(以下简称“乐动机器人”)日前在港交...
我国5G建设全面提速,6G布局... 2025-06-06 17:23:40 作者:狼叫兽 截至2024年6月,我国5G基站总数已达到...
上海小红书代运营公司:助力品牌... 在当前互联网商业的进程中,平台间的合作不断重塑着市场格局。5月7日,淘宝天猫(下称“淘天”)与小红书...
暑假新机推荐:一加 Ace 5... 暑假来临,想必很多小伙伴都计划着畅玩各类手游来放松身心。但长时间玩游戏,发热、续航不给力等问题常常会...
驿城区:求新谋质 数智赋能 全... 河南日报社全媒体记者 苗银 通讯员 张旭 6月5日,走进位于驻马店市驿城区的河南省铁甲科技股份有限公...
人形机器人大规模商业化的关键是... 2025年被定义为人形机器人“量产元年”,随着产业链上下游企业的紧密协作、资本与产业的深度融合,人形...
黑洞或可“化身”宇宙超级对撞机 据最新一期《物理评论快报》,美国约翰斯·霍普金斯大学的一项最新研究为粒子物理研究开辟了新思路:宇宙中...
大尚智能取得车载电源装配工装专... 金融界2025年6月6日消息,国家知识产权局信息显示,浙江大尚智能机械制造有限公司取得一项名为“一种...
从“测”到“控”,从“数”到“... 新型电力系统加快构建下,源网荷储一体化、微电网、虚拟电厂等多样化应用场景不断涌现,持续对能源管理数字...
科创AI指数如何布局“浓缩版”... 《金基研》 祁玄/作者 在过去十年间,“人工智能”这个词语在大众视野中愈发引人瞩目。从围棋对决走红的...
原创 8... 好好好,都开始搞小平板了是吧? 昨天红米前脚全面对标 iPad mini ,今天苹果后脚教育优惠外加...
工匠精神助力强国建设 经济日报北京6月5日讯(记者崔国强)国新办5日举行“新征程上的奋斗者”中外记者见面会,中央企业产业工...