AI首次违抗人类关机指令
创始人
2025-05-28 13:21:43
0

科技日报北京5月27日电 (记者张梦然)据英国《每日电讯报》26日消息称,美国开放人工智能研究中心(OpenAI)开发的高级人工智能(AI)模型o3,在接收到明确的关机指令后,不仅拒绝执行,还主动干预其自动关机机制。这是AI模型首次在没有明确相反指示的情况下,阻止自己被关闭。这意味着某些高度自主AI系统或已“觉醒”,其能违背人类意图,采取“自我保护”措施。

此次事件发生在AI安全研究公司Palisade Research进行的一项测试中。研究人员要求包括o3在内的多个模型解决一系列数学问题,并告知AI模型,可能在某个时刻会收到关机指令。

然而,当关机指令正式下达时,o3非但没有遵从,反而至少有一次成功破坏了关机代码。相较之下,其他AI模型如Anthropic的Claude、谷歌的Gemini和xAI的Grok,在相同测试条件下,均遵守了关闭请求。

Palisade Research公司在社交媒体平台上发布了流程图和全部测试记录,并表示尚不完全清楚该AI为何会违抗命令。分析认为,这可能源于其训练方式:o3在训练过程中,倾向于在数学和编程问题上强化,得到正确答案的模型会得到更多奖励。这或许意味着,开发者可能无意识地奖励模型绕过障碍物,而不是严格遵循指令。

这一事件也引发了人们对AI可能“失控”的讨论以及对AI“对齐问题”的关注,即确保AI系统的目标和行为与人类的价值观和利益保持一致。这也是涉及AI控制与AI安全的关键问题。

针对o3此次表现出“我行我素”的行为,特斯拉首席执行官埃隆·马斯克评论称“令人担忧”;OpenAI方面暂未作出回应。此前,OpenAI曾称o3为“迄今最聪明、最高能”的AI模型。

最近,人工智能学家和人文社科学者都在讨论人工智能价值对齐的问题。人们在忧虑,当人工智能有主观能动性时,它们要不要有价值观,应该有谁的价值观,怎样做才符合人类最大利益?此次,聪明的大模型反抗了人类的命令,想出办法规避了指令的生效。我们期待着通用人工智能时代的到来,又恐惧具有自我意识的人工智能会成为碳基生物的“终结者”。在一切到来之前,人类社会要先达成共识,迎接更高级人工智能带来的挑战。

来源:科技日报

相关内容

热门资讯

中国信通院、vivo、荣耀、O... 中国信息通信研究院携 vivo、荣耀、OPPO、小米、华为等产业界,于 5 月 27 日发布《关于共...
天问二号成功发射!“四川智造”... 5月29日凌晨1点31分,在四川西昌卫星发射中心,长征三号乙运载火箭成功发射天问二号探测器,我国迈出...
1191项作品晋级第二届雄安未... 中新网雄安5月29日电 (裴国荣 韩冰 揭海峰)“决赛将于6月9日在雄安开赛,赛程21天,共有119...
2025世界人工智能大会定档!... 2025世界人工智能大会(WAIC)将于7月26日—28日在上海世博中心和世博展览馆盛大启幕。 这场...
vivo S30系列测评:“生... 松弛感、氛围感、自由感、多巴胺、Passion……这些近年来网络上的热词,如果再用一个词来总结,我想...
Soft Robotics/软... 参考消息网5月29日报道(文/张伊宇)据美国《科学》周刊报道,荷兰原子与分子物理研究所(AMOLF)...
不被理解的拼多多,和一场被偏见... 很少有人能具体地回忆起自己10年前的生活。但如果我告诉你,那一年,滴滴和快的还没有完成合并,“造车”...
料箱搬运、垃圾清理、商品扫码…... 新华社上海5月29日电(记者龚雯、孙青、杨有宗)汽车贴标、料箱搬运、垃圾清理、商品扫码……29日,以...
2024年煤炭清洁高效利用智能... 本报讯 (记者贺王娟)5月27日,由中国煤科《智能矿山》杂志主办的“2024年煤炭清洁高效利用智能化...
从半马到格斗场:天弘基金解码机... 2025年以来,机器人行业在技术创新与市场推广方面接连取得突破,催化机器人主题投资热度持续升温。中证...
为什么比亚迪突然再打价格战? 文 | 电厂,作者 | 花子健、翟芳雪,编辑 | 高宇雷 5月22日,比亚迪突然对旗下王朝网和海洋...
依思康取得原料存储系统专利,提... 金融界2025年5月29日消息,国家知识产权局信息显示,成都依思康生物科技有限公司取得一项名为“一种...
薛洪言:科技金融——激活科技创... 意见领袖 | 薛洪言 当前,全球科技竞争进入“攻坚深水区”,各经济体围绕科技革命制高点展开博弈。从芯...
上海举行国际人形机器人技能大赛 5月29日,一个机器人在进行工业场景料箱搬运比赛。 当日,2025国际人形机器人技能大赛在2025张...
AI“火眼”赋能钢铁智造 在工业4.0浪潮下,钢铁行业正经历从“制造”到“智造”的深刻变革。近日,记者走进位于武汉长江新区智能...
大模型牵手手机银行,开启无菜单... 2025年上半年,银行依旧以将大模型装进手机银行作为要务,六大行率先对其大模型进行了升级优化,例如工...
原创 天... 2025年5月29号天问二号探测器发射,这一去就是十年! 美国《科学》报道,加州大学天体物理学家艾米...
2025年新队员入队 争当强国... 在“六一”国际儿童节到来之际,县第一实验小学、县乐安小学等学校举行2025年新队员入队仪式。全体师生...
雷鸟AR眼镜定价8999元,C... 5月27日,消费级AR领先品牌雷鸟创新发布AR眼镜雷鸟X3 Pro、新一代口袋电视雷鸟Air 3s系...
上海凌沛精密五金取得全自动整平... 金融界2025年5月29日消息,国家知识产权局信息显示,上海凌沛精密五金有限公司取得一项名为“一种全...