张钹院士:大模型存在难以逾越的天花板,必须建立可解释AI理论
澎湃新闻
2024-01-16 16:22:27
0

原标题:张钹院士:大模型存在难以逾越的天花板,必须建立可解释AI理论

·GPT-4只能和数字世界打交道,我们最终必须跟物理世界打交道,这就需要机器人,也就是具身智能。张钹认为不一定要做人形机器人,不需要把硬件搞得非常复杂,他主张以一定的硬件为基础进行强化学习研究。

·全世界对大模型强大的生成能力、迁移能力、交互能力感到惊讶却无法解释,只能归结为“涌现”。为了人工智能产业的健康发展,必须将科学研究、技术创新、产业发展结合起来。要发展第三代人工智能,必须建立可解释和鲁棒的人工智能理论和方法,否则AI技术永远难以令人相信。

大语言模型存在天花板。

“通向通用人工智能的道路虽然依然艰难,但大语言模型为AI产业的发展打开一条通向通用AI宽广的道路。”1月16日,中文认知大模型企业北京智谱华章科技有限公司(以下简称“智谱AI”)举办的2024年度技术开放日上,中国科学院院士、清华大学人工智能研究院院长、清华大学计算机系教授张钹表示,大模型提供了发展通用硬件和软件的机会。

传统AI范式利用特定的算法和规则完成特定任务,生成式AI范式是基于一种称为基础模型的通用模型,通过广泛文本数据的训练,在开领域(open domain,开域)内可以生成类似于人类水平的高质量文本、图像和其他内容,通过微调等方式可适配于广泛的下游任务。生成式AI向通用AI迈出一步,第二步是AI智能体,第三步则是具身智能。张钹表示,GPT-4只能和数字世界打交道,我们最终必须跟物理世界打交道,这就需要机器人,也就是具身智能。具身智能的提出有助于构造完整的智能体,让智能体既有感知,又有思考。“不一定要做人形机器人,因为很多时候只要用手或脚就可以了,不需要把硬件搞得非常复杂。”他主张以一定的硬件为基础进行强化学习研究。

生成式AI大模型具备三大能力和一大缺点,即强大的生成能力、强大的迁移(推广)能力、强大的交互能力和幻觉。强大的语言生成能力可基于上下文和过去的对话,在开领域能够生成多样性令人惊讶的类似人类的连贯文本。强大的迁移能力可在代理任务上训练一个模型,通过细调适配到感兴趣的下游任务。强大的交互能力包括与人类的交互(人机交互)、机器之间的交互(多智能体)、与环境的交互(具身智能),通过交互在不同专业和科学的测试基准上表现出人类水平的智能。而针对幻觉,大模型有时会生成看似合理的编造或无意义的答案。

人工智能有助于推动经济增长,建筑、维护、安装等行业难以被自动化和智能化,但行政管理等白领工作或被AI替代。AI可提高大多数人类工作的质量和效率,但被AI完全替代的工作仍是少数。之所以AI还不能替代大多数工作,是因为大模型还存在难以逾越的天花板。张钹表示,大模型的所有工作都是外部提示而非主动,并且在外部提示的情况下利用概率预测完成任务,而人类的工作依靠内部意图驱动。大语言模型生成语言与人类语言生成只是行为上的相似性,而内在机制根本不同,大语言模型存在不自知、质量不可控、不可信、不鲁棒等天花板,给出不同的提示词,大模型会输出不同的回答。大模型也会产生幻觉,“不管模型多么大,幻觉这个缺点一直存在。”

他提出,要发展第三代人工智能,必须建立可解释和鲁棒的人工智能理论和方法,发展安全、可控、可信、可靠、可扩展的AI技术,推动AI的创新应用和产业化。如果不能建立可解释和鲁棒的人工智能理论,AI技术是不可靠的,AI技术永远难以令人相信。“到现在为止,这个理论还没有建立起来,这也是人工智能之所以发展缓慢和曲折的原因。理论建立不起来,是因为受到三个特定限制,过去只能在特定领域利用特定模型解决特定任务,这怎么可能建立通用理论?大模型的出现为建立这个理论提供了可能性。”

张钹表示,大模型为我们提供了发展通用硬件和软件的机会。人工智能正进入稳步发展的阶段,对各行各业有巨大影响,必须抓住机遇发展人工智能产业。但仍有大量不确定性,因为AI不可预测、不可控。全世界对大模型强大的生成能力、迁移能力、交互能力感到惊讶,却无法解释,只能归结为“涌现”。所以为了人工智能产业的健康发展,必须将科学研究、技术创新、产业发展结合起来。

相关内容

热门资讯

凯普斯取得实芯轮胎装配自动扒胎... 金融界2025年8月6日消息,国家知识产权局信息显示,江苏凯普斯工业科技有限公司取得一项名为“实芯轮...
深圳一初中生,入选“国家队” 近日,北京天文馆正式公布入选 2025年度国际天文奥赛 中国代表队学生名单 来自全国多个省市学校的 ...
歌尔股份取得发声装置和电子设备... 金融界2025年8月6日消息,国家知识产权局信息显示,歌尔股份有限公司取得一项名为“发声装置和电子设...
ISC.AI 2025在京开幕... 8月6日,第十三届互联网安全大会(ISC.AI 2025)在北京开幕。智能体作为大会的核心议题,实现...
苏州赛伍取得膜材制备生产线专利... 金融界2025年8月6日消息,国家知识产权局信息显示,苏州赛伍应用技术股份有限公司取得一项名为“膜材...
青原排查整治涉铊企业风险隐患 近日来,青原生态环境局严格按照“全覆盖、零容忍、明责任、严执法、重实效”的要求,通过创新监管模式、引...
聚焦临床科研 破解行业痛点 来源:新民晚报 本报讯(记者 左妍)目前,我国AI技术已在应急救治、远程会诊等场景广泛应用,显著提升...
原创 仅... 赶在去年最后一天,小米低调的上架了一款起售价499的新机红米14C,而在沉默了两天后,这款新机也是如...
青岛恒森聚工贸取得一种激光切割... 金融界2025年8月6日消息,国家知识产权局信息显示,青岛恒森聚工贸有限公司取得一项名为“一种激光切...
AT&T宣布:达成Op... C114讯 8月6日消息(艾斯)美国AT&T官网消息显示,该运营商近期与其合作伙伴爱立信和富士通实现...
泰斗微电子申请定位方法相关专利... 金融界2025年8月6日消息,国家知识产权局信息显示,泰斗微电子科技有限公司申请一项名为“定位方法、...
新疆库车市:科技赋能让棉花管理... 库车市将物联网、大数据技术与棉花种植深度融合,依托智慧水务平台构建起数字棉花智能化管理系统,棉农只需...
原创 地... 能量守恒定律指出:能量既不会凭空产生,也不会凭空消失,它只会从一种形式转化为另一种形式,或者从一个物...
OpenAI发布两款开源大语言... 来源:至顶网 OpenAI今日发布了新的生成式AI模型,虽然不是GPT-5,但这些新模型可能更加有...
立铠精密取得型材自动循环上升夹... 金融界2025年8月6日消息,国家知识产权局信息显示,立铠精密科技(盐城)有限公司取得一项名为“型材...
DJI ROMO P 首发评测... 是的,大疆做了个扫地机器人。 小雷知道很多人都一脸诧异,这家专注运动相机、无人机和影像周边设备的企业...
聚焦2025数博会|今年这些内... 2025数博会脚步渐近,一系列丰富且极具看点的活动安排浮出水面,从前沿产品展示到深度交流研讨,从精彩...
TD产业联盟:2025年2季度... 今天分享的是:TD产业联盟:2025年2季度5G产业和市场发展报告 报告共计:30页 《2025年二...
友邦集成吊顶取得石膏顶用隐藏式... 金融界2025年8月6日消息,国家知识产权局信息显示,浙江友邦集成吊顶股份有限公司取得一项名为“一种...
美的取得三相无源电路线路板布局... 金融界2025年8月6日消息,国家知识产权局信息显示,广东美的制冷设备有限公司、美的集团股份有限公司...