可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE
IT之家
2024-01-23 11:54:46
0

原标题:可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

IT之家 1 月 23 日消息,谷歌日前发布新闻稿,介绍了一款专为大语言模型设计的 ASPIRE 训练框架,该框架号称可以增强 AI 模型的选择性预测能力。

谷歌提到,当下大语言模型在自然语言理解和生成内容方面发展迅速,已被用于构建各种创新应用,但要应用于高风险决策类场合依然不妥。这是由于模型预测具有不确定性及“幻觉”可能,因此谷歌开发了一款 ASPIRE 训练框架,为系列模型引入了“可信度”机制,即 —— 模型会输出一系列答案,每个答案都会具有正确概率评分

▲ 图源 谷歌新闻稿(下同)

在技术层面,IT之家注意到该训练框架主要分为三阶段,分别为“特定任务调整”、“答案采样”和“自我评估学习”。

其中“特定任务调整”阶段是对已接受过基础训练的大型语言模型进行深入训练,专注于强化模型的预测能力。研究人员主要为模型引入一系列可调参数,在特定任务的训练数据集上微调预训练语言模型,从而提升模型预测性能,让模型能够更好地解决特定问题。

第二阶段为“答案采样”,经过特定微调后,模型可以利用先前学习到的可调参数,为每个训练问题生成不同的答案,并创建用于自我评估学习的数据集,生成一系列可信度较高的答案。研究人员同时使用 “集束搜索(Beam Search)”方法及 Rouge-L 算法来评估答案的质量,并将生成的答案及评分重新输入给模型开启第三阶段

而在第三阶段“自我评估学习”中,研究人员为模型添加一组可调参数,专门用于提升模型自我评估能力。该阶段的目标是让模型学会“自己判断输出的答案准确性”,从而让大语言模型在生成答案时,还会附上答案的正确概率评分。

谷歌研究人员使用 CoQA、TriviaQA 和 SQuAD 三个问答数据集来验证 ASPIRE 训练框架的成果,据称“经过 ASPIRE 调整的 OPT-2.7B 小模型,表现远超更大的 OPT-30B 模型”。而这项实验结果也同时表明,只要经过适当的调整,即使是小语言模型,在部分场景下也可以超越大语言模型。

研究人员总结称,ASPIRE 框架训练能够显著提升大语言模型输出准确率,即使是较小的模型,也可以在经过微调后进行“准确且有自信”的预测

相关内容

热门资讯

原创 奥... OpenAI首席执行官 Sam Altman 表示,使用人工智能的方式会因年龄而异。在一次 AI 活...
用激光为气体做“B超” 西安高... 用激光为气体做“B超”?没错!5月14日,记者获悉,西安电子科技大学研究团队在高精度气体监测方面取得...
一生要出片儿的科学家,靠摆拍的... 一生要出片儿的科学家,靠摆拍的工作照获得国际大奖 拍工作照除了发朋友圈之外,还能干什么? 刚刚,20...
万丰奥威:2025年将全力推进... 人民财讯5月14日电,万丰奥威5月13日在业绩说明会上表示,公司构建了“固定翼+垂直起降飞行器+无人...
原创 高... 2025年就要过半了,又迎来了甜蜜浪漫的“520”, 不管是表白心意还是悄然的惊喜,除了甜蜜的话语之...
【基层动态】信息数据中心举办“... 为深化团队专业能力建设,推动数字化技术落地应用,日前,沈鼓集团信息数据中心组织开展“面向用户的数字化...
龙芯终端与合见工软Archer... 近日,上海合见工业软件集团有限公司(简称“合见工软”)自主研发的高端大规模PCB设计平台UniVis...
均普智能跌1.04%,成交额2... 5月14日,均普智能跌1.04%,成交额2.33亿元,换手率1.81%,总市值128.85亿元。 异...
原创 A... 当前,全球经济正陷入低迷,通胀高企、产业链重构、地缘冲突频仍,企业与市场都在经历一场穿越周期的集体考...
涉及氢能!最高2000万!四川... 5月8日,四川省科学技术厅征集第三批“成果找市场”揭榜挂帅项目需求。 此次征集范围包括人工智能(含...
打造区域创新高地 引领能源产业... 实验室是科技创新的重要一环,就像科技创新体系里的“宝藏基地”,既能孕育出重大的创新成果,推动学科不断...
贵州铝厂自主研发了一款车,还卖... 5月8日,由贵州铝厂工业服务公司装备制造分公司自主研发阳极运输车正式踏上跨国运输的征程,在跨越数千公...
杭州中昱建设取得一种智慧路灯专... 金融界2025年5月14日消息,国家知识产权局信息显示,杭州中昱建设有限公司取得一项名为“一种智慧路...
佳都科技新设子公司,业务覆盖多... 近日,一家专注于人工智能领域的新公司——深圳市佳都智通科技有限公司,正式宣告成立。该公司的法定代表人...
中国科学院院士、我国航天液体火... 5月14日,中国航天科技集团有限公司第六研究院发布讣告,中国共产党优秀党员、中国科学院院士、我国航天...
AI能否更懂人心?广东省心协举... “通过微表情、肢体动作,AI能对人们的心理健康做出分析判断。这种技术赋能,刺激行业不断创新和变革。”...
AI浪潮下 职业教育如何向“新... 5月8日至11日,第二十七届中国北京国际科技产业博览会(以下简称“北京科博会”)在国家会议中心举行。...
委员风采|柳雁勇:AI赋能创新... 柳雁勇 朔州市政协委员 山西二马马建工集团有限公司总经理、朔州市新的社会阶层人士联谊会会长 “A...
昆仑芯申请功能单元控制方法专利... 金融界2025年5月14日消息,国家知识产权局信息显示,昆仑芯(北京)科技有限公司申请一项名为“功能...
微信月活首次突破 14 亿 IT 之家 5 月 14 日消息,腾讯控股今日发布 2025 年第一季度财报,其中显示,微信及 We...