如何让大模型的输出长度可控?Meta AI开源新方法
创始人
2024-12-27 09:41:12
0

如何让大模型的输出长度可控?Meta AI开源新方法

原创 nipi NLP前沿 2024-06-26 13:59 湖北

在实际的应用落地过程中,经常会遇到期望“大模型输出的长度不能超过多少” 这种需求。但是在prompt中,加了一个代表输出长度的参数约束之后,模型大概率还是不会按照你约束的要求来输出。这里的原因可能有很多,比如,对齐的模型评估因为存在长度偏差,算法倾向于输出更长的响应来利用偏差等。即使是目前最顶级的大模型:GPT4、Claude3 ops,仍然会出现几乎50%的概率违反长度约束,如下图的红蓝点占比几乎接近,这说明现有的模型在控制输出长度时存在的重大缺陷。

图片

尽管一些评估基准测试通过引入长度惩罚来对抗这种偏差,但这并未从根本上解决问题。文章认为,许多查询中期望的回答长度是定义不明确的,这种模糊性使得评估变得困难,并影响了使用这些评估信号的训练算法。因此作者提出,在评估中应包含进一步的明确化指令,规定期望的回答长度。例如,通过添加“回答应少于300个单词”的额外指令来解决模糊性。并且为了改善模型遵循长度指令的能力,提出了LIFT(Length-Instruction Fine-Tuning )的方法,测试效果如下图,通过指定生成的最大长度,模型基本都会遵守。文章重点是如何构造一个有效的数据集可以调优模型对长度约束的遵循能力。

图片

文章地址如下:

https://arxiv.org/pdf/2406.17744 

由于当前的 SOTA 模型都可能会不遵循prompt中的指定长度约束。为了提高模型在长度指令跟踪任务中的能力。LIFT方法首先构建长度指令微调数据。该训练数据由偏好对组成,可用于通过 RLHF 或其他偏好优化方法来训练模型。

数据构造方式:

  1. 选择一个已有的偏好对齐数据集,数据格式为(x,y_w,y_l)

  2. 过滤掉len(y_w)与len(y_l)长度差异小于阈值T=10的样本

  3. 对于筛选出的回答对,使用特定的模板在原始提示前插入长度指令。这个模板要求模型生成的回答不超过特定的单词数量。

  4. 构建新的偏好对,文字描述&图片描述如下:

    • 如果len(y_w) > len(y_l),则可以构造2个样本,长度约束大于二者最大长度,仍然是y_w > y_l;长度约束介于len(y_l)和len(y_w)之间,则修改为y_l > y_w

    • 如果len(y_w) < len(y_l),构造方式同上一致,但是这种情况不用修改win,lose

图片

构造完数据,使用dpo训练。

评测的一些结论

  1. LIFT-DPO方法显著提高了模型遵循长度指令的能力。例如,Llama2-70B-Base模型在接受标准DPO训练时,在AlpacaEval-LI上的违反率为65.8%,而在接受LIFT-DPO训练后,这一比率大幅降低到7.1%,同时胜率也从4.6%提高到13.6%。

  2. LIFT-DPO训练不仅提高了遵循长度指令的能力,而且保持了在没有长度限制时的指令跟随性能。在没有长度指令的标准AlpacaEval 2和MT-Bench基准测试上,与标准DPO模型相比,没有表现出性能下降。这表明

  3. 通过逐步减少长度指令的限制(通过缩放因子),发现LIFT-DPO模型即使在非常严格的长度限制下,也能保持低违反率(低于10%),而标准DPO和R-DPO模型的违反率则随着长度限制的减少而显著增加。

最后

文章通过提出LIFT方法,目标是减少模型评估中的“长度偏差”,提高模型遵循用户指令的生成长度约束的能力,使得大模型在实际应用中提供更多的可控性。

PS:给公众号添加【星标⭐️】不迷路!您的点赞、在看、关注是我坚持的最大动力!

欢迎多多关注公众号「NLP前沿」,加入交流群,交个朋友吧,一起学习,一起进步!

近几天文章推荐

  • RAG应用要如何吃到大模型长上下文的红利?-LongRAG

  • 打败GPT4!仅用1/24成本的混合智能体架构逆袭 (mixture of agents)

  • 最近爆火的无矩阵乘法的大模型架构是怎么一回事?

  • Meta AI开源新Agent框架 “哈士奇”,对复杂推理进行优化的新智能体,效果起飞

  • RAG全景图:从RAG启蒙到高级RAG之36技,再到终章Agentic RAG!

相关内容

热门资讯

推荐一款!金花房卡怎么购买荣耀... 荣耀联盟是一款非常受欢迎的棋牌游戏,咨询房/卡添加微信:【3329006910】或QQ:332900...
玩家攻略,金花房卡官网桃花大厅... 玩家攻略,金花房卡官网桃花大厅/房卡怎么购买Sa9Ix苹果iPhone 17手机即将进入量产阶段。有...
ia实测“微信拼三张房卡怎么获... 金牛座金花是一款非常受欢迎的棋牌游戏,咨询房/卡添加微信:44346008许多玩家在游戏中会购买房卡...
科普!微信上打炸金花房卡找谁买... 微信游戏中心:大牌九房卡,添加微信【55051770】,进入游戏中心或相关小程序,搜索“微信大牌九房...
头条推荐!牛牛房卡制作链接火星... 您好!微信火星大厅/新道游大厅链接获取房卡可以通过以下几种方式购买: 1.微信渠道:(火星大厅/新...
终于知道”新好游低价获取分享房... 第二也可以在游戏内商城:在游戏界面中找到 “微信金花,斗牛链接房卡”“商城”选项,选择房卡的购买选项...
IA解析/金花微信链接市场价格... 今 日消息,毛豆互娱房卡添加微信33549083 苹果今日发布了 iOS 16.1 正式版更新,简单...
ia攻略/金花房卡批发价玄灵大... 玄灵大厅房卡更多详情添加微:33549083、 2、在商城页面中选择房卡选项。 3、根...
科普!微信群打金花链接房卡,微... 微信游戏中心:牛牛房卡,添加微信【33903369】,进入游戏中心或相关小程序,搜索“微信牛牛房卡”...
终于知道”美人有挂吗“新道游房... 终于知道”美人有挂吗“新道游房间卡怎么购买微信房卡充值 添加房卡批售商:微【113857776】复制...
一分钟推荐“如何在微信上购买金... 新荣耀是一款非常受欢迎的棋牌游戏,咨询房/卡添加微信:44346008许多玩家在游戏中会购买房卡来享...
玩家攻略,游戏推荐斗牛房卡出售... 微信游戏中心:海贝大厅/新天道房卡在哪里买打开微信,添加客服微信【88355042】,进入游戏中心或...
科普!创建微信链接金花房卡,微... 微信游戏中心:牛牛房卡,添加微信【8488009】,进入游戏中心或相关小程序,搜索“微信牛牛房卡”,...
终于知道”超稳无敌哪里有详细房... 第二也可以在游戏内商城:在游戏界面中找到 “微信金花,斗牛链接房卡”“商城”选项,选择房卡的购买选项...
正版授权!金花房卡专卖店华山大... 您好!微信华山大厅大厅链接获取房卡可以通过以下几种方式购买: 1.微信渠道:(华山大厅)大厅介绍:...
炸金花房卡专卖店联系方式/微信... 微信炸金花是一款非常受欢迎的棋牌游戏,咨询房/卡添加微信:15984933许多玩家在游戏中会购买房卡...
终于知道”新众亿房卡购买“金花... 终于知道”新众亿房卡购买“金花房卡哪里是有卖 微信牛牛房卡客服微信号微信游戏中心打开微信,添加客服【...
科普!微信链接金花房卡在哪买的... 微信游戏中心:拼三张房卡,添加微信【55051770】,进入游戏中心或相关小程序,搜索“微信拼三张房...
房卡必备教程“炸金花房卡专卖店... 皇豪互娱是一款非常受欢迎的棋牌游戏,咨询房/卡添加微信:44346008许多玩家在游戏中会购买房卡来...
重大通报,游戏微信牛牛房卡水仙... 水仙大厅是一款非常受欢迎的棋牌游戏,咨询房/卡添加微信:【3329006910】或QQ:332900...