金融界2024年2月20日消息,据国家知识产权局公告,重庆长安汽车股份有限公司申请一项名为“模型训练方法、下游任务的处理方法及装置、和电子设备“,公开号CN117574913A,申请日期为2023年11月。
专利摘要显示,本申请涉及一种模型训练方法、下游任务的处理方法及装置、和电子设备,该方法包括:基于初始训练样本,生成第一训练样本;其中,第一训练样本中包括初始训练样本的类别信息、初始训练样本对应的第一文本单元集、及初始训练样本对应的类别信息集;对第一训练样本进行掩码处理,得到第二训练样本;利用第一模型对第二训练样本进行掩码预测,得到第二文本单元集;基于第二文本单元集,对第一模型的模型参数进行至少一次更新,得到训练后的第一模型。本申请通过在样本中引入各个文本单元的类别信息对模型进行训练,模型可以学习到文本单元的类别信息和上下文之间的关联,使得训练后的模型能够对各种语料进行精准识别,从而提升用户的体验。
来源:金融界