金融界2025年6月2日消息,国家知识产权局信息显示,度小满科技(北京)有限公司申请一项名为“模型训练方法、装置、存储介质及电子设备”的专利,公开号CN120069121A,申请日期为2024年12月。
专利摘要显示,本发明提供一种模型训练方法、装置、存储介质及电子设备,该方法包括:获取第一模型,以及获取训练数据集;调用第一模型,分别确定训练数据集中每个训练数据的模型运行结果;并基于每个训练数据的模型运行结果,计算各个模型参数在当前迭代下的一阶梯度;确定各个模型参数在上一次迭代下的一阶梯度,并基于各个模型参数在上一次迭代下的一阶梯度和各个模型参数在当前迭代下的一阶梯度,分别计算各个模型参数在当前迭代下的二阶梯度;基于各个模型参数在当前迭代下的一阶梯度和二阶梯度,分别计算各个模型参数在当前迭代下的模型参数值,以得到第二模型,从而基于第二模型,确定目标模型。
来源:金融界