金融界2024年1月27日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司申请一项名为“训练数据的生成方法、装置、设备及存储介质“,公开号CN117453888A,申请日期为2023年11月。
专利摘要显示,本申请公开了一种训练数据的生成方法、装置、设备及存储介质,涉及人工智能技术领域。该方法包括:将样本输入语句和进化提示,输入第一生成式语言模型生成优化输入语句,样本输入语句为训练集中已有的用于指示第三生成式语言模型生成代码的提示语句,优化输入语句为优化后的用于指示第三生成式语言生成代码的提示语句;将优化输入语句输入第二生成式语言模型,生成与优化输入语句对应的应答语句;基于优化输入语句和应答语句,确定用于优化第三生成式语言模型生成代码的能力的训练数据。本申请提供了一种基于训练集中已有输入语句来拓展输入语句,进而生成用于优化生成式语言模型的训练数据的方法。
来源:金融界