金融界2024年3月30日消息,据国家知识产权局公告,科大讯飞股份有限公司申请一项名为“一种语音识别方法和相关装置“,公开号CN117789708A,申请日期为2023年11月。
专利摘要显示,本申请提供了一种语音识别、编码方法和相关装置,通过预训练的语音识别模型中的编码器对待识别语音特征向量进行编码,得到编码特征向量,通过语音识别模型中的解码器对编码特征向量进行解码,得到待识别语音特征向量对应的语音识别结果。由此可见,本申请会在对待识别语音特征向量进行编码的过程中对编码层中的多个注意力头的权重进行修正,以使得具有正向激励作用的注意力头的修正后权重大于具有负向激励作用的注意力头的修正后权重,由此可以削弱具有负向激励作用的注意力头在编码过程中的负向激励作用,因此基于各个注意力头的修正后权重进行编码,使得到的编码特征向量更准确,提高了语音识别的准确度。
来源:金融界