金融界2024年1月27日消息,据国家知识产权局公告,广州小鹏汽车科技有限公司申请一项名为“音频识别方法、音频识别装置、车辆、计算机设备和介质“,公开号CN117456999A,申请日期为2023年12月。
专利摘要显示,本申请公开一种音频识别方法、音频识别装置、车辆、计算机设备和介质。方法包括:对待识别音频进行编码,以生成发音概率矩阵;通过预设的延迟纠错模型,对发音概率矩阵进行纠错,以得到对应的字结果和输出概率矩阵;对字结果和输出概率矩阵进行发音映射,以得到映射概率矩阵,并根据映射概率矩阵和发音概率矩阵,生成目标概率矩阵;对目标概率矩阵输入到语音解码图进行解码,以得到识别结果。通过延迟纠错模型具备的纠错能力,对发音概率矩阵进行纠错,从而获取到准确的字结果,提高音频识别的准确性,且延迟纠错模型可以有效地节省算力,节省存储空间等。
来源:金融界