金融界2024年3月27日消息,据国家知识产权局公告,中国电信股份有限公司申请一项名为“音频文件识别方法及装置“,公开号CN117765970A,申请日期为2023年12月。
专利摘要显示,本申请公开了一种音频文件识别方法及装置。其中,该方法包括:接收待识别音频文件;采用第一线程池中的第一线程,按照待识别音频文件中的音频帧的排列顺序,依次对待识别音频文件中音频帧进行处理,得到多个音频片段;采用第二线程池中的第二线程依次对将多个音频片段进行识别,得到多个识别结果,将多个识别结果进行排序后进行拼接,得到最终识别结果,其中,第一线程和第二线程为异步执行的线程。本申请解决了相关技术中需要等待VAD处理完成后,才会进行ASR处理,导致对音频文件识别效率较低的技术问题。
来源:金融界