金融界2024年2月8日消息,据国家知识产权局公告,腾讯科技(深圳)有限公司申请一项名为“语音数据处理方法、装置、设备及介质“,公开号CN117524228A,申请日期为2024年1月。
专利摘要显示,本申请实施例提供了一种语音数据处理方法、装置、设备及介质,该方法包括:从针对第一对象的语音数据流中获取目标帧长的语音唤醒数据;通过一级唤醒模型,对语音唤醒数据进行唤醒词检测处理;在唤醒词检测处理的结果指示语音唤醒数据唤醒第一对象的第一概率高于第一预设阈值的情况下,通过二级唤醒模型对目标数据进行识别处理,目标数据为语音数据流中包含语音唤醒数据的部分;在识别处理的结果指示语音唤醒数据唤醒第一对象的第二概率高于第二预设阈值的情况下,确定唤醒成功,以控制第一对象进入工作状态。本申请基于一级唤醒模型实现唤醒词检测处理,并基于二级唤醒模型实现二次校验处理,能够提高唤醒识别的准确性。
来源:金融界