金融界2024年3月15日消息,据国家知识产权局公告,荣耀终端有限公司申请一项名为“目标人声提取方法、电子设备及存储介质“,公开号CN117711420A,申请日期为2023年7月。
专利摘要显示,本申请实施例提供了一种目标人声提取方法、电子设备及存储介质。在该方法中,针对一帧混合语音,首先对其进行声源分离,得到多路语音信号,然后将多路语音信号的整合特征和目标人的声纹特征输入到PVAD深度神经网络模型中,以确定与该帧混合语音的目标人声提取结果对应的目标标签。当目标标签指示多路语音信号中存在一路为目标人声时,根据目标标签获取相应的一路语音信号作为目标人声提取结果。这样能够实现在多说话人语音混合场景中提取出目标人声,提高通话质量,进而提升远端用户的听觉体验。
来源:金融界