marssunboy 发表于 2024-12-22 22:40:48

歌尔申请远场拾音专利,提升不同场景下的语音识别正确率

金融界2024年12月21日消息,国家知识产权局信息显示,歌尔科技有限公司申请一项名为“远场拾音方法、装置、设备及介质”的专利,公开号CN 119152873 A,申请日期为2023年6月。

专利摘要显示,本申请公开了一种远场拾音方法、装置、设备及介质,属于远场拾音技术领域。本申请聚焦提升远距离拾音质量,提升语音识别或翻译效果,提出一种远场拾音方法的技术方案,首先,在确定需要对获取到的原始音频进行音频处理之后,定位原始音频的声源位置,并基于声源位置和采集原始音频的麦克风位置生成音频波束;然后,在确定音频波束存在高噪之后,对音频波束进行噪声抑制,从而输出目标音频。基于麦克风阵列的信号处理技术,自动估计目标说话人方位,主波束聚焦说话人方向并抑制其他干扰,并通过降噪模块进一步消除噪声,提升语音清晰度。以此,识别风噪、高噪、安静或小噪声场景以进行不同的音效处理,更为细致地提升不同场景下的语音识别正确率。

本文源自金融界

风中追雨 发表于 2024-12-23 07:41:49

没人回帖。。。我来个吧

新村居民佬 发表于 2024-12-23 14:53:11

lz也多多分享一下感受,想换工作了

双鱼涵梓 发表于 2024-12-24 21:03:03

围观 围观 沙发在哪里!!!
页: [1]
查看完整版本: 歌尔申请远场拾音专利,提升不同场景下的语音识别正确率