2021年F-T-LSTM模型在联合声学回声消除与语音增强中的应用研究,有何创新?
- 内容介绍
- 文章标签
- 相关推荐
本文共计6745个文字,预计阅读时间需要27分钟。
文章:基于F-T-LSTM的复杂网络联合声学去除和语音增强
摘要:本文提出了一种基于F-T-LSTM的复杂网络联合声学去除和语音增强方法。针对对语音频通和在线会议的需求,该方法在包含噪声、混响和非线性失真等复杂环境下的语音信号中进行去除和增强。实验结果表明,该方法在语音质量、信噪比等方面具有显著优势。
论文地址:arxiv.53yu.com/abs/2106.07577
基于 F-T-LSTM 复杂网络的联合声学回声消除和语音增强 摘要随着对音频通信和在线会议的需求日益增加,在包括噪声、混响和非线性失真在内的复杂声学场景下,确保声学回声消除(AEC)的鲁棒性已成为首要问题。尽管已经有一些传统的方法考虑了非线性失真,但它们对于回声抑制仍然效率低下,并且在存在噪声时性能会有所衰减。在本文中,我们提出了一种使用复杂神经网络的实时 AEC 方法,以更好地建模重要的相位信息和频率时间 LSTM (F-T-LSTM),它扫描频率和时间轴,以实现更好的时间建模。此外,我们利用修改后的 SI-SNR 作为损失函数,使模型具有更好的回声消除和噪声抑制 (NS) 性能。仅使用 140 万个参数,所提出的方法在平均意见得分 (MOS) 方面优于 AEC challenge 基线 0.27。
关键字:回声消除、复杂网络、非线性失真、噪声抑制;
1 引言回声是在全双工语音通信系统中产生的,由于近端扬声器和麦克风之间的声学耦合,远端用户接收到他/她自己的语音的修改版本。回声消除 (AEC) 旨在消除麦克风信号中的回声,同时最大限度地减少近端说话者语音的失真。
本文共计6745个文字,预计阅读时间需要27分钟。
文章:基于F-T-LSTM的复杂网络联合声学去除和语音增强
摘要:本文提出了一种基于F-T-LSTM的复杂网络联合声学去除和语音增强方法。针对对语音频通和在线会议的需求,该方法在包含噪声、混响和非线性失真等复杂环境下的语音信号中进行去除和增强。实验结果表明,该方法在语音质量、信噪比等方面具有显著优势。
论文地址:arxiv.53yu.com/abs/2106.07577
基于 F-T-LSTM 复杂网络的联合声学回声消除和语音增强 摘要随着对音频通信和在线会议的需求日益增加,在包括噪声、混响和非线性失真在内的复杂声学场景下,确保声学回声消除(AEC)的鲁棒性已成为首要问题。尽管已经有一些传统的方法考虑了非线性失真,但它们对于回声抑制仍然效率低下,并且在存在噪声时性能会有所衰减。在本文中,我们提出了一种使用复杂神经网络的实时 AEC 方法,以更好地建模重要的相位信息和频率时间 LSTM (F-T-LSTM),它扫描频率和时间轴,以实现更好的时间建模。此外,我们利用修改后的 SI-SNR 作为损失函数,使模型具有更好的回声消除和噪声抑制 (NS) 性能。仅使用 140 万个参数,所提出的方法在平均意见得分 (MOS) 方面优于 AEC challenge 基线 0.27。
关键字:回声消除、复杂网络、非线性失真、噪声抑制;
1 引言回声是在全双工语音通信系统中产生的,由于近端扬声器和麦克风之间的声学耦合,远端用户接收到他/她自己的语音的修改版本。回声消除 (AEC) 旨在消除麦克风信号中的回声,同时最大限度地减少近端说话者语音的失真。

