2021年F-T-LSTM模型在联合声学回声消除与语音增强中的应用研究，有何创新？

2026-05-22 14:510阅读0评论SEO问题

内容介绍
文章标签
相关推荐

本文共计6745个文字，预计阅读时间需要27分钟。

2021年F-T-LSTM模型在联合声学回声消除与语音增强中的应用研究，有何创新？

文章：基于F-T-LSTM的复杂网络联合声学去除和语音增强

摘要：本文提出了一种基于F-T-LSTM的复杂网络联合声学去除和语音增强方法。针对对语音频通和在线会议的需求，该方法在包含噪声、混响和非线性失真等复杂环境下的语音信号中进行去除和增强。实验结果表明，该方法在语音质量、信噪比等方面具有显著优势。

论文地址：arxiv.53yu.com/abs/2106.07577

基于 F-T-LSTM 复杂网络的联合声学回声消除和语音增强摘要

　　随着对音频通信和在线会议的需求日益增加，在包括噪声、混响和非线性失真在内的复杂声学场景下，确保声学回声消除（AEC）的鲁棒性已成为首要问题。尽管已经有一些传统的方法考虑了非线性失真，但它们对于回声抑制仍然效率低下，并且在存在噪声时性能会有所衰减。在本文中，我们提出了一种使用复杂神经网络的实时 AEC 方法，以更好地建模重要的相位信息和频率时间 LSTM (F-T-LSTM)，它扫描频率和时间轴，以实现更好的时间建模。此外，我们利用修改后的 SI-SNR 作为损失函数，使模型具有更好的回声消除和噪声抑制 (NS) 性能。仅使用 140 万个参数，所提出的方法在平均意见得分 (MOS) 方面优于 AEC challenge 基线 0.27。

关键字：回声消除、复杂网络、非线性失真、噪声抑制；

1 引言

　　回声是在全双工语音通信系统中产生的，由于近端扬声器和麦克风之间的声学耦合，远端用户接收到他/她自己的语音的修改版本。回声消除 (AEC) 旨在消除麦克风信号中的回声，同时最大限度地减少近端说话者语音的失真。

阅读全文

标签：论文翻译 2021 FTLSTM Based Compl