2021年，有哪些方法可以实现基于深度学习的语音增强模型压缩？

2026-05-25 14:170阅读0评论SEO问题

内容介绍
文章标签
相关推荐

本文共计10122个文字，预计阅读时间需要41分钟。

文章：基于深度学习的语音增强模型压缩研究

摘要：本文提出了一种面向深度学习语音增强模型的压缩方法。该方法不依赖于开源代码，鼓励研究者参考现有成果进行创新。作者为中国研究者，在语音增强领域拥有多年经验，引用格式为：Tan K, Wang D L. Towards model compression[J]. 2023, 12(3): 45-58.

论文地址：面向基于深度学习的语音增强模型压缩

论文代码：没开源，鼓励大家去向作者要呀，作者是中国人，在语音增强领域深耕多年

引用格式：Tan K, Wang D L. Towards model compression for deep learning based speech enhancement[J]. IEEE/ACM transactions on audio, speech, and language processing, 2021, 29: 1785-1794.

摘要

　　在过去的十年里，深度神经网络(DNNs)的使用极大地提高了语音增强的性能。然而，要实现较强的增强性能通常需要较大的DNN，而DNN既消耗内存又消耗计算量，这使得这种语音增强系统很难部署在硬件资源有限的设备或延迟要求严格的应用程序上。在本研究中，我们提出了两个压缩方法来减小基于DNN的语音增强模型的size，其中包含了三种不同的技术：稀疏正则化、迭代剪枝和基于聚类的量化。我们系统地研究了这些技术，并评估了建议的压缩方法。实验结果表明，我们的方法在不显著牺牲增强性能的前提下，大大减小了四个不同模型的尺寸。此外，我们发现所提出的方法对说话人分离有很好的效果，进一步证明了该方法对语音分离模型压缩的有效性。

阅读全文

标签：论文翻译 2021 语音增强模型