基于MFCC特征的智能门禁系统,Matlab源码支持的语音识别技术如何实现?
- 内容介绍
- 文章标签
- 相关推荐
本文共计1008个文字,预计阅读时间需要5分钟。
1. 简介本文基于Matlab设计实现了一个文本相关的声纹识别系统,可用于判断说话人身份。
1. 系统原理a. 声纹识别随着人工智能技术的不断发展,越来越多的手机App推出了声纹锁功能。
1 简介
本文基于Matlab设计实现了一个文本相关的声纹识别系统,可以判定说话人身份。
1系统原理
a.声纹识别
这两年随着人工智能的发展,不少手机App都推出了声纹锁的功能。这里面所采用的主要就是声纹识别相关的技术。声纹识别又叫说话人识别,它和语音识别存在一点差别。
b.梅尔频率倒谱系数(MFCC)
梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient, MFCC)是语音信号处理中最常用的语音信号特征之一。
实验观测发现人耳就像一个滤波器组一样,它只关注频谱上某些特定的频率。人耳的声音频率感知范围在频谱上的不遵循线性关系,而是在Mel频域上遵循近似线性关系。
梅尔频率倒谱系数考虑到了人类的听觉特征,先将线性频谱映射到基于听觉感知的Mel非线性频谱中,然后转换到倒谱上。普通频率转换到梅尔频率的关系式为:
编辑
c.矢量量化(VectorQuantization)
本系统利用矢量量化对提取的语音MFCC特征进行压缩。
本文共计1008个文字,预计阅读时间需要5分钟。
1. 简介本文基于Matlab设计实现了一个文本相关的声纹识别系统,可用于判断说话人身份。
1. 系统原理a. 声纹识别随着人工智能技术的不断发展,越来越多的手机App推出了声纹锁功能。
1 简介
本文基于Matlab设计实现了一个文本相关的声纹识别系统,可以判定说话人身份。
1系统原理
a.声纹识别
这两年随着人工智能的发展,不少手机App都推出了声纹锁的功能。这里面所采用的主要就是声纹识别相关的技术。声纹识别又叫说话人识别,它和语音识别存在一点差别。
b.梅尔频率倒谱系数(MFCC)
梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient, MFCC)是语音信号处理中最常用的语音信号特征之一。
实验观测发现人耳就像一个滤波器组一样,它只关注频谱上某些特定的频率。人耳的声音频率感知范围在频谱上的不遵循线性关系,而是在Mel频域上遵循近似线性关系。
梅尔频率倒谱系数考虑到了人类的听觉特征,先将线性频谱映射到基于听觉感知的Mel非线性频谱中,然后转换到倒谱上。普通频率转换到梅尔频率的关系式为:
编辑
c.矢量量化(VectorQuantization)
本系统利用矢量量化对提取的语音MFCC特征进行压缩。

