如何使用基于MFCC和HMM的Matlab源码实现湖南方言语音识别?

2026-06-10 19:3110阅读0评论SEO教程
  • 内容介绍
  • 文章标签
  • 相关推荐

本文共计807个文字,预计阅读时间需要4分钟。

如何使用基于MFCC和HMM的Matlab源码实现湖南方言语音识别?

基于HMM的与文本相关的说话人识别系统的结构如图(1)所示。该系统建立和应用分为两个阶段:即训练(登录)阶段和识别阶段。在训练阶段,针对不同用户定义特定语句或关键词。


1 简介

基于 HMM 的与文本有关的说话人识别系统的结构如图(1)所示。建立和应用这一系统有两个阶段,即训练(登录)阶段和识别阶段。在训练阶段,针对各使用人对规定语句或关键词的发音进行特征分析,提取说话人语音特征矢量(例如倒谱及 D 倒谱等)的时间序列。然后利用从左到右HMM(left-to-right HMM)建立这些时间序列的声学模型。因为文本是固定的,所以特征矢量的时间构造是确定的,利用从左到右 HMM 能较好地反应特征矢量时间构造特性。在识别阶段,先和训练阶段一样,从输入语音信号中提取特征矢量的时间序列,然后利用 HMM 计算该输入序列的生成概率,并且根据一定的相似性准则来判定识别结果。对于说话人辨认系统,所得概率值最大的参考模型所对应的使用者被辨认为是发音的说话人。对于说话人确认系统,则把所得概率值与阈值相比较,其值大于(或等于)阈值的,作为本人的声音被接受,小于阈值的作为他人的声音被拒绝。在与文本有关的说话人识别当中,由于文本内容是已知的,所以即使利用比较短的语料,也能从中提取出较稳定的说话人特征。而且学习也不需要太多的数据。在实际利用电话语音的说话人识别实验中得到了较高的识别精度。另外,对于不同的说话人,变换文本内容并利用文本内容的差别,也可以进一步提高识别精度。

阅读全文

本文共计807个文字,预计阅读时间需要4分钟。

如何使用基于MFCC和HMM的Matlab源码实现湖南方言语音识别?

基于HMM的与文本相关的说话人识别系统的结构如图(1)所示。该系统建立和应用分为两个阶段:即训练(登录)阶段和识别阶段。在训练阶段,针对不同用户定义特定语句或关键词。


1 简介

基于 HMM 的与文本有关的说话人识别系统的结构如图(1)所示。建立和应用这一系统有两个阶段,即训练(登录)阶段和识别阶段。在训练阶段,针对各使用人对规定语句或关键词的发音进行特征分析,提取说话人语音特征矢量(例如倒谱及 D 倒谱等)的时间序列。然后利用从左到右HMM(left-to-right HMM)建立这些时间序列的声学模型。因为文本是固定的,所以特征矢量的时间构造是确定的,利用从左到右 HMM 能较好地反应特征矢量时间构造特性。在识别阶段,先和训练阶段一样,从输入语音信号中提取特征矢量的时间序列,然后利用 HMM 计算该输入序列的生成概率,并且根据一定的相似性准则来判定识别结果。对于说话人辨认系统,所得概率值最大的参考模型所对应的使用者被辨认为是发音的说话人。对于说话人确认系统,则把所得概率值与阈值相比较,其值大于(或等于)阈值的,作为本人的声音被接受,小于阈值的作为他人的声音被拒绝。在与文本有关的说话人识别当中,由于文本内容是已知的,所以即使利用比较短的语料,也能从中提取出较稳定的说话人特征。而且学习也不需要太多的数据。在实际利用电话语音的说话人识别实验中得到了较高的识别精度。另外,对于不同的说话人,变换文本内容并利用文本内容的差别,也可以进一步提高识别精度。

阅读全文