实验报告_基于GMM-HMM的语音识别.docx
《实验报告_基于GMM-HMM的语音识别.docx》由会员分享,可在线阅读,更多相关《实验报告_基于GMM-HMM的语音识别.docx(13页珍藏版)》请在第一文库网上搜索。
1、*必3才乡苧多媒体技术实验报告基于GMM-HMM的语音识别姓名:学号:2015年5月24日目录基于GMM-HMM的语音识别1一、 马尔科夫初步概念理解3(一)两个重要的图3(二)问题:马尔科夫的开始状态如何确定?4二、 马尔科夫的三种问题,以及解法4(一)解码,4解法一:最大似然路径4解法二:Viterbia1gorithm4(-)已知A,B,根据骰子掷出的结果,求出掷出这个结果的概率(模型检验)6解法一:穷举6解法二:前向算法6(三)知道骰子状态有几种,不知道A,知道B,观察到很多次投骰子的结果(可见状态链),我想反推出A。6三、 HMM算法使用条件6(一)隐性状态的转移必须满足马尔可夫性6
2、(二)隐性状态必须能够大概被估计。6四、 EM算法GMM(高斯混合模型)o7(一)单高斯分布模型GSM8(三)样本分类已知情况下的GMM9(四)样本分类未知情况下的GMM9五、 HMM-GMM模型在语音识别中的应用11(-)语言识别的过程11(二)其中HMM与GMM的作用12六、实验结果12(一)代码阅读以及注释12(二)实验结果对比12(三)与DTW结果对比13(四)实验感想与收获错误!未定义书签。(五)困难与改进错误!未定义书签。一、马尔科夫初步概念理解(一)两个重要的图HMM(HiddenMarkovMode1),也称隐性马尔可夫模型,是一个廨模型,用来描述一个系统隐性状态的转移和隐性状
3、态的港暇率.系统的隐性状态指的就是一些外界不便观察(或观察不到)的状态.比如在当前的例子里面,系统的状态指的是大叔使用骰子的状态,即正常骰子,作弊骰子1作弊骰子2,隐性状态的表现也就是.可以观察到的,由隐性状态产生的外在表现特点。这里就是说,骰子掷出的点数.(1,2,3,4,5.6HMM模型将会描述,系统隐性状态的转移概率.也就是大叔切换骰子的摄率.下图是一个例子,这时候大叔切换骰子的可能性被描述得淋漓尽致.隐性状态转移概率(大叔切换般子的概率)0.150.450.4A=0.250.350.40.100.550.35当然同时也会有,隐性状态表现转移概率.也就是骰子K现各点的概率分布,(eg作弊
4、能子1爰有90%的机每倒六,作弊骰子2有85%的机例到小)给个图如下,隐性状态表现概率(般子点数分布概率)隐性状态的表现分布器率也可以用矩阵表示出来,0.160.160.160.1G0.160.16B=0.020.020.020.020.020.900.40.200.250.050.050.05把这两个东西启礴来,就是整个HMM模型.(二)问题:马尔科夫的开始状态如何确定?二、马尔科夫的三种问题,以及解法(一)解码,已知A,B(隐含状态的数量以及转换概率以及B),根据掷骰子掷出的结果(可见状态链),想知道每次掷出来的都是哪种骰子(隐含状态链)解法一:最大似然路径基本思想:求一串骰子序列,这串骰
5、子序列产生观测结果的概率最大算法:穷举解法二:Viterbia1gorithm,求出每次掷出的骰子分别是某种骰子的概率基本思想:首先,如果我们只掷一次骰子:看到结果为1.对应的最大概率骰子序列就是D4,因为D4产生1的概率是1/4,高于1/6和1/&把这个情况拓展,我们掷两次骰子:结果为1,6.这时问题变得复杂起来,我们要计算三个值,分别是第二个骰子是D6,D4,D8的最大概率.显然,要取到最大概率,第一个骰子必须为D4.这时,第二个骰子取到D6的最大概率是P2(D6)=P(D4)*P(D41)*P(D406)*P(D66)I111*3436同样的,我们可以计算第二个骰子是D4或D8时的最大龌
6、.我们发现,第二个骰子取到D6的概率最大.而使这个概率最大时,第一个般子为D4.所以最大概率骰子序列就是D4D6.继续拓展,我们掷三次骰子:IOOO同样,我们计算第三个骰子分别是D6,D4,D8的最大概率C我“福次发现,要取到最大概率,第二个骰子必须为D6.这时,第三个骰子取到D4的最大幅是P3(04)=P2(D6)P(D6D4)P(D43)111*21634同上,我们可以计算第三个骰子是D6或D8时的最大概率.我们发现,第三个骰子取到D4的概率最大.而使这个概率最大时,第二个骰子为D6,第一个骰子为D4.所以最大概率箴子序列就是D4D6D4.算法:类似于动态规划;:(二)已知A,B,根据骰子
7、掷出的结果,求出掷出这个结果的概率(模型检验)解法一:穷举思想:穷举所有骰子序列O,计算每个骰子序列对应的概率,然后把这些概率相加算法:呵呵解法二:前向算法基本思想:结果递推,有点像动态规划,就是一步一步往后算,通过前向算法,算出概率加和,其中要用到A和B看到结果为1,6,3.产生这个结果的总概率可以按照如下计算,总概率为0.03:P1P2P3D611一今一36P1(D6)P1(D4);P1(D8)z3Q3o3DP2(D6)P2(D4).P2(D8).763636D411*一34P1(M)0P1(M)0P1(D)0P2(D6)g二+PZ(ZM)二:P2(D8)743434D81138P1(D6
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 实验 报告 基于 GMM HMM 语音 识别