基于Matlab的说话人识别的设计与开发.docx
《基于Matlab的说话人识别的设计与开发.docx》由会员分享,可在线阅读,更多相关《基于Matlab的说话人识别的设计与开发.docx(44页珍藏版)》请在第一文库网上搜索。
1、摘要IAbstractII第一章引言11.1 研究背景及意义11.2 优势及应用前景11.3 国内外研究现状1第二章说话人识别的基本原理32.1 说话人识别基本知识32.1.1 语音的发声机理32.1.2 清音和浊音32.1.3 语音信号模型32.1.4 语音识别基本过程42.2 预处理模块42.2.1 采样42.2.2 量化52.2.3 预加重52.2.4 力口窗52.3 特征提取模块62.3.1 短时平均能量分析62.3.2 短时平均幅度分析72.3.3 短时过零率分析82.3.4 短时自相关分析82.3.5 LPC 倒谱系数(LPCC) 92.3.6 Mel频率倒谱系数(MFCC) 92
2、.4 训练和识别模块102.4.1 矢量量化模型(VQ)102.4.2 隐马尔可夫模型(HMM) 112.4.3 人工神经网络模型(ANN) 122.4.4 HMM和ANN的混合模型13第三章基于Mat lab的说话人识别143.1 说话人识别系统平台介绍143.2 语音采集模板(Speech Recording Plane)143.3 预处理模板(Voice Preprocessing Plane)153.4 特征提取模板(Feature Extraction Plane)173.5 训练识别模板(Speech Recognition Plane)18第四章总结与展望254.1 总结254.
3、2 展望25致谢27参考文献28附录29说话是人类相互沟通交流最方便、最快捷的一种方式,世界上每一个说话人都拥有自己特定的语音,正如每个人的指纹一样,都是绝无仅有的。说话人识别应用广泛,现已应用到通信、消费电子产品等各个领域。本文将把语音进行数字化传输、存储、然后进行识别等。说话人识别系统主要包括预处理、特征提取、训练和识别四个模块。其中预处理和特征提取尤为重要。有许多的预处理方法,对语音信号的采样和量化是第一,然后预加重和加窗。特征提取是指提取语音信号的重要特征的过程。信号的时域分析包括信号的短时平均能量和短时过零率等。频域分析可以采用LPC倒谱系数法和Mel倒谱系数法。为了训练得到模版语音
4、信号,可以利用矢量量化(VQ)、隐马尔可夫模型(HMM)、BP神经网络(ANN)等对说话人的语音信号进行训练识别。说话人识别实现过程中的算法是多种多样的。本文将运用MATLAB仿真工具强大的编程、图形开发功能和数学计算能力。本文将把BP神经网络作为训练识别的方法,利用MFCC(MEL频率倒谱系数)产生的语音信号特征向量,最后运用十字交叉法,建立起一个说话人识别系统。结合MATLAB平台中的GUI设计预处理、特征提取、训练等几个模板,最后利用神经网络的模式识别,真正实现说话人的识别。关键词:语音识别 MATLAB模式识别倒谱系数解放东路课时费老师打款回复了AbstractTalking is a
5、 way of human communication, the most convenient and quickcommunication, each of the speakers all over the world have their own specific speech, aseveryones fingerprints, are unique. Speaker recognition is widely used in various fields,have been applied to communications, consumer electronic product
6、s. This paper will makespeech digital transmission, storage, and then identify etc. The speaker recognition systemincludes preprocessing, feature extraction, training and recognition of four modules. Thepreprocessing and feature extraction is very important. There are many preprocessingmethods of sa
7、mpling and quantization, the speech signal is first, and then the pre emphasisand the window. Feature extraction is the process to extract important features of speechsignal. Signal analysis in time domain signal short-time average energy and short-time zerocrossing rate. Frequency domain analysis c
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 Matlab 说话 识别 设计 开发