《基于Matlab的智能语音识别系统.docx》由会员分享,可在线阅读,更多相关《基于Matlab的智能语音识别系统.docx(39页珍藏版)》请在第一文库网上搜索。
1、绪论语音识别研究意义1语音识别研究现状1语音识别发展前景21、识别系统平台介绍32、语音信号分析52.1语音信号产生模型52.2语音信号数字化和预处理62.2.1数字化62.2.2预加重处理72.2.3防混叠滤波72.2.4加窗处理72.3语音信号的时域分析82.3.1短时能量分析82.3.2短时平均过零率102.3.3短时自相关函数和短时平均幅度差函数112.4语音信号的频域分析错误!未定义书签。2. 4.1滤波器组法123. 4.2傅立叶频谱分析123、基于MatIab环境下的语音识别算法分析143.1语音端点检测153. 2特征参数提取153. 2.11PeC倒谱系数错误!未定义书签。5
2、4. 2.2MECC倒谱系数错误!未定义书签。63. 3训练和识别174、基于Mat1ab环境下的语音识别程序分析204.1函数关系204. 2具体代码说明2042.1mfcc204.2.2函数disteu214.2.3函数Vq1bg214.24test224.2.5函数testDB234.2.6函数train244.2.7函mc1fb245、语音识别的实现255.1过程演示25275.2结论分析.结论28回顾28J龙28参考文献29附录:GUI程序代码30致谢37基于MatIab的智能语音识别系统摘要智能语音识别是目前世界上最热门和最具有发展前景的技术之一。以语音识别开发出的产品应用领域非常
3、广泛,几乎深入到社会的每个行业、每个方面,研究智能语音识别,开发相应的产品有着广泛的社会意义和经济意义。本文基于语音信号产生的数学模型,从时域、频域出发对语音信号进行分析,论述了语音识别的基本理论。智能语音识别算法有多种实现方案,本文采取的方法是利用Mat1ab强大的数学运算能力,实现孤立语音信号的识别。本文应用隐马尔科夫模型(HMM)为识别算法,采用MFCC(ME1频率倒谱系数)为主要语音特征参数,建立了一个汉语数字语音识别系统,其中包括语音信号的预处理、特征参数的提取、识别模板的训练、识别匹配算法;同时,提出利用Mat1ab图形用户界面开发环境设计语音识别系统界面,设计简单,使用方便,系统
4、界面友好。经过统计,识别效果明显达到了预期目标。关键词:智能语音识别算法HMM模型MFCCMat1abInte11igentSpeechRecognitionSystemBasedOnMat1abAbstractInte11igentSpeechRecognitioniscurrent1yoneofthemostpopu1arandthemostpromisingtechno1ogyinthewor1d.App1icationfie1dofproductsdeve1opedbySpeechRecognitionisverywide,a1mostintoeveryindustryandevery
5、aspectofsociety.TheresearchingofInte11igentSpeechRrecognitionanddeve1opingcorrespondingproductshasawiderangeofsocia1significanceandeconomicsignificance.Basedonthemathematica1mode1fromthespeechsigna1,thispaperana1yzeaudiosigna1fromthetimedomain,frequencydomainproceeding,anddiscussedthebasictheoryofsp
6、eechrecognitiontechno1ogy.Inte11igentSpeechrecognitiona1gorithmisrea1izedinvariousprograms,thisartic1etakingthemethodistouseMat1abpowerfu1mathematica1operationabi1itytorea1izetherecognitionofspeechsigna1iso1ation.Inthispaper,hiddenMarkovmode1(HMM)recognitiona1gorithmusingMFCC(ME1frequencycepstra1coe
7、fficients)asthemainvoicecharacteristicparameters,theestab1ishmentofaChinesedigita1speechrecognitionsystem,inc1udingthepreprocessingofthespeechsigna1,theextractionofcharacteristicparametersthetrainingoftherecognitiontemp1atejdentifyingmatchinga1gorithm;thesametime,theuseofMat1abgraphica1userinterface
8、deve1opmentenvironmentdesignedspeechrecognitionsysteminterface,isdesignedtobesimp1e,easytouse,friend1yinterface.Besides,tohaveasimp1eexp1orationofthevoicerecognitionisanothertarget.Afterstatistics,recognitionresu1tobvious1yismadeoutastheexpectedgoa1.HMMmode1MFCCKeywords:Inte11igentSpeechrecognitiona
9、1gorithmMat1ab绪论语音识别研究意义作为智能计算机研究的主导方向和人机语音通信的关键技术,语音识别技术一直受到各国科学界的广泛关注。以语音识别开发出的产品应用领域非常广泛,有声控电话交换、语音拨号系统、信息网络查询、家庭服务、宾馆服务、旅行社服务系统、订票系统、声控智能玩具、医疗服务、银行服务、股票查询服务、计算机控制、工业控制、语音通信系统、军事监听、信息检索、应急服务、翻译系统等,几乎深入到社会的每个行业、每个方面,其应用和经济社会效益前景非常广泛。因此语音识别技术既是国际竞争的一项重要技术,也是每一个国家经济发展不可缺少的重要技术支撑。研究语音识别,开发相应的产品有着广泛的社
10、会意义和经济意义。语音识别研究现状语音识别中的说话人辨认的研究始于20世纪30年代。早期的工作主要集中在人耳听辨试验和探讨听音识别的可能性方面。BeI1实验室的1.G.KeSta目视观察语谱图进行识别,提出了“声纹(VoiCePrint)”的概念。BeII实验室的S.Pruzansky提出了模版匹配和概率统计方差分析的声纹识别方法,形成了声纹识别研究的一个高潮。60年代末和70年代初语音识别最重要的发展是语音信号线性预测编码(1PC)技术和动态时间规整(DTW)技术,有效地解决了语音的特征提取和时间不等长匹配问题,对特定人的语音识别十分有效。研究特点是以孤立字语音识别为主,通常把孤立字作为一个
11、整体来建立模板。80年代,语音识别研究的重点之一是连接词语音识别,开发了各种连接词语音识别和关键词识别算法,如多级动态规划语音识别算法。另一个重要发展是语音识别算法从模板匹配技术转向基于统计模型技术。20世纪90年代后,在细化模型的设计、参数提取和优化,以及系统的自适应技术上取得了一些关键进展。语音识别技术进一步成熟,并开始向市场提供产品。由于中国的国际地位不断提高,以及在经济和市场方面所处的重要地位,汉语语音识别也越来越受到重视。IBM、MiCroSoft、1&H等公司相继投入到汉语语音识别系统的开发中,其投资也逐年增加。IBM开发的ViaVoiCe和MieroSOft开发的中文识别引擎代表
12、了当前汉语语音识别的最高水平。台湾的一些大学和研究所也开发出大词汇量非特定人连续语音识别演示系统。日本也先后在语音识别领域大展头角,还有如Phi1ips公司开发的SpeechMedia和SpeechPear1两套软件,涵盖了自然语音识别与理解的对话系统。我国语音识别研究工作近年来发展很快,同时也从实验室逐步走向实用。从1987年开始执行863计划后,国家863智能计算机主题专家组为语音识别研究立项。每两年滚动一次,从1991年开始,专家组每一至二年举行一次全国性的语音识别系统测试。汉语语音识别研究已经走上组织化的道路。目前我国大词汇量连续语音识别系统的研究已经接近国外最高水平叫语音识别发展到一
13、定阶段,世界各国都加快了语音识别引用系统的研究开发,通常连续语音是含有较完整语法信息的连续语句,最接近于人的自然讲话方式,目前在语音识别研究领域非常活跃的课题为稳健语音识别、说话人自适应技术、大词汇量关键词识别算法、语音识别的可信度评测算法、基于类的语言模型和自适应语言模型,以及深层次的自然语音的理解。研究的方向也越来越侧重于口语对话系统。语音识别发展前景语音技术是目前世界上最热门和最具有发展前景的技术之一。从某种意义上说,语音识别是将计算机变成真正的“智能化”设备的最佳途径。语音作为当前通讯系统中最自然的通信媒介,随着计算机和语音处理技术的发展,不同语种之间的语音翻译将成为语音研究的热点。自
14、然语音数据库的设计:语音特征的提取;利用语音料库进行声学模型训练的研究;适应说话人声学模型的研究;语音识别算法的研究:语言翻译和对话处理的研究等成为语音技术的热点方向。语音识别研究的另一个发展方向是人体语言与口语相结合的多媒体人机交互。目前这种采用声觉、视觉两种信息融合进行识别的研究在全球范围内己经展开,成为语音识别研究的重要发展方向和研究热点之一。未来几年里,真正实用的语音识别和音字转换技术将首次走出实验室,走进千家万户的电器设备中。另外,语音识别是一门交叉学科,语音识别技术关系到多学科的研究领域,在不同领域上的进步都会促进语音识别的发展。(1)物理学(声学):声音产生与传播原理、声电转换以
15、及声音在房间回响等相关知识。(2)生理学:有关人的声道与耳朵的生理结构、耳朵的听觉特征,在脑内高层的语言处理等。(3)统计学和模式识别理论;基于各种统计方法对模式进行匹配,以及建立有关的统计模型,对语音特征参数进行估值和分类。(4)信息理论和计算机科学:各种算法的研究、快速搜索查找匹配的方法。(5)语言学:有关人的语言产生、感觉方面的知识。(7)数字信号处理技术:信号的时域分析、噪声消除、数字滤波、线性预测等方面的知识。(8)微电子技术:超大规模集成电路(V1SD技术的发展对语音识别的具体应用有很大的影响,V1SI使语音识别系统商品化成为可能。1、识别系统平台介绍在本系统中,基本上最主要的仪器为话筒、耳机与PC机(另有定音器等发声工具),整个实验平台建立在Mat1ab软件的基础上,使得信号的采集、分析与数据转换完全一体化,并且利用Mat1ab各工具包的强大功能,还可以对数据进行即时的处理反送。由于Mat1ab各个工具包往往采用了业界中最尖端的算法,因此相比与传统的实现方式,该语音识别系统通过MatIab开发图形界面,逼真的演