语音识别技术的发展及应用.docx
《语音识别技术的发展及应用.docx》由会员分享,可在线阅读,更多相关《语音识别技术的发展及应用.docx(8页珍藏版)》请在第一文库网上搜索。
1、语音识别技术的发展及应用于晓明石家庄铁道大学电气与电子工程学院导出/参考文献分享创建引文跟踪收减打印摘要:人类生活中,语言是必不可少的信息传达媒介,作为模式识别技术之一的语音识别技术独有其发展的亮点。文章对语音识别的发展历程进行了总结,从语音识别的原理出发,在端点检测、特征提取等方面介绍了语音识别模型的建构。例举了语音识别技术的应用,探讨了语音识别的技术突破和发展前景。关键词:语音识别;语音信号;预处理;特征提取;作者简介I于晓明(1998-),男,河北保定人,木科,主要研究方向:模式识别。;收稿日期:2019-06-17Deve1opmentandapp1icationofspeechrec
2、ognitiontechno1ogyYuXiaomingSchoo1ofE1ectrica1andE1ectronicEngineering,ShijiazhuangRai1wayUniversityAbstract:1anguageisanindispensab1emediumofinformationtransmissioninhuman1ife.Speechrecognitiontechno1ogy,asoneofthepatternrecognitiontechno1ogies,hasitsownbrightspot.Thispapersummarizesthedeve1opmentp
3、rocessofspeechrecognition,andstartingfromtheprincip1eofspeechrecognition,introducestheconstructionofspeechrecognitionmode1intheaspectsofendpointdetectionandfeatureextractionandsoon.Theapp1icationofspeechrecognitiontechno1ogyisdescribed,andthetechno1ogica1breakthroughsanddeve1opmentprospectsofspeechr
4、ecognitionarediscussed.Keyword:speechrecognition;speechsigna1;preprocessing;featureextraction;Received2019-06-17语言最初是人类所特有的交流工具,但随着科技的不断进步,人类如今不只局限于人与人的交流,并开始逐渐向人与机器的交流方向发展,即通过语言的沟通让机器能像人类一样听懂对方所传达的信息。如今的语音识别技术正是此方向突破的关键,信息领域和自动化领域的专业研究人员不断进行这方面的研究,机器自动的语言识别,使机糊能为人类所用增加人们的生产生活效率,推动人类历史的发展进步。语音识别技术是涉
5、及模式识别、人工智能的多领域研究学科,是人类与机器之间联系的关键。1语音识别的发展历程语音识别技术最初的兴起是在20世纪50年代,此时我国的语音识别技术也开始出现,国外当时只是在贝尔实验室里进行关于识别英文数字的简单发音装置的研究,而后带来了小词汇量和单个词语的识别,在进入20世纪70年代,才有了语音识别实质性的进展,出现了逐渐成为主流的隐式马尔科夫模型技术(HMM),并且从传统的目标匹配方式向基于统计的数学化方向有很大的进展。进入20世纪80年代,语音识别技术继续深入发展,人工神经网络进入模式识别的范畴,出现了利用人工神经网络1,2)进行语音识别问题的处理思路,研究不只是在简单词语数字的识别
6、上,有了连续语音的识别和基于大量词语的识别。我国在此时期执行863计划,语音识别技术的研究与国外同步发展,这是语音识别技术的一个过渡阶段。20世纪90年代之后,语音识别技术逐渐进入饱和阶段,基于语音识别的产品开始进入人们的生产生活,随着时代的不断迁移,基于BP神经网络的优点,大量的语音识别都基于此进行识别系统产品的设计。2语音识别构建模型语音识别技术的过程包括语音信号的预处理、特征提取、模式匹配和判决三个方面。首先由系统接收语音输入,经过信号的预处理和特征提取,得到目标信息的语音数据形成语音信息模式库,再进行输入的语音信号和模式库的模式匹配得到两者信息匹配的结果。(如图1)图1语音识别模型下载
7、原图2.1 语音信号的预处理2.1.1 语音信号预加重在如今十分成熟的A/D转换操作之后,最初获取的语音信号中语音信息被多种噪声影响且高频信号部分不明显,因而要事先对于语音信号进行预加垂,预加重的实现结果是提高目标信号和噪声信号的对比度,便于能很好地对于语音信号进行滤波,目前广泛使用的是一阶滤波器来实现预加重。H(z)=1-zT其中,Z是语音信号,H为预加重后的信号,为一阶滤波器的参数。2.1.2 加窗分帧在预加重处理的信号之后,为得到语音信号的分析频谱,要将语音信号分成多个窗口,这样就把一段持续的语音信号分成多段信号,为了保持每段信号连接的平滑性,在断接点处设置交叠的部分,便于不同分帧之间的
8、平滑移动。对于加窗处理,常使用汉明窗,汉明窗的通频特性好,在信号的分区截取中保证了连续性平滑性,减小了分析频谱的泄露。端点检测在整个语音识别过程中是十分关键的,在一段语音信息中有正常的语音信息,有间断信息,有无声信息,端点检测就是保证将三者能很好地区分出来,排除无声信息等掺杂的信号,选取所需要的正常的语音信息。目前端点检测的研究具有多样化且处于发展的黄金时期,有基于语音信号的时域特性的能量大小、平均过零率、能量变化率等,基于频域特性的频谱变化、谱端的测定。下面主要通过语言信息的谱嫡来进行简要的介绍。首先取某点Xi的概率表示为PXi,则在点Xi的嫡定义为:H(X)=-EPiIOgPii=1令语音
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音 识别 技术 发展 应用