语音识别在双相障碍中应用的研究进展2023.docx
《语音识别在双相障碍中应用的研究进展2023.docx》由会员分享,可在线阅读,更多相关《语音识别在双相障碍中应用的研究进展2023.docx(9页珍藏版)》请在第一文库网上搜索。
1、语音识别在双相障碍中应用的研究进展2023双相障碍是一种既有躁狂或轻躁狂发作,又有抑郁发作的常见精神疾病。流行病学调查显示我国双相障碍的年患病率为0.5%终生患病率为0.6%。双相障碍具有发病年龄早、自杀率高等特点,是一种严重的社会及公共卫生问题。双相障碍的诊断主要依赖医生的临床经验,了解患者病情的纵向变化。双相障碍早期特征不明显、临床表现复杂,导致该疾病的早期识别率、诊断率较低,因此寻求可靠的标志物作为双相障碍早期识别、诊断与鉴别诊断、评价预后与转归的工具尤为重要。语言可被用来描述情感性疾病的特征,双相障碍患者的语言特点会随着情绪变化而改变。相比于常见的生物标志物,语音信号具有数量大、易获取
2、、非侵入性等特点,语音信号特征可能对双相障碍的早期识别、鉴别诊断、严重程度评估、预后监测有应用价值,成为精神疾病临床评估的客观指标之一。现介绍语音识别技术的基本概念及方法、步骤,并对语音识别在双相障碍领域的研究进展进行综述。一、语音识别技术的基本概念及方法1语音识别的基本概念语音识别是让机器听懂人类语言的技术。其目的是开发出一种具备听觉能力的机器,能够收集人类语音,并通过算法和模型对语音进行识别、分析和解读,转化为文本或计算机指令。2.语音识别技术方法语音识别大致可以分为3个步骤。第1步是语音信号的数字化及预处理。语音信号经过采样、量化、编码过程转化为数字信号后进行预处理,将自然语音转化为可分
3、析的数字信号。其中如何高效地采集语音信号对后续研究至关重要。目前,应用于精神疾病语音识别的语音采集方法可分为两类:一类是结构性语音信息。如阅读中性文字、看图说话,或是半定式访谈,患者回答问题或量表评估时录制患者的反馈,此类方法操作简单、内容清晰,便于医院场景使用,但该类方法形式单一、内容固定,可能无法反映患者的真实情绪变化。另一类是自然状态下的语音采集,包括手机后台录音和主动自我监控。相关研究表明,自然语音数据提取的特征对躁狂及混合发作的分类更加准确,可以更好地反映患者的情绪变化,且自然语音具有易于采集、非侵入性的特点,适用于长时、动态监测。但采集自然语音存在录音设备不同、环境噪音不可控、无效
4、信息量大等问题。第2步是语音特征参数的提取。语音特征可分为韵律特征、声门波特征、音质特征和频谱特征。常用的韵律特征包括基频、能量、时长等。韵律特征被认为是最主要的用于描述情感的语音特征,其多用于描述情感维度的差别,且与情感的效价有关。如能量在效价高的情绪中偏高,在效价低的情绪中偏低。声门波特征主要包括共振峰和元音空间,共振峰代表了声道变化的各种信息,常被用于认知负荷分类和抑郁的识别与评估,第一、第二、第三共振峰(F1、F2、F3)的峰值随情绪波动的变化较为明显。音质特征以呼吸音、喉化音、明亮度等表现形式存在,常见的参数是频率微扰和振幅微扰,其中频率微扰可能反映了影响肌肉张力和发音控制的自主神经
5、系统失调,可用于表征情绪状态。频谱特征体现了声道形状变化与发声运动间的相关性,包括Me1频率倒谱系数(MFCC)、线性预测倒谱系数(1PCCX线性预测系数(1PC)等。其中1PC.1PCC是以模拟发声的声管模型为基础提取的参数,反映了声道响应的特性,MFCC是利用人耳听觉感知特性和语音产生机制得到的参数,通过对不同频段声波的敏感度差异,证明人耳对语音信号的感知与语音频率变化的关系。第3步是语音识别模型的建立与训练。根据不同的需求,选择合适的统计方法进行建模。目前常用的语音识别建模算法主要分为两类:一类是模式匹配方法,常见动态时间规整、隐马尔科夫模型;另一类为基于深度学习的模型,如循环神经网络、
6、卷积神经网络。二、双相障碍的语音识别研究现状目前基于语音信号特征的研究主要集中在抑郁症、精神分裂症,相比于前两者,双相障碍语音特征的研究起步较晚、数量有限。目前语音识别技术在双相障碍中的研究,主要集中在疾病状态识别、辅助疾病诊断、严重程度评估及语音识别模型的构建。1 .疾病状态识别Vane11o等记录6例双相障碍患者(3例抑郁发作、3例轻躁狂发作)处于发病期(抑郁或轻躁狂)及缓解期中的音频信号,发现基频均值、标准差在发病期与缓解期中的差异有统计学意义,提示基频特征的变化可以区分不同的疾病状态。Karam等对6例双相工型障碍患者进行了6个月至1年的追踪研究,通过手机软件收集221h不同情绪状态下
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音 识别 障碍 应用 研究进展 2023
