高质量呼吸音数据库建设及管理规范专家共识(完整版).docx
《高质量呼吸音数据库建设及管理规范专家共识(完整版).docx》由会员分享,可在线阅读,更多相关《高质量呼吸音数据库建设及管理规范专家共识(完整版).docx(8页珍藏版)》请在第一文库网上搜索。
1、高质量呼吸音数据库建设及管理规范专家共识(完整版)摘要人工智能(artificia1inte11igence,AD进入新的发展阶段,在医疗领域,应用AI诊疗新模式和新手段建立快速精准的智能医疗体系是智慧医疗的重要发展目标。建立标准呼吸音数据库是基于医疗大数据的呼吸系统疾病辅助诊疗和家庭慢性肺部疾病管理系统研发和应用的基础。为了能规范建立高质量的呼吸音数据库,提高呼吸音A1研究的效率,促进A1大数据呼吸音研究的发展,本共识就呼吸音数据库建设,对呼吸音采集设备、采集流程、数据标准、质控要点、数据库架构和数据安全等内容进行推荐,为进一步开发A1算法研究奠定基础。关键词呼吸音;数据库;高质量;人工智能
2、肺部听诊是利用听诊器对气流通过气管支气管树产生的声音进行判断的方法,也是呼吸系统疾病筛查、诊断、评估和随访的重要工具,迄今仍无可替代。在获取临床症状的基础上增加肺部听诊可以提高诊断的敏感性1-2和准确性。传统听诊器的雏形是法国医师雷奈克(Rene1aenneC)在1861年发明的。传统听诊器使用简单便捷,易于获取,医疗成本低,不依赖大型设备,无辐射,无痛苦,短时间内可以反复听诊。但传统听诊器也存在一些缺陷,包括呼吸音信息无法记录和保存,分享和交流困难,无法进行呼吸音持续监测,且呼吸音判别结果需依赖医师的临床经验和听觉感知能力,具有一定的主观性3-4。传统听诊器存在的短板问题严重阻碍了呼吸系统疾
3、病管理和监测的效能。利用电子听诊器(digita1stethoscope,DS)采集呼吸音,同时使用人工智能(artificia1inte11igence,AI)技术进行自动分析是克服这些局限性的优化方式5-7o近年来A1技术的发展日新月异,基于医疗大数据的A1辅助决策技术已经成为迅速提高诊疗水平和拓展医疗资源的重要手段。数据、算法、算力和场景是构成A1的四要素,其中在医疗场景的A1研究中,主要依靠临床专业人员提供高质量的“数据”。AI通过机器学习和神经网络模型,对大量完成呼吸音标注的声音数据进行快速学习,最终实现呼吸音的自动分析。呼吸音的自动识别和分类主要分为2步:(1)呼吸音数据的特征提取
4、;(2)利用提取的特征进行呼吸音的识别和分类8oAI在呼吸音领域的发展过程中,面临的主要问题是缺少可以用于研究算法并对不同算法进行比较的公共高质量大型呼吸音数据库,也是AI在呼吸音领域发展面临的主要困境。上海市医学会儿科分会呼吸学组、福建省医学会儿科分会呼吸学组和江苏省医学会儿科分会呼吸学组的儿科专家在分析国内外现有的呼吸音数据库的基础上,结合本领域的工作成果,共同制定高质量呼吸音数据库建设及管理规范专家共识,规范呼吸音采集设备、采集流程、数据标准、质控要点、数据库架构和数据安全,进而为儿童常见呼吸系统疾病,特别是下呼吸道感染、支气管哮喘为代表的标准化、规范化诊疗提供新的方法。1、呼吸音数据库
5、的现状和局限性呼吸音数据库作为重要诊疗信息的一部分,近年来有了快速发展。尤其是部分数据呈现开源共享模式,有利于不同数据的比对分析,制定统一标准,形成高质量数据库。在2017年之前,共有13个开放的公共呼吸音数据库8在临床研究中使用,其中4个是在线存储,9个是书籍附带的光盘资源,使用最广泛的是R.A.1.E.在线数据库(http:/www.ra1e,ca)和Understanding1ungSoUndS(第3版)”附带光盘内的呼吸音数据库,前者共有50余条儿童呼吸音数据和相关临床资料,每条时长10s;后者光盘内呼吸音数据总时长为60mino但这些呼吸音数据库的数量和种类比较有限,最初建立的目的是
6、进行教学培训,因此绝大部分是理想状态的呼吸音,并不适合用于真实环境中呼吸音数据算法模型的建立。葡萄牙和希腊的研究团队在2017年共同构建的呼吸音数据库(Internationa1ConferenceonBiomedica1andHea1thInformatics2017,ICBHI2017)9,共纳入126例患者的920条呼吸音,其中儿童49例,每条呼吸音平均长度21.5s,获取6898个呼吸周期,1898个哮鸣音片段和8877个湿啰音片段。目前,在ICBH12017开放的公共数据库(https:/bhicha11enge.med.auth.gr)平台上,共有1864个湿啰音片段,886个哮鸣
7、音片段和506个同时包含湿啰音和哮鸣音的片段。ICBH12017已经成功进行了多种呼吸音A1算法模型的研究10-14,但该数据库也存在局限性,主要包括缺乏健康对照组,且均为单人标注数据,不符合“金标准”的标注要求,最终会影响数据库的质量。2023年,中国台湾建立了目前为止最大的呼吸音数据库HF_1ung_V1(数量共279例,年龄均大于20岁,来自台湾地区,呼吸音数据共9765条,每条呼吸音时长15s,共包含湿啰音片段15606个,哮鸣音片段8457个和喘鸣音片段686个。但HF_1ung_V1数据库同样存在局限性,缺乏健康对照组,其中261例患者的临床信息丢失,呼吸音数据均为单人标注。根据公
8、共呼吸音数据库的现状,现有的呼吸音数据库存在健康对照组缺乏;不同DS采集跨信道失配;数据库病例数量少,儿童呼吸音数据数量有限;呼吸音数据多为单人标注,缺乏质控,不符合“金标准”要求,精准度和可信度等明显不足,造成现有的呼吸音数据库在质和量方面均有明显缺陷,制约了AI在呼吸音领域的发展进程15-16,建立高质量的呼吸音数据库迫在眉睫,也是A1技术在本领域发展的基础。2、呼吸音数据库入库数据类型要求呼吸音AI研究主要在于呼吸音的识别和分类。呼吸音是胸部体格检查的重要体征,可以快速、准确、客观的反映疾病状态和病情变化,为临床诊治提供重要的依据。呼吸音数据是呼吸音数据库的主体部分,需力求信息完整、标注
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 质量 呼吸 数据库 建设 管理 规范 专家 共识 完整版
