QA验证中LC-MS数据自动化.docx
《QA验证中LC-MS数据自动化.docx》由会员分享,可在线阅读,更多相关《QA验证中LC-MS数据自动化.docx(1页珍藏版)》请在第一文库网上搜索。
1、摘要:AZ公司现有LC-MS平台可自动化处理数据,但只有33.8%的分析可以自动完成,剩余的部分仍需专家自行注释。目前已有700,000已完成分析注释的图谱数据,给用数据挖掘分析这些数据,达到自动化分类目的带来机会。作者最终利用Pipeline Pilot生成了 10棵树的随机森林模型,该模型将需要手动复验的数据降低了36.4%,使得公司每年节省了4万5千美元,并将工作量由之前的每月25000份分析提高到了 45000/月。DS QSAR:定量构效关系研究工具。可以计算接近千种与生物活性或ADME性质相关的描述符,包括分子拓扑描述符、分子指纹在内的一系列基本性质。同时可以调用半经验量子力学程序
2、VAMP计算与电子相关的描述符。还提供了多种统计工具,如Bayesian模型、多元线性回归、偏最小二乘法等,用于对各种复杂数据进行建模和数据挖掘。QA验证中LCMS数据自动化ref: J Lab Autom. 2016 Dec;21 (6):743-755 ; IF=2.632链接:10.1177/2211068215620765.AZ公司现有LC-MS平台可自动化处理数据,但只有33.8%的分析可以自动完成,剩余的部分仍需专家自行注释。目前已有700,000已完成分析注释的图谱数据,给用数据挖掘分析这些数据,达到自动化分类目的带来机会。作者利用现有数据,对数据进行了归一化,加入辅助参数get
3、_closet_peak,生成了多种机器学习模型,涉及决策树、支持向量机、神经网络、随机森林等,最终由Pipeline Pilot生成了 10棵树的随机森林模型表现最佳。该模型将需要手动复验的数据降低了 36.4%,使得公司每年节省了 4万5千美元,并将工作量由之前的每月25000份分析提高到了 45000/月。Table 3. Tree Complexity and Performance Using Different Pruning Methods.1ModelAccuracy (%)PrecisionRecallF-MeasureROC AreaKappaFPRateFN RateH8
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- QA 验证 LC MS 数据 自动化