CLIN CHEM LAB MED:使用机器学习模型对样本混淆进行高精度且可解释的检测
2020-03-19 MedSci原创 MedSci原创
数据校验(增量检查)广泛用于混合样品检测。由于混淆的绝对发生率的特异性和稀疏性不足,因此增量检查的正预测值(PPV)相当低,因为要在大量错误警报中识别出真正的混淆错误会很费力。
数据校验(增量检查)广泛用于混合样品检测。由于混淆的绝对发生率的特异性和稀疏性不足,因此增量检查的正预测值(PPV)相当低,因为要在大量错误警报中识别出真正的混淆错误会很费力。为了克服这个问题,我们通过机器学习开发了一种新的精确检测模型。
受delta增量检查检查的启发,研究人员决定与过去的检查进行比较,并拓宽时间范围。从完整的血细胞计数和生化测试中选择15个常见项目。我们考虑了在我院同时进行的15项检查中≥11项检查。 我们创建了滑动窗口大小为4的连续检查的单个局部时间序列数据。对局部时间序列数据的最后一次检查进行了混洗,以生成人为混淆的案例。将数据集分为开发集和验证集后,然后使用梯度启动决策树(gradient-boosting-decision-tree, GBDT)模型来学习,以检测部分时间序列数据的最后检查结果是否是人为混合结果 。在验证集上对模型的性能进行了评估。
本模型的受试者工作特征曲线(ROC AUC)下面积为0.9983 (bootstrap置信区间[bsCI]: 0.9983 - 0.9985)。
研究结果表明,GBDT模型在检测样品混杂方面更有效。准确性提高将使更多机构能够进行更有效和集中的混合检测,从而提高患者的安全性。
原始出处:
本文系梅斯医学(MedSci)原创编译整理,转载需授权!
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
#机器学习模型#
85
#样本#
77
#机器#
68
#Med#
71
梅斯里提供了很多疾病的模型计算公式,赞一个!
67