高危人群筛选的利器——潜在类别聚类分析
2017-04-28 曹红艳/张岩波 BioMed数据坊
内容提要:机器学习按照训练数据是否有标记信息,可将学习任务分为监督学习(supervised learning)和非监督学习(unsupervised learning)两大类。其中,聚类分析是非监督学习的重要方法,潜在类别聚类分析(latent class cluster analysis,LCCA)可作为非监督学习方法,用于高危人群的筛选。LCCA假定异质性群体由多个总体混合而成,即存在一个潜
内容提要:机器学习按照训练数据是否有标记信息,可将学习任务分为监督学习(supervised learning)和非监督学习(unsupervised learning)两大类。其中,聚类分析是非监督学习的重要方法,潜在类别聚类分析(latent class cluster analysis,LCCA)可作为非监督学习方法,用于高危人群的筛选。LCCA假定异质性群体由多个总体混合而成,即存在一个潜在的分类变量,借助拟合优度评价指标确定最优模型,最后通过估计和比较后验概率进行分类,实现变量水平上的“降维”和个体水平上的“聚类”。LCCA所提取的潜在类别既能反映不同影响因素的综合效应,也能进一步考察不同类别人群分布特征。LCCA分析步骤以出生缺陷为例,依据可能的可观察的非检测影响因素,采用适当的评估方法筛选出高危人群,进而对高危人群做进一步的检测,既可以提高筛查效率,又能降低筛查成本。采用LCCA方法,研究出生缺陷危险特征的潜在类别及其分布特点,分为三个步骤。首先,从出生缺陷调查问卷中提取出生缺陷相关指示变量:母亲生育年龄、遗传因素、母亲既往病史、母亲饮食与叶酸食用情况、母亲孕期患病情况、
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
#高危人群#
37
看过了,谢谢分享。
78
数理统计还有这个功能啊。
54
学习了,非常有用。
74
#筛选#
43
非常棒的内容
0
感谢梅斯医学一直提供这么专业这么有价值的内容
64
学习了,相当有用
26
学习了很好的内容
38