Baidu
map

回归分析方法大杂谈——Weibull回归

2018-11-15 小白学统计 小白学统计

Weibull回归,有的将其音译为威布尔回归。可能有的人并没有听说过,但是相信大多数人都听说过cox回归。前面也简单说了,在生存分析中,cox回归几乎是一统江湖。然而,这并不是说生存的预后分析中,就只有cox回归了。事实上,很多时候,cox回归未必是最佳选择,或者说,有时其它一些回归也许比cox回归更合适,这里所说的“其它一些回归”就包括Weibull回归。或者也可以说,主要是Weibull回

Weibull回归,有的将其音译为威布尔回归。可能有的人并没有听说过,但是相信大多数人都听说过cox回归。前面也简单说了,在生存分析中,cox回归几乎是一统江湖。然而,这并不是说生存的预后分析中,就只有cox回归了。事实上,很多时候,cox回归未必是最佳选择,或者说,有时其它一些回归也许比cox回归更合适,这里所说的“其它一些回归”就包括Weibull回归。或者也可以说,主要是Weibull回归。

所以,先说应用场景,Weibull回归跟cox回归一样,也是用于生存分析中,可以用于分析生存预后的危险因素,可以建立回归模型,可以根据模型中的自变量预测生存情况。

现实中的一个现象时,很多人在分析生存预后因素的时候,几乎想都不想就选择cox回归。为什么呢?绝对不是因为Weibull回归不如cox回归有效(事实上,很多时候,Weibull回归比cox回归有效)。我个人的看法是,主要还是因为cox回归简单易用,几乎不大用考虑什么前提条件(当然,其实也需要考虑等比例假定条件,这个后面再谈)。但是Weibull回归就不同了,需要考虑一定的前提才能用,简单地说,需要符合Weibull分布。一旦提到分布,对于临床医生来说就头大了,所以肯定就对其敬而远之。所以就选择不用考虑数据分布的cox回归。

当然,可能很多情况下,你用cox回归也没问题,但是,Weibull回归可能会更好。什么意思呢?统计学中往往就是这样,一份数据,你用a方法说不上错,但是如果用b方法可能得到的结果更为可靠。这种情形经常出现。所以,从非统计学专业角度来看,一般人不会去考虑这些差别,只要做到不错就行了。但是,从统计学专业角度来看,我们需要考虑的不仅仅是“不错”,而是要做到“最优”,或者说“相对最优”。就像广告中说的,没有最好,只有更好。统计学家会帮你选择一个“更好”的模型。

那cox回归跟Weibull回归有什么不一样呢?简单来说,Weibull回归属于参数模型,cox回归属于非参数模型(确切地说,是半参数模型)。估计你又着急了,什么参数、非参数。你先别着急扔手机。相信下面这些解释你能看得懂。

所谓参数,就像是一个限制,比如我们说一个图形是三角形,三角形就有三角形的限制,你脑海里一定能想象出三角形是什么样子。这就是参数。因为它有规则,有限制,但是正因为有这些限制,所以我们很清楚它们的样子。

而非参数,你可以认为是没有限制。比如我说我画了一个不规则图形,我让你想象一下这个什么样子。我相信几乎没有人能够想象的出,因为“不规则”这个范围太大了,没有任何限制,你没法想想它的样子,这就是非参数。

任何分布都有一定的参数,可能是一个,也可能是两个,等等。比如正态分布,它的参数是均数和标准差。当你知道了均数和标准差,基本上就可以大致确定正态分布的样子(就像是你知道了一个矩形的长和宽,基本上就可以确定一个矩形的样子)。Weibull分布也一样,也有固定的参数,一个控制形状,一个控制位置(其实大多数的分布都是这样,一个参数决定形状,一个参数决定位置)。当你知道了Weibull分布的形状参数和位置参数,基本上就可以确定Weibull分布的样子。这就叫参数。

所以,对于Weibull回归这样的参数回归,它的优点和缺点同样明显。优点是:如果你发现数据符合weibull分布,那么直接套用weibull回归当然是最理想的选择,可以给出最合理的估计。缺点是:如果数据不符合weibull分布,而你却还用weibull回归,那就套用错误,肯定结果就会有很大偏离。

因此,如果你有能力判断出你的数据是否符合weibull分布,那当然最好就是使用Weibull回归这种参数回归。这时候它的估计结果比cox回归更为可靠,而且可以给出很好的预测效果。

可惜的是,现实中可能不少人并没什么多大的信心去判断数据分布,所以我想这可能也是为什么这么多人用cox回归而不是Weibull回归的原因吧。

cox回归可以看作是非参数的,无论数据服从什么分布都能用,但正因为它什么数据都能用。它的缺点和有点也是并存的,优点是:不用考虑数据的分布,数据是服从指数分布也好,服从Weibull分布也好,都可以用cox回归,而且结果都不会偏离太大。缺点则是:cox回归对每个数据可能都达不到最佳的拟合效果,只能是差不多的样子。

打个比方来说,Weibull回归就像是量体裁衣,把体形看做数据,衣服看做模型,Weibulll回归就是根据你的体形做衣服,做出来的肯定对你正合身,但是对别人就不一定合身了。而且,万一量错了,那就绝对不合身了。而cox回归呢,就像是到商场去买衣服,衣服对大多数人都合适,但是对每个人都达不到最佳的合适,只能说是差不多都能穿上,但始终觉得好像有的地方不合身。

至于到底是选择麻烦的方式量体裁衣,还是图简单到商场直接去买现成的,那就根据你的喜好了,也根据你对自己体形的了解程度,如果非常熟悉,当然就量体裁衣了。如果不大了解,那就直接去商场买大众化衣服吧。

最后补充一下,实际中,除了Weibull回归,其实可用于生存预后的回归还有指数回归、对数正态回归、对数logistic回归等等各种回归方法,这些方法跟Weibull回归一样,对应着各自的分布。符合什么分布,就用什么回归可以达到最佳。

最后强调一下,其实用什么分布、什么方法,并不仅仅是一个学术问题,用的恰当的话,也可以帮你得到更合理的结果,从更实用的角度来说,帮你发文章。如果你查查文献,应该就会发现。

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (2)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=2108280, encodeId=1614210828048, content=实质内容讲的太少了, beContent=null, objectType=article, channel=null, level=null, likeNumber=0, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=36488338869, createdName=ms1000000532033581, createdTime=Sat Dec 31 13:55:56 CST 2022, time=2022-12-31, status=1, ipAttribution=安徽省), GetPortalCommentsPageByObjectIdResponse(id=1671702, encodeId=c65116e1702e3, content=<a href='/topic/show?id=c56c4051902' target=_blank style='color:#2F92EE;'>#回归分析#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=71, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=40519, encryptionId=c56c4051902, topicName=回归分析)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=a46f26833520, createdName=cenghis, createdTime=Sat Sep 21 06:59:00 CST 2019, time=2019-09-21, status=1, ipAttribution=)]
    2022-12-31 ms1000000532033581 来自安徽省

    实质内容讲的太少了

    0

  2. [GetPortalCommentsPageByObjectIdResponse(id=2108280, encodeId=1614210828048, content=实质内容讲的太少了, beContent=null, objectType=article, channel=null, level=null, likeNumber=0, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=36488338869, createdName=ms1000000532033581, createdTime=Sat Dec 31 13:55:56 CST 2022, time=2022-12-31, status=1, ipAttribution=安徽省), GetPortalCommentsPageByObjectIdResponse(id=1671702, encodeId=c65116e1702e3, content=<a href='/topic/show?id=c56c4051902' target=_blank style='color:#2F92EE;'>#回归分析#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=71, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=40519, encryptionId=c56c4051902, topicName=回归分析)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=a46f26833520, createdName=cenghis, createdTime=Sat Sep 21 06:59:00 CST 2019, time=2019-09-21, status=1, ipAttribution=)]

相关资讯

Stroke:卒中患者住院康复治疗后功能恢复得好,活的时间长?

背景和目的:人们对卒中康复治疗(SR)后,对患者功能预后的预测非常感兴趣。SR与患者生存率之间的关系仍不清楚。我们主要是调查SR后与患者功能预后相关的因素,以及患者康复治疗后,功能预后获得大幅度改善与患者长期死亡率是否相关。方法:722名患者在卒中90天内进行SR,这些患者入院FIM分数<80分。应用单变量和多变量线性回归分析,评估基线变量和FIM增益的相关性。应用单变量和多变量Cox分析评

Respir Res:哪种BDR预测严重COPD患者的急性加重风险更准确?

2017年5月,发表在《Respir Res》的一项由韩国科学家进行的logistic回归分析,评估了哪种支气管舒张可逆(BDR)标准可预测严重COPD中严重AE患者。

Bioinformatics:人类流感感染生物学机制研究新进展

近期,在Bioinformatics杂志的一篇文章中提出了一项新的,关于检测人流感感染生物学机制研究的进展。基因集富集分析(GSEAs)被广泛用于基因组的研究,以找出潜在的生物学机制。例如:基因本体论或分子机制。在目前可用的方法中,有以下两点说明:1、通常用于组间比较的回归分析,并不能有效地利用转录组测量的时间序列相关的时间信息;2、在多分子途径中的基因重叠,在假设检验中被多次测量。该作者提出了一

回归分析由浅入深介绍

统计分析中,回归分析(regression analysis)可以说是最为常用的寻找影响因素的分析方法了。本文将回归分析整个家族进行简要概述,使大家有一个基本的概念,在以后的文章中则慢慢地详细道来。 回归这一个词,是由英国遗传学家Galton首先提出的,100多年前,Galton注意到了一个现象:尽管一般来讲,父亲高,子女身高也高,父亲矮,子女身高也矮。但当父亲身高很高时,他的儿子的身高一般不会

Baidu
map
Baidu
map
Baidu
map