第二章描述性统计命令与输出结果说明

2012-04-17 生物谷生物谷

adminms

北京妇产医院妇幼保健院医生/ 主任医师

本节STATA  命令摘要 by   分组变量：]summarize 变量名1  变量名2  …    变量名m[,detail] ci 变量名1  变量名2  …    变量名m  [, level(#)

本节STATA 命令摘要

by 分组变量：]summarize 变量名1 变量名2 … 变量名m[,detail]

ci 变量名1 变量名2 … 变量名m [, level(#) binomial

poisson exposure(varname) by(分组变量) ]

cii 样本量均数标准差 [, level(#) ]

tab1 变量名 [,generate(变量名)]

· 资料特征描述( 均数，中位数，离散程度)

例：某地测定克山病患者与克山病健康人的血磷测定值如下表( 数据摘自四川医学院主编的卫生统计学,1978 出版， p21)：

患者	2.6	3.24	3.73	3.73	4.32	4.73	5.18	5.58	5.78	6.40	6.53
健康人	1.67	1.98	1.98	2.33	2.34	2.50	3.60	3.73	4.14	4.17	4.57	4.82	5.78

并假定这些数据已以STATA 格式存入 ex2.dta 文件中，其中变量 x1 为患者的血磷测定值数据，变量 x2 为健康人的血磷测定值数据。上述数据也可以用变量 x 表示血磷测定值，分组变量 group=0 表示患者组和 group=1 表示健康组( 如：患者组中第一个数据为 2.6，则 x=2.6，group=0；又如：健康组中第三个数据为 1.98，则 x 为 1.98 以及 group 为 1)，并假定这些数据已以 STATA 格式存入 ex2a.dta 文件中。

计算资料均数，标准差命令 summarize，以述资料为例：

use ex2,clear

summarize x1 x2

结果：

变量样本数均数标准差最小值最大值

Variable | Obs Mean Std. Dev. Min Max

---------+-------------------------------------------------------------------

x1 | 11 4.710909 1.302977 2.6 6.53

x2 | 13 3.354615 1.304368 1.67 5.78

即：本例中急性克山病患者组的样本数为 11，血磷测定值均数为 4.711 (mg%)，相应的标准差为 1.303，最小值为2.6 以及最大值为6.53；健康组的样本量为 13，血磷测定值均数为3.3546，相应的标准差为 1.3044，最小值为1.67 以及最大值为5.78。

计算资料均数，标准差，中位数，低四分位数和高四分位数的命令 summarize 以及子命令 detail，仍以述资料为例：

use ex2,clear

summarize x1 x2,detail

结果：

-------------------------------------------------------------

Percentiles Smallest( 最小值)

1% 2.6 2.6

5% 2.6 3.24

10% 3.24 3.73 Obs 11(样本数)

25% 3.73 (低四分位) 3.73 Sum of Wgt. 11

50% 4.73 (中位数) (最大值) Mean 4.710909(均数)

Largest Std. Dev. 1.302977(标准差)

75% 5.78(高四分位) 5.58

90% 6.4 5.78 Variance 1.697749 (方差)

95% 6.53 6.4 Skewness -.0813446(偏度)

99% 6.53 6.53 Kurtosis 1.809951 (峰度)

-------------------------------------------------------------

④

Percentiles Smallest

1% 1.67 1.67

5% 1.67 1.98

10% 1.98 1.98 Obs 13

25% ① 2.33 2.33 Sum of Wgt. 13

50% ② 3.6 Mean 3.354615

⑤ ⑥

Largest Std. Dev. 1.304368

75% ③ 4.17 4.17

90% 4.82 4.57 ⑥Variance 1.701377

95% 5.78 4. 82 ⑦Skewness .2963943

99% 5.78 5.78 ⑧ Kurtosis 1.875392

由上述结果可知：summarize 命令并使用子命令 detail，不仅可以得到各变量资料的均数和⑥ 标准差，而且可以得到主要的非参数描述指标： ①低四分位 (lower quartile)， ②中位数 (Median) 以及 ③高四分位 (upper quartile)。对于非正态资料，一般不应用均数 ± 标准差进行描述，而应使用中位数以及(低四分位- 高四分位，称 interquartile range, IQR) 进行描述。如：若本资料不正态 [1] ，则 x1 的Median 以及IQR 为: 4.73 (3.73-5.78) 以及 x2 的Median 以及 IQR 为 : 3.6 (2.33-4.17)。⑥ 为样本方差；⑦ 为偏度，偏度的绝对值越小，表明该数据的正态对称性越好； ⑧峰度，峰度值越大表明该数据的正态峰越明显；④ 在该数据中最小的四个数据；⑤在该数据中最大的四个数据。

若调用 ex2a.dta 文件，进行描述性统计，可用下列命令：

use ex2a,clear

sort group ( 将资料以 group 变量为例从小到大排序)

by group:summarize x

结果：

-> group= 0

-------------------------------------------------------------

Percentiles Smallest

1% 2.6 2.6

5% 2.6 3.24

10% 3.24 3.73 Obs 11

25% 3.73 3.73 Sum of Wgt. 11

50% 4.73 Mean 4.710909

Largest Std. Dev. 1.302977

75% 5.78 5.58

90% 6.4 5.78 Variance 1.697749

95% 6.53 6.4 Skewness -.0813446

99% 6.53 6.53 Kurtosis 1.809951

-> group= 1

-------------------------------------------------------------

Percentiles Smallest

1% 1.67 1.67

5% 1.67 1.98

10% 1.98 1.98 Obs 13

25% 2.33 2.33 Sum of Wgt. 13

50% 3.6 Mean 3.354615

Largest Std. Dev. 1.304368

75% 4.17 4.17

90% 4.82 4.57 Variance 1.701377

95% 5.78 4.82 Skewness .2963943

99% 5.78 5.78 Kurtosis 1.875392

上述结果与前面的结果对应相同。

· 根据样本数据计算可信限 [2]

95% 可信限计算：

正态数据：ci 变量名

0-1 数据：ci 变量名, binomial

poisson 分布数据： ci 变量名，poisson

90% 可信限计算( 其它可信限类推)

正态数据：ci 变量名, level(90)

0-1 数据：ci 变量名, level(90) binomial

poisson 分布数据： ci 变量名，level(90) poisson

以 ex2.dta 为例计算 x1,x2 的 95％可信限。

use ex2.dta,clear

① ② ③ ④

Variable | Obs Mean Std. Err. [95% Conf. Interval]

---------+----------------------------------------------------------------------

x1 | 11 4.710909 .3928624 3.835557 5.586261

x2 | 13 3.354615 .3617667 2.566393 4.142837

以上结果中：① 为样本数；② 为均数；③ 为标准误；④ 为 95% 的可信限，因此 x1 的95％可信限为[3.8356,5.5863]，x2 的 95％可信限为[2.5664,4.1428]。

· 根据样本数，样本均数和标准差计算可信限 [3] 。

若数据服从正态

版权声明：
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料，版权均属于梅斯医学所有。非经授权，任何媒体、网站或个人不得转载，授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章，或“梅斯号”自媒体发布的文章，仅系出于传递更多信息之目的，本站仅负责审核内容合规，其内容不代表本站立场，本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系，我们将立即进行删除处理。
在此留言

评论区 (0)

#插入话题

插入图片

下载梅斯医学APP，方便讨论，随时阅读！立即前往下载 >>

内科

外科

专科科室

热点

按科室浏览

临床工具

科研工具

其他工具

科研数智化

真实世界研究解决方案

数字化学术传播解决方案

其它

研究设计与统计

第二章描述性统计命令与输出结果说明

相关资讯

科室

工具

服务

研究设计与统计

第二章 描述性统计命令与输出结果说明

相关资讯

科室

工具

服务

第二章描述性统计命令与输出结果说明