常见统计资料分析方法的选择
发表时间:2012-12-29 浏览次数:1350次
作者 作者单位
刘方针 黑龙江医药科学编辑部,黑龙江 佳木斯 154003
1 常见统计资料的基本分类
目前对资料的分类大致为两类[1]:即数值变量和分类变量,也就是以往的计量资料和计数资料。也有文献分出第三种资料,即等级资料[2],但我认为,等级资料可以归类于计数资料,因为等级资料的统计分析方法多与计数资料一致。
2 计量资料分析方法的选择
计量资料或称数值变量,为测定每个观察单位指标大小而获得的资料,系定量指标,多有计量单位。如身高(厘米)、体重(公斤)、血压(毫米汞柱)等。这类资料据其分布可大致分为正态资料、偏态资料、成倍数资料。资料分布不同则统计分析方法不同,所以,资料到手后,先分析资料的分布情况,然后选择适宜的统计分析方法。
2.1 成倍数资料统计分析方法的选择
成倍数资料是指资料的观察值相差较大,有的成倍数分布,较简单明了,一看便知。如临床检验的抗体滴度、生物效价等。这类资料可计算其几何均数,如资料是样本与总体比较,可选择样本几何均数与总体几何均数比较的检验方法,如是样本之间比较,可选择样本之间几何均数比较的检验方法。其具体步骤请参考相应工具书。
2.2 正态资料统计分析方法的选择
正态资料一般来说是分布相对均匀的资料,即频数分布以均数为中心,左右侧数据分布基本对称,靠近均数两侧频数较多,离均数愈远频数愈少,形成一个中间数据多、两侧数据逐渐减少、基本对称的分布。符合上述条件的资料,基本可以确定为正态资料,必要时可以对资料进行正态性D检验,以确定资料分布。正态资料多计算均数和标准差。样本与总体、或样本之间的比较,可进行相应的U检验或t检验,两样本或多样本之间比较可进行t检验或方差分析。多变量(多指标)间资料可以进行多元分析。
2.3 偏态资料的统计分析方法的选择
偏态资料不像正态资料那样分布均匀,而是分布不均匀,可能数据集中于小值一侧或大值一侧,即数据分布较离散。偏态资料计算中位数(M),同时给出范围值(最小-最大)。对这类中位数资料可进行中位数间的比较,如样本中位数与总体中位数、样本中位数之间的比较。此类资料亦多用秩和检验(此法简单实用,不考虑资料的分布型),也可用超过数检验(此法精确度差)。
3 计数资料统计分析方法的选择
计数资料亦称定性资料或分类变量,是对观察指标按某种属性或类别分组计数所得的资料,如按年龄、性别、病情、(轻、中、重)、疗效(痊愈、显效、好转、有效)等。此类资料可计算率或构成比,即计算相对数。根据资料的不同,如样本率与总体率的比较、样本率之间的比较,可选择相应的U检验或t检验,亦可选择卡方检验(由于资料不同,具体公式不同,如四格资料、配对资料、多行多列资料,应据具体资料选择相应公式。)、秩和检验、Ridit分析等。其中卡方检验比较常用,且简便快捷。
统计分析方法的种类繁多,初学者在分析方法的选择上常不知所措。本文旨在为初学者在统计资料分析方法的选择上起到相应作用,这些是基本的、也是常用的方法,仅供参考。
【参考文献】
[1]四川医学院主编.卫生统计学[M].北京:人民卫生出版社,1978,13
[2]孙振球.医学统计学[M].北京:人民卫生出版社,2002,2