四分位极差在血站ELISA 质控的应用研究
发表时间:2014-05-08 浏览次数:595次
在统计学上,Zscore称为标准比值,也称Z分数,或Z比值、Z比分数等,是单个观察值减去总体均值,得到的差值除以总体标准获得的无因次度量。以Z 分数作为离群值判断的方式,其优点是方便开快捷、原理简单易懂,此法比较适合应用在符合正态分数的变量上。目前临床检验质量管理中,Z分数图已经普遍用于质量控制图的绘制[13]。然而,在质控实际检测中,检测值不一定很符合正态分布要求,存在右偏或左偏,此时有些离群值不一定能被Z分数图检出。本文利用四分位极差对参数σ进行估计具有稳健性的特点[4],把它应用到标准比值的计算之中,得到的Z分数称为“稳健Z分数”。
1 材料与方法
1.1 样品 北京康彻斯坦生物技术有限公司生产的弱阳性(0.2IU/mL)HBsAg 质控品(批号:201202001)及常规检测样品。
1.2 仪器与试剂 STAR 全自动加样器、FAME全自动酶免分析仪(瑞士Hamilton公司),两者组合为全自动酶免检测系统。上海科华生物工程股份有限公司HBsAg诊断试剂盒(ELISA),经国家食品药品检定研究院检验报告结论为合格的产品,有效期内使用,严格按照试剂盒说明和实验室规范进行操作。
1.3 方法
1.3.1 数据收集 每批样品使用全自动酶免检测系统ELISA 检测,按照试剂说明书要求平行检测试剂盒内阳性、阴性对照品和弱阳性质控品1次(孔);实验结束后记录质控品的检测值,共收集20例(A 组)。
1.3.2 模拟数据 为了说明方法的优劣,本文从实例数据中衍生模拟出另外3 种情况。情况1(B 组):由原始数据例3的检测值3.30设置为1.35;例7 的检测值2.43 设置为1.43。情况2(C 组):由原始数据例3的检测值3.30设置为2.30;例4的检测值2.17设置为4.17;情况3(D 组):由原始数据例3的检测值3.30设置为2.30;例4的检测值2.17设置为3.67;例16的检测值3.60设置为2.60;例20的检测值2.17设置为1.10。
1.3.3 质控图制作 (1)Z分数图:质控检测值与检测平均值之间的差,除以质控品的标准差,S为质控品标准差。Z分数图的刻度至少从-4到+4,平均数为0,±1、±2、±3 为界限。Z分数小于-3或者大于3,即认定为离群值。(2)稳健Z分数图:质控检测值与其检测值中位数之间的差,除以质控品的标准差,QR 为四分位极差(第3 个四分位数与第1 个四分位数之差),1.349从标准正态分布上、下四分数中导出。Z分数图的刻度至少从4到+4,平均数为0,±1、±2、±3 为界限。Z分数小于3或者大于3,即认定为离群值。1.3.4 离群值检出能力比较 用两种计算方式对实例数据及模拟数据进行Z比值计算,比值在同一质控图上描出,同时使用SPSS18.0统计软件对质控数据进行探索分析,MedCalc11绘制箱须图。1.4 统计学处理 使用SPSS18.0统计学软件进行探索性统计、医学统计软件MedCalc11.4.2.0作箱式图以及Excel2003进行Z分数图绘制。
2 结 果
2.1 收集的原始数据(A 组)及衍生模拟出的数据(B 组、C组、D 组)
2.2 稳健Z分数图与Z分数图的比较 A 组计算获得的20个Z分数绘制成Z分数图,未检出离群值,稳健Z分数图则检出例3、例16 为离群值,见图1;B组:计算获得的20个Z分数绘制成Z分数图,未检出离群值,稳健Z分数图则检出例3、例7、例16 为离群值,见图2;C 组:计算获得的20个Z分数绘制成Z分数图,检出例4为离群值,稳健Z分数图则检出例4、例16 为离群值,见图3;D 组:计算获得的20个Z分数绘制成Z分数图,未检出离群值,稳健Z分数图则检出例4、例20 为离群值,见图4。2.3 探索性统计及箱式图显示 A 组例3为离群值,例16为极值;B组例3、例7离群值,例16为极值;C 组例4、例16为极值;D组例4、例20为极值。见图5:离群值,使用“O”标记,距箱上缘或下缘1.5倍至3倍四分位数间距的值为离群值;极值,超出距箱上缘或下缘3倍四分位数间距的值。
2.4 稳健Z分数图检出的离群值和极值与探索性统计一致。
3 讨 论
四分位极差,即四分位数间距是指第3个四分位数(上四分位数,犙3)与第1个四分位数(下四分位数,犙1)相减而得,记为犙R=犙3-犙1。它表明除去两端各25% 的数据后的极差,是度量数据离散程度的指标,与全距相比,它排除了少数极端数值的影响。正态分布根方差的估计假设总体为正态分布N(μ,σ2),则由于其上、下四分位数分别为ξ0.75=μ+0.6745σ,于是总体四分位极差为QR1 =ξ0.75-ξ0.25=1.349σ;若总体四分位极差QR1 用子样四分位极差QR 替代,则可得到正态分布N(μ,σ2)根方差的估计为=QR/1.349;利用四分位极差的方法对参数σ进行估计的最大优点就是具有稳健性[4]。目前在质量控制图中,。本研究根据上述公式的思路和基于四分位极差对参数σ进行估计具有稳健性的特点,使用四分位极差和中位数对稳健Z分数的计算进行了推导,本研究利用Z分数和稳健Z分数绘制质控图,分别对4组数据进行了作图分析发现:经探索性统计及箱式图确定的,A 组例3为离群值,例16为极值;B 组例3、例7离群值,例16为极值;C 组例4、例16为极值;D 组例4、例20为极值。若使用Z分数分析时,以上异常质控数据中只有C 组例4 数值为4.17被认为“失控”数据,其余均为“在控”数据;若使用稳健Z分数时,则认为这些数据均为“失控”数据,稳健Z分数图的离群值检出能力则与箱须图显示的完全相符。而本研究使用箱须图作为参照,那是因为箱须图的箱子两端分别是上四分位数和下四分位数,中间横线是中位数,两端连线分别是除离群值外的最小值和最大值,另外标记可能的离群值[5],它作为一种统计过程控制工具,箱须图在离群值值检测上对于非正态分布的数据集中趋势相对于平均数更加合理[68]。Z分数图作为LeveyJennings室内质控的一种图形,其建立的理论依据之一就是数据正态性分布特性。然而,ELISA实验受试剂、操作等因素影响,质控实际检测中,检测值不一定很符合正态分布要求,存在右偏或左偏。因此,当资料中存在有离群值时,其标准差的值可能会很大,所以相对地,Z分数就会变小,也就隐含在±3个Z分数范围以内,当然就无法检出离群值了。再者,很少有文献讨论到该方法对样本数的要求,很容易被使用者误用。国外学者Shiffler在1988年就已经指出,对任何一个变量来说,其数据对应的Z 分数可能的最大值为(狀-1)/槡狀,式中狀为样本数[9]。按此计算,当狀=5时,所有Z分数不可能大于1.789,当狀=10 时,所有Z 分数都小于2.846,也就是说当样本数小于10时,不管离群值有多大,Z分数图都无法检测出离群值。而四分位极差包括了居于中间位置50%的数据,未考虑到两侧观察值的变异度,故稳定性相对好[1012],一般和中位数一起描述偏态分布资料。因为稳健Z分数图和箱须图的核心指标构成都是四分位极差和中位数,所以稳健Z分数图在非正态分布的质控数据中,对离群值的检出能力优于应用标准差和均值等指标构成的Z分数图。当然,稳健Z分数图对样本数是否有要求,也是值得思考的。需要说明的是:稳健Z分数是当前实验室能力能力验证对结果进行评价的常用方法,公式表达为Z=(实验室结果中位值)/标准化IQR,标准化IQR = IQR 应用四分位极差和中位数指标构成的稳健Z分数图在非正态分布的质控数据中,对离群值的检出能力优于应用标准差和均值指标构成的Z分数图。
参考文献
[1] 丛玉隆,冯仁丰,陈晓东.临床实验室管理学[M].北京:中国医药科技出版社,2004:140148.
[2] 中华人民共和国卫生部.全国临床检验操作规程[M].南京:东南大学出版社,2006:8485.
[3] 冯仁丰.临床检验质量管理技术基础[M].2版.上海:上海科学技术文献出版社,2007:238240.
[4] 胡宏昌,占天异.正态分布根方差的估计及其应用[J].湖北师范学院学报,2011,31(1):69.
[5] 孙振球.医学统计学[M].3 版.北京:人民卫生出版社,2010:1819.
[6] DavidC.Hoaglin,FrederickMosteller,JohnW.Tukey,等.探索性数据分析[M].北京:中国统计出版社,1998:62101.
[7] 官生平.SPC 统计过程管制[M].厦门:厦门大学出版社,2004:104106.
[8] 谢衷洁.普通统计学[M].北京:北京大学出版社,2004:5561.
[9] Shiffler,R.E.Maximum Zscoreandoutliers[J].TheAmericanStatistician,1988,42(1),7980.
[10]陈平雁.SPSS13.0统计软件应用教程[M].北京:人民卫生出版社,2005:309310.
[11]贺石林.王健.王净净.中医科研设计与统计学[M].长沙:湖南科学技术出版社,2011:7475.
[12]马斌荣.医学统计学[M].4版.北京:人民卫生出版社,2004:147148.
[13]王志国.临床检验质量控制技术[M].2 版.北京:人民卫生出版社,2008:308309.
[14]张志清.实验室Z 比分数统计的辨析[J].中国医疗器械信息,2010,16(1):3941.
[15]中国合格评定国家认可委员会.能力验证结果的统计处理和能力评价指南[S].CNASGL02,2006.
(收稿日期:20130922)