利用三种方法计算眼屈光度的遗传度
发表时间:2012-01-16 浏览次数:593次
作者:秦雪娇 作者单位:山东大学齐鲁医院眼科, 济南 250012
【摘要】目的 将屈光度作为一连续性计量型变量,计算其遗传度。方法 以一个爱尔兰大家系为随机样本,分别用均父母-子代回归系数法、单亲-子代回归系数法及序贯性寡基因连锁分析系统(SOLAR)3种方法,以屈光度的原始测量值及行正态转换后的数值来计算屈光度的遗传度。结果 15对完整的双亲-子代数据用于均父母-子代回归法分析,以屈光度的测量数据和正态转换数据算得的遗传度分别为0.56和0.60(标准误分别为0.16和0.17);24对完整的单亲-子代数据用于单亲-子代回归法,以屈光度的测量数据和正态转换数据算得的遗传度分别为0.14和0.28(标准误分别为0.11和0.17);137例有效数据用于SOLAR分析,以屈光度的测量数据和正态转换数据算得的遗传度分别为0.52和0.57(标准误分别为0.16和0.16),年龄作为共变量作用无统计学意义。结论 以屈光度作为连续性计量资料分析得到的研究样本的遗传度在0.5~0.6左右,说明遗传因素在屈光系统的形成中起着一半以上的作用。均父母-子代回归法和序贯性寡基因连锁分析系统法对屈光度的遗传度的计算较单亲-子代回归法可靠。
【关键词】 遗传度 屈光不正 屈光 眼 回归分析 序列分析
three different methods
QIN Xuejiao, CHEN Hongmei, LI Jinghai
(Department of Ophthalmology, Qilu Hospital of Shandong University, Jinan 250012, China)
To calculate the heritability of the refractive error serves as a continuous quantitative variable. Method A large Irish family was used as a random sample. Heritability was calculated by midparentoffspring regression, parentoffspring regression and sequential oligogene linkage analysis routine (SOLAR) methods. The original refractive data and the data obtained after normalitytransformation were separately calculated. Result In total we got 15 pairs numbers for midparentoffspring regression, 23 pairs for parentoffspring regression, and 137 numbers for SOLAR calculation. Heritabilities in the original refractive data and transformed data from the three methods were as follows: 0.56 and 0.60 for midparentoffspring regression (Standard Error: 0.16 and 0.23), 0.14 and 0.28 for parentoffspring regression (Standard Error: 0.11 and 0.17), and 0.51 and 0.57 for SOLAR (Standard Error: 0.16 and 0.16). Age served as a covariate which had no significant result. Conclusion The heritability of the refractive error in our sample was 0.50.6, which means that genetic factors accounted for about half of the efficiency for refractive error. We think that heritability calculated by midparentoffspring regression and SOLAR is more reliable than that calculated by parentoffspring regression.
Key words: Heritability; Refractive errors; Refraction ocular; Regresson analysis; Sequence analysis 遗传度是指疾病的发生中遗传因素作用的大小[1]。对于双变量因素(如定性分析),往往用相对危险率(relative risk,RR)来表示遗传作用的大小,故又称遗传性。对于一个遗传学研究样本来说,较高 的遗传度是进行基因连锁分析的有利基础。研究一个变量的遗传度,关键是需要搜集能代表特定地区或人群的随机病例进行分析。对于复杂性变量,得到一个精确的遗传度往往很难,而且标准误会很大。眼的屈光度代表了屈光系统的状态,根据屈光度大小的不同,可以将屈光状态分为远视、正视和近视,以及低、中、高等不同程度。屈光系统的发育是受环境和遗传等多种因素控制的复杂性变量,屈光度,包括近视、远视,甚至正视,是在多种基因及环境因素作用下的量变性指标,要得到较为准确的屈光度的遗传度,首先应树立一种多基因遗传模式的概念,再就是应将屈光度作为一种连续性计量型变量来分析。目前,随着遗传流行病学的发展,各种日趋完善的统计方法使本研究有可能对屈光度的遗传特性有更为准确和全面的了解。本研究利用搜集到的一个大家系,以连续性计量分析方法,分析屈光度作为一种多基因变量的遗传度。
1 资料与方法
1.1 研究对象 一个大的爱尔兰家系,主要居住于英国爱尔兰中部地区,大多数以畜牧业为生,生活环境相似,可以看作此地区有代表性的一个相对独立的人群。家系跨越7代,目前生存的有4代192人,加上其他亲缘关系共有293人。3~87岁,平均(32.3±17.8)岁。所有的参与者均排除圆锥角膜、青光眼、先天性视网膜病变等其他眼部病变。所有的家系成员不论屈光度数据是否齐全,均编入家系文件。
1.2 研究方法
1.2.1 病例采集 本研究以邮寄问卷的方式征集此家系成员,问卷的内容主要包括:① 参与者的个人信息:包括性别、出生日期、种族、联系方式、最初戴镜年龄;② 参与者的屈光状况:验光师及其联系地址;③ 参与者的健康状况;④ 参与者的家系信息;⑤ 其他家系人员及联系方式;⑥知情同意书。
1.2.2 参与者屈光度的获得 在得到问卷的答复后,本研究再与参与者的验光师联系(往往同时附上参与者签署的知情同意书复印件),由其提供参与者的散瞳验光处方。
为保持数据的一致性,所有的屈光度数都取最小负径向值(least minus meridian, LMM),即将验光值中的散光度数转换为负值后的球径值。比如,对于配镜处方:-3.00?D/+0.50?D*180°,转换为LMM的形式后为:-2.50?D/-0.50?D*90°,其中-2.50?D即为最小负径向值。本研究随机采用每个参与者右眼的最小负径向屈光度值作分析。
人群中原始的屈光度数据并非为正态分布,而是正视区域频率较高,形成一尖峰,同时负向侧的分支较延长。由于某些特定的统计软件往往对人群中变量的分布有一定要求,主要是正态分布要求,因此这类数据用于统计分析时,作为计量型变量时应将其作正态转换,否则只有视作定性型变量(如近视和非近视,或高度近视和非高度近视)[2]。John和Draper曾针对数据呈非正态分布类型的计量型变量[3],推出一种正态转换方法,将原始的测量数据进行转换后,使其分布更接近于正态形状,以便适用于更广泛的研究。其公式为:符号(正/负)*{((|y|+1)λ-1)/[AKY¨〗},其中y为变量的原始测量数据,[AKY¨〗为(|y|+1)的几何均数,λ针对不同的研究对象有不同的系数值。本研究通过分析一代表随机人群中屈光度分布状况的数据库资料,认为针对屈光度的λ值约为0.415,[AKY¨〗值约为1.225,近视者符号为负,远视者符号为正。在这里本研究以此进行屈光度的正态转换。
1.2.3 遗传度的计算
1.2.3.1 均父母-子代回归系数法 此方法用于父母的变量资料齐全的家系。Falconer等[4]分析得出,对于计量型变量,如屈光度、身高、血糖值等,可以将研究对象中不同家庭中的子代的变量取平均值组成一新的变量数据,如y,本研究称新变量为子代均值,将相应家庭的父母的变量取平均值组成另一新的变量数据,如x,本研究称此变量为父母均值。对x变量和y变量的对应数据作回归分析,那么遗传度等于回归系数。即,若回归公式为:Y(子代均值)=b*X(父母均值)+c,其中Y为每个家庭子代的变量均值,X为每个家庭父、母亲变量的均值,b为回归系数(即斜度),c为X为0时的Y值(即回归线与Y轴的相交点),那么遗传度为:h2=b。在本研究的家系中,父母子代屈光度数据均齐全的家庭有15个,组成15对数据用于回归分析。
1.2.3.2 单亲-子代回归系数法 对于有些疾病变量,有时不容易得到父母双方的数据(比如发病较晚者),或者父母的某一方未参与研究(比如离异或患有其他相关疾病),可以利用单亲的数据与子代进行回归分析,由于单亲只在遗传中起一半的作用,故实际的遗传度应该为双倍。即,若回归公式为:Y(子代均值)=b*X(单亲数值)+c, 与上种方法类似,其中Y为子代的变量均值,X为父/母亲变量值,b为回归系数,即斜度,c为X为0时的Y值,即回归线与Y轴的相交点,那么遗传度为h2=2*b。由于此方法中丢失了一方亲代的信息,结果不如均父母-子代回归系数法的结果可靠。在本研究的家系中,获得父母一方及子代的屈光度数据的家庭有23个,组成23对数据用于回归分析。
1.2.3.3 SOLAR遗传统计分析法 序贯性寡基因连锁分析程序(sequential oligogenic linkage analysis routines, SOLAR)[5],是针对参数型样本(定量分析)设计的计量统计分析软件,尤其适用于大家系资料及多基因分析。若用于非参数型资料(定性分析),可以用2个数值代表变量类型。在计算遗传度时,SOLAR采用的原理是方差成份分析法[69], 它将总的表现型方差(即本研究要研究的变量的测量值)归为由各种已知的共变量引起的加性方差、环境作用方差,以及其余的多基因加性遗传方差(即本研究要验证的遗传性作用因素)。然后将各种因素一起构成一种复合作用模式,采用最大可能性法,估计共变量方差和加性遗传方差的相对作用比例。结果中,去除环境方差及共变量方差的作用因素而得出的剩余遗传度,即是多基因变量的遗传度。
SOLAR在分析多基因疾病时非常有优势,可以将性别、年龄等参数作为共变量一同分析,并可以得出去除共变量因素后的遗传度(因此称为剩余遗传度,代表了研究变量的遗传度)。当SOLAR用于分析结构复杂的大家系时,它可以同时利用家系中各成员(包括未患病者)的表型共方差来估计研究变量中加性基因方差与各种共变量方差的相对比例,等于?进行了数据延伸,因而对样本的利用也更为全面。
在这里,家系成员的表现型的可能性分布被假设为一种多变量正态分布,但即便这种分布假设不成立对结论也不会有实质性的影响[10]。当所有家系的表现型方差模式都建立以后,SOLAR利用FISHER和SEARCH计算机程序,比较当一个模式的遗传度为h2时的可能性与一个模式的遗传度为0时的可能性的比值,从中得到本研究想要的遗传度值。
在本研究的家系中,SOLAR利用到230例家系文件中的成员(至少与一位其他成员有关系),跨越四代,男113人,女117人。SOLAR进行遗传度分析时,用到的有效数据为137例。
1.3 统计学处理 采用Statistica统计软件(第6版本)。采用多变量回归法进行回归系数的计算。P<0.05为有统计学意义。SOLAR版本为1.7.3。
2 结 果
由问卷调查得到的142例屈光信息中,屈光度的中位数为0.375?D(10%和90%界值分别为-3.75?D和0.00?D)。用3种方法测得屈光度的遗传度。
2.1 均父母-子代回归系数法 共搜集到15对完整的均父母-子代数据。本研究以原始的屈光度作均父母-子代回归分析时,回归公式为:Y(子代均值)=0.56*X(父母均值)-0.72,得到的遗传度为h2=b=0.56,标准误为0.16;对屈光度进行正态转换后,回归公式为:^Y(子代转换值均值)=0.60*^X(父母转换值均值)-0.16,得到的遗传度为h2=b=0.60,标准误为0.17。
均父母-子代回归法计算的遗传度h2=0.56(原始数据)
Fig.1 Heritability calculated by midparentoffspring method h2=0.56(original data)
均父母-子代回归法计算的遗传度h2=0.60(正态转换数据)
Fig.2 Heritability calculated by midparentoffspring method h2=0.60( normalitytransformation)
2.2 单亲-子代回归系数法 共搜集到24对完整的单亲-子代数据。以原始的屈光度作单亲-子代回归分析时,回归公式为:Y(子代均值)=0.07*X(单亲数值)-2.40,得到的遗传度为h2=2*b=0.14,标准误0.11;对屈光度进行正态转换后,回归公式为:^Y(子代转换值均值)=0.14*^X(单亲转换值)-0.47,得到的遗传度为h2=2*b=0.28,标准误0.17。
单亲-子代回归法计算的遗传度h2=0.14(原始数据)
Fig.3 Heritability calculated by oneparentoffspring method h2=0.14(original data)
单亲-子代回归计算的遗传度h2=0.28(正态转换数据)
Fig.4 Heritability calculated by oneparentoffspring method h2=0.28(normalitytransformation)
2.3 SOLAR统计分析 本研究采用多基因遗传模式,用于遗传度分析的有效数据为137例,得到的遗传度为0.52,标准误为0.16。将年龄作为共变量分析,年龄的作用无统计学意义(P=0.97)。将屈光度进行正态转换后结果相近,遗传度为0.57, 标准误为0.16,年龄作为共变量作用无统计学意义(P=0.64)。
3 讨 论
本研究以一个大家系作为随机样本,分析了此家系所代表地区人群的屈光度的遗传度。有关屈光不正的遗传度,以往也有研究,但主要是作为定性资料,分析其中近视、远视或高度近视的遗传度,将其作为连续性定量资料分析的较少。已报道的遗传度差异也非常大,家系研究中得到的最高为0.98(同胞样本),最低为0.04(父母-子代样本);双生子研究中得到的最高的遗传度为0.87,最低为0.11[11]292。如此大的差异不仅与研究的地区人群及样本类型有关,标准的不同也是原因之一。其实在很多高度近视的基因连锁分析中,高度近视的标准也未完全统一,-5.00?D、-5.50?D、-6.00?D、-8.00?D等都曾被采用过。同时,从临床经验中本研究亦了解到,通常定义下的-6.00?D这一高度近视的标准从临床意义上讲并非是完全恰当的,很多更高度数的患者并无眼底改变也无进行性发展。因而要研究高度近视的遗传度,在获得统一明确的标准后再进行似乎更有价值。应该说,以屈光度作为变量研究其遗传度不仅在统计学上更为恰当,可以反映屈光系统的遗传特性,同时也有利于进一步分析高度近视的定义标准,更有临床意义。
关于遗传度的计算有多种方法,常用的方法有3种:① 患病可能性的相互对比;② 回归法;③ 方差成份分析法。定性资料的分析一般更多地采取第一种方法,计量资料则根据样本类型及研究目的可以采用多种方法。就计算功能而言,一般认为,方差成份法要比回归法更有效[1213]。
在以往有关近视或屈光度的遗传度研究中,由单亲-子代方法计算出的遗传度一般较低,由双生子研究得出的遗传性相对较高,平均得出的遗传度/性一般在0.5~0.7左右[11]292。在本研究中,由均父母-子代法和SOLAR得出的遗传度结果相近,分别为0.56和0.52,数据进行正态转换后结果接近(分别为0.60和0.57),由单亲-子代获得的遗传度明显不同,只有0.14,数据进行正态转换后结果为0.28。从计算原理上,本研究认为,均父母-子代回归法较单亲-子代回归法可靠。
有关SOLAR,由于其可以充分利用家系中的可能信息进行综合模式的比较,并可以同时分析各个已知的共变量方差的作用,目前已被广泛应用于大家系计量型变量的统计分析。比如用其计算不同人群中血压值的遗传度,并分析年龄、性别、体重指数等作为共变量对收缩压、舒张压和平均动脉压的影响[1415];用其计算的成年人体重的遗传度低于0.20[16];而腹主动脉钙沉积量的形成中,遗传作用起一半的作用,年龄、性别及其他多变量起30%的作用[17]。可见,SOLAR用于多基因变量遗传度的分析是可以信赖的。
在本研究中,标准误普遍较高,这与研究样本不够大有一定的关系。同时本研究认为,很多轻度的屈光不正患者由于从事的工作或生活环境的关系,并不需要戴镜校正,也就是说,正视人群中,有可能存在部分轻度屈光不正患者,从而影响到统计结果。本研究曾将样本中的正视数据视作缺失数据计算过遗传度,结果普遍提高,但由于病例数减少,标准误亦增大,实际上这样做更会影响到样本的随机性分布,因而是不可取的。
在遗传度分析时,本研究均对数据进行了正态转换。对于SOLAR等统计软件,尽管它们对于样本的数据分布均假设为正态性,但实际检测结果即便并非完全正态对结论也无明显影响。在本研究中,数据转换后结果无太大的差异。但为了结论的可靠性,本研究建议利用SOLAR等进行统计分析时,还是对数据进行转换比较好,这有利于保证研究的科学性、延续性。
本研究得出的屈光度的遗传度在0.5~0.6左右,说明对于此被研究人群,在屈光系统的形成中遗传因素起了一半以上的作用,未发现年龄对于屈光度的形成有明显作用。由于本研究所选择的随机人群整体上归属于一个大的家系,在遗传背景、环境等方面相对其他随机人群干扰较少,得出的遗传度可以较准确地反映遗传因素的作用比例。从结果中看出,环境因素的作用在0.4~0.5左右,接近一半,说明通过改善环境因素,比如用眼习惯、光照强度、增加室外活动等生活方式,可以控制屈光度数的发展。对于高度近视,由于其遗传模式较一般的屈光度变量不同[18],基因的外显率要高得多,遗传因素的作用会更高一些,因而需要通过发现致病基因,在基因预防和治疗方面加强对高度近视的控制。
【参考文献】
[1] Tom S, Andrew P R. Compleax disease: Theory and results[M]. BIOS Scientific Publisher Ltd, 1999.
[2] Blackie C A, Harris W F. Refraction and keratometry: Departures from and transformations toward multivariate normality[J]. Optom Vis Sci, 1997, 74(6):452458.
[3] John J, Draper N. An alternative family of Transformations[J]. Appl Statist, 1980, 29:190197.
[4] Falconer D S, Mackay T S C. Heritability[M]. Longman. England, 1997.
[5] Almasy L, Blangero J. Multipoint quantitativetrait linkage analysis in general pedigrees[J]. Am J Hum Genet, 1998, 62(4):11981211.
[6] Blangero J, Williams J T, Almasy L. Robust LOD scores for variance componentbased linkage analysis[J]. Genet Epidemiol, 2000, 19(supp l):S814.
[7] Blangero J, Williams J T, Almasy L. Variance component methods for detecting complex trait loci[J]. Adv Genet, 2001, 42:151181.
[8] Williams J T, Duggirala R, Blangero J. Statistical properties of a variance components method for quantitative trait linkage analysis in nuclear families and extended pedigrees[J]. Genet Epidemiol, 1997, 14(6):10651070.
[9] Williams J T, Blangero J. Comparison of variance components and sibpairbased approaches to quantitative trait linkage analysis in unselected samples[J]. Genet Epidemiol, 1999, 16(2):113134.
[10] Beaty T H, Self S G, Liang K Y, et al. Use of robust variance components models to analyse triglyceride data in families[J]. Ann Hum Genet, 1985, 49(Pt4):315328.
[11] 秦雪娇,李镜海.近视的遗传学研究[J].国外医学遗传学分册,2005,28(5).
[12] Pratt S C, Daly M J, Kruglyak L. Exact multipoint quantitativetrait linkage analysis in pedigrees by variance components[J]. Am J Hum Genet, 2000, 66(3):11531157.
[13] Amos C I, Zhu D K, Boerwinkle E. Assessing genetic linkage and association with robust components of variance approaches[J]. Ann Hum Genet, 1996, 60(Pt2):143160.
[14] Adeyemo A A, Omotade O O, Rotimi C N,et al. Heritability of blood pressure in Nigerian families[J]. J Hypertens, 2002, 20(5):859863.
[15] Levy D, DeStefano A L, Larson M G, et al. Evidence for a gene influencing blood pressure on chromosome 17. Genome scan linkage results for longitudinal blood pressure phenotypes in subjects from the framingham heart study[J]. Hypertension, 2000, 36(4):477483.
[16] Golla A, Strauch K, Dietter J, et al. Quantitative trait linkage analysis of longitudinal change in body weight[J]. BMC Genet, 2003, 4(suppl):S7.
[17] ′Donnell C J, Chazaro I, Wilson P W, et al. Evidence for heritability of abdominal aortic calcific deposits in the Framingham Heart Study[J]. Circulation, 2002, 106(3):337341.
[18] 李镜海,张普云.高度近视的基因频率及其遗传模式的研究[J].中华眼科杂志, 1984, 20(4):222224.