当前位置:首页 > 文献频道 > 临床内科学 > 文献详细

《呼吸病学》

致过敏性哮喘的葎草花粉特异性变应原pTSX1 cDNA克隆的生物信息学分析

发表时间:2012-03-30  浏览次数:444次

  作者:徐晶,孙秀珍,刘昀,张永红,李维  作者单位:西安交通大学医学院第二附属医院呼吸内科,陕西西安 710004

  【摘要】目的 对免疫学筛选鉴定获得的葎草花粉过敏哮喘特异性变应原阳性pTSX1 cDNA克隆进行生物信息学分析。方法 运用生物信息学的序列分析、序列比对、基因构成和蛋白质的结构及功能进行预测。结果 pTSX1 特异性变应原克隆序列分析表明,该克隆与现有的已知基因均无高度同源性。其序列有一615bp的开放阅读框(61~675bp),编码204个氨基酸。预测pTSX1蛋白的氨基酸序列编码蛋白很有可能为核糖体蛋白。结论 获得的葎草花粉过敏哮喘特异性变应原阳性pTSX1 cDNA克隆是一个新的基因,pTSX1基因编码的蛋白可能是核糖体蛋白。

  【关键词】 葎草花粉,变应原cDNA,生物信息学;序列分析

  ABSTRACT: Objective To make a bioinformatical analysis of the specific allergen pTSX1 cDNA clone obtained from Humulus pollen in allergic asthma by immunological screening and gene cloning. Methods Bioinformatical approaches, including sequence analysis, sequence alignment, genetic makeup, protein structure and function prediction, were used. Results The analysis of the specific allergen pTSX1 cDNA showed that the gene had no high homology with genes known so far. The cDNA had a 615bp length open reading frame and coded a protein with 204 amine acids. The analysis of amine acids sequence coded by the pTSX1 cDNA showed that the protein identity of this gene product might be one of ribosomal proteins. Conclusion The pTSX1 cDNA cloned from Humulus pollen in allergic asthma is a new gene, and the protein coded by pTSX1 gene may be one of ribosomal proteins.

  KEY WORDS: Humulus pollen; allergen cDNA; bioinformatics; sequence analysis

  花粉症是敏感个体对花粉的一种超敏反应,在变态反应性疾病中最具代表性。它可引起多种过敏性疾病,以支气管哮喘最常见。葎草花粉近年来已成为我国多数地区包括西安地区夏秋季节花粉症的主要变应原[1]。构建葎草花粉cDNA表达文库并从中筛选出特异性变应原是制备基因重组变应原的基础,因而在诊断及治疗由其引起的过敏性疾病中具有重要意义。我们先前报道用葎草花粉过敏哮喘患者血清对构建好的葎草花粉cDNA λTripIEx2噬菌体表达文库进行免疫学筛选,获得了与过敏性哮喘相关的三个葎草花粉特异性变应原cDNA克隆,经免疫学、分子生物学鉴定和生物信息学分析,可能为新基因。

  生物信息学是一门由数学、统计、计算机与生物医学交叉结合的新兴学科。它已广泛地渗透到医学的各个研究领域中,成为生物医学发展不可缺少的重要工具。随着人类基因组计划的快速发展,生物信息学技术在人类疾病与功能基因的发现与识别、基因与蛋白质的表达与功能研究方面,都发挥着关键的作用。在对所有新基因的功能和特性进行研究之前,有必要先充分利用生物信息学的方法对其进行预测分析。

  为了深入了解和研究我们发现的新基因的结构与功能,我们运用生物信息学研究和功能预测手段,对pTSX1 cDNA克隆进行了详尽的分析。

  1 材料与方法

  对葎草花粉cDNA λTripIEx2噬菌体表达文库进行滴度测定及扩增,先选用葎草花粉过敏的哮喘患者的血清与大肠杆菌裂解液共同温育去除交叉抗体,然后用免疫学方法筛选阳性克隆。提取阳性重组噬菌体DNA,经EcoRⅠ和HindⅢ双酶切分析、琼脂糖凝胶电泳鉴定后,DNA序列测定并进行生物信息学分析[2]。

  1.1 核酸序列分析

  首先在http://www.girinst.org/censor/index.php[3]进行重复序列分析。http://www.ncbi.nlm.nih.gov/VecScreen/VecScreen.html去除载体污染。将测序得到的DNA序列采用美国国立生物技术信息中心(National Center for Biotechnology Information, NCBI)网站的Blast软件(http://www.ncbi.nlm.nih.gov/blast/Blast.cgi)对GenBank中的非冗余数据库(nonredundant database, nr)进行查询,并两两进行两条核酸序列之间的同源性分析[4](http://www.ncbi.nlm.nih.gov/blast/bl2seq/wblast2.cgi)。软件DNAMAN进行核酸序列之间的多重比对分析及进化分析。用http://www.fruitfly.org/seq_tools/promoter.html进行基因启动子[56]分析。GENSCAN分析基因外显子。NCBI网站进行基因表达谱分析及基于六相位翻译原理查找cDNA序列的开放阅读框(open reading frame, ORF)(http://www.ncbi.nlm.nih.gov/gorf/gorf.html)。

  1.2 蛋白质分析

  应用Blast软件进行蛋白质同源性分析,软件InterProscan预测编码蛋白的基本理化性质,包括氨基酸组成、分子质量、等电点。使用软件Sopma预测二级结构,软件Antheprot进行蛋白跨膜区分析[7]。

  http://genome.cbs.dtu.dk/services/SignalP/进行信号肽分析[8]。SMART进行蛋白质结构功能域分析[9]。TargetP对蛋白质序列进行亚细胞定位分析。SwissModel服务器进行三级结构同源建模[10]。

  2 结 果

  2.1 利用生物信息学对pTSX1进行核酸序列分析

  2.1.1 重复序列分析

  目的片段pTSX1没有发现重复序列。

  2.1.2 同源性分析

  将测序得到的pTSX1核苷酸序列输入NCBI网站,利用Blast软件在GenBank数据库Nucleotide Collection (nr/nt)中进行核苷酸序列同源性(Blastn)分析(表1)。经过Blast比对,结果显示pTSX1序列与2个毛果杨树基因Score值>620,序列一致性(identities)>84%,其中与收录号为EF145831.1的毛果杨基因WS0113_K15(提取自华盛顿区域一棵8年生毛果杨树的新生层及韧皮部)Score=643,序列一致性为85%,E=0。该基因的产物尚不知晓,但该基因编码区与拟南芥At4g16720基因(其编码蛋白为核糖体蛋白L15A)相类似。与一系列拟南芥克隆比对Score>420,序列一致性(identities)>79%,其中大部分编码蛋白为核糖体蛋白。 表1 NCBI网站列出的核苷酸同源性分析的结果(略)

  2.1.3 两条核酸序列之间的同源性分析及核酸序列之间的多重比对分析及进化分析

  三条序列之间两两同源性分析均没有发现明显的同源性。DNAMAN软件对3条序列进行多重序列比对,结果显示3条序列的一致性为38.69%(图1)。

  2.1.4 基因启动子

  经过预测,pTSX1序列均不含启动子。

  2.1.5 基因外显子

  pTSX1有一个单一外显子(61~675核苷酸)和Poly A信号(840~845核苷酸),见图2。

  2.1.6 开放阅读框的分析

  pTSX1序列有一615bp的开放阅读框(61~675bp),编码204个氨基酸。预测该蛋白的氨基酸序列为:MGAYKYVSELWRKK

  QSDVMRFLQRVRCWEYRQHPSIVRVTRPTRP

  DKARRLGYKAKQGYVVYRVRVRRGGRKRPV

  PKGIVYGKPTNQGVTQLKFQRSKRPVAEERA

  GRKLGGLRVLNSYWINEDSTYKYFEVILVDV

  AHNAVRNDPRINWLCNPVHKHRELRGLTSA

  GKKFRGLRGKGHRNYKNRPSRRATWKKNN

  TVSLPRYR。

  2.2 pTSX1编码蛋白的分析

  2.2.1 pTSX1核苷酸同源性的分析

  所筛选得到的葎草花粉cDNA克隆序列pTSX1翻译成氨基酸序列后,在NCBI网站使用Blastn程序进行检索,所得序列的一致性均>73%,Score值均>200(表2)。选取Score值最高的10项进行分析,其中6个编码蛋白均为核糖体蛋白,4个为60S核糖体蛋白,2个只说明为核糖体蛋白。其余4个为尚未明确的蛋白。由此可知,葎草花粉序列pTSX1编码蛋白很有可能为核糖体蛋白。

  2.2.2 pTSX1蛋白产物理化性质的预测

  pTSX1基因编码204个氨基酸、理论分子质量约为24.23ku、等电点为11.90的碱性蛋白(图3)。软件InterProscan预测pTSX1编码的蛋白共含有3454个原子,总分子式为C1078H1740N356O276S4。预测半衰期在哺乳动物网状红细胞中为30h,在酵母菌中大于20h,在大肠杆菌中大于10h。预测波动系数为39.63,结论为这类蛋白是稳定的。使用软件Sopma预测二级结构,结果显示该蛋白富含α螺旋与β折叠(图4);表2 NCBI网站列出的氨基酸同源性分析的结果(略)

  2.2.3 蛋白质结构功能域的分析

  基因pTSX1预测到一个Ribosomal L15(2~193aa)功能域(图7)。

  2.2.4 蛋白质亚细胞定位的分析

  预测到pTSX1编码蛋白定位于线粒体,但可信度居于中等。

  2.2.5 蛋白质三级结构的预测

  在SwissModel服务器进行蛋白质的三级结构同源建模(图8)。

  3 讨 论

  经生物信息学分析,目的片段pTSX1序列核酸序列同源性分析与该序列编码蛋白的同源性分析相一致,提示该序列为编码核糖体蛋白的核酸序列。

  目的片段pTSX1序列经预测不含启动子。有一个单一外显子和Poly A信号。拥有一个615bp的开放阅读框,编码204个氨基酸的稳定的碱性蛋白。编码蛋白结构功能域预测葎草花粉目的片段pTSX1序列编码蛋白中有一核糖体蛋白L15(2~193aa)的功能域。此预测与前同源性预测相一致。蛋白质亚细胞定位分析预测到pTSX1编码蛋白定位于线粒体(可信度居于中等)。

  核糖体是生物细胞中依据mRNA所提供的遗传信息合成蛋白质的细胞内亚结构。核糖体是颗粒结构,没有被膜,含40%的蛋白质、60%的RNA。蛋白按照一定的顺序与RNA结合,组成两个核糖体亚单体。核糖体中的蛋白质,rRNA以及其他一些辅助因子在一起提供了翻译过程所需的全部酶活性。这些酶活性只有在核糖体整体结构存在的情况下才具备。

  不同种的原核生物核糖体蛋白质之间有很高的同源性,序列分析和免疫反应都证明了这一点。说明不同物种细胞中的核糖体可能来源于共同的祖先,在进化上非常保守。在氨基酸选择上应当是随机的。由于核糖体的功能具有普遍意义,所以不同种的原核生物核糖体蛋白质之间具有很高的同源性。对核糖体蛋白的功能有多种推测:①对rRNA折叠成有功能的三维结构十分重要;②对核糖体的构象变化起到微调作用;③在核糖体的结合位点及催化位点上与rRNA共同作用。

  目前,用于变态反应性疾病诊断及特异性免疫治疗(SIT)的变应原仍为粗制浸出液,存在诸多问题:成分复杂,且容易为外源性的毒性物质污染;在治疗中长期使用可能会出现过敏反应,严重者可致死亡;成分和浓度不稳定,很难确定有效的治疗剂量。1998年WHO的指导性文件中要求在免疫治疗中应使用标准化的变应原疫苗。随着分子克隆技术的发展,重组变应原疫苗近年来成为研究的热点。

  基因重组疫苗是利用基因工程的方法,将变应原的某个抗原基因或某几个抗原表位在体外进行扩增和表达,获取表达产物作为免疫原。但其免疫原性较弱,需要进行免疫修饰。与粗制浸出液相比,纯化或重组变应原具有如下优点:可大规模生产,能保持较高的纯度;可定量化、标准化,稳定性好,易于质控;特异性高,提高了诊断敏感性,并推进了特异性免疫治疗,有利于试剂的发展。目前,体外试验及皮肤试验的结果显示,大部分基因重组变应原的活性与天然变应原提取液相当。上述结论已被某些基因重组变应原结构分析的结果所证实。例如,由大肠杆菌所表达的基因重组变应原Der p 2的IgE抗体反应性与纯化的天然Der p 2无差别。实际上Der p 2及桦树花粉主要致敏蛋白组分Bet v 1的三维结构测定是用基因重组变应原来完成的。有研究者[1112]应用重组变应原疫苗进行皮肤试验和体外血清学试验,证实它和相应的天然变应原提取物一样安全、有效。而且由于制剂稳定、纯度高,所以诊断实验的标准化也大大提高。作为治疗用重组变应原疫苗的基础结构经过改造,明显降低了IgE的结合力,可诱导人体保护性免疫应答。碱基定向突变也为基础性研究提供帮助,有助于认识变应原蛋白引起变应原性的三维结构,能够进行广泛、深入的免疫学以及发病机制的研究。

  本次研究为进一步探索过敏性哮喘发病的分子机制、特异性免疫治疗、制备重组变应原疫苗或核酸疫苗并进一步应用于临床奠定了基础。

  【参考文献】

  [1]孙秀珍,李玉馥,赵子慎. 西安地区气传花粉动态的初步调查 [J]. 环境与健康杂志, 1994, 11(2):8081.

  [2]刘红涛,范天黎,鲁照明,等. 杜氏盐藻光系统Ⅱ反应中心蛋白D1基因的克隆及序列分析 [J]. 郑州大学学报:医学版, 2008, 43(6):11231126.

  [3]KOHANY O, GENTLES AJ, HANKUS L, et al. Annotation, submission and screening of repetitive elements in Repbase: Repbase submitter and censor [J]. BMC Bioinformatics, 2006, 25(7):474.

  [4]TATUSOVA TA, MADDEN TL. Blast 2 sequences, a new tool for comparing protein and nucleotide sequences [J]. FEMS Microbiol Lett, 1999, 177(1):187188.

  [5]REESE MG. Application of a timedelay neural network to promoter annotation in the Drosophila melanogaster genome [J]. Comput Chem, 2001, 26(1):5156.

  [6]YANDELL M, MOORE B, SALAS F, et al. Genomewide analysis of human disease alleles reveals that their locarions are correlated in paralogous proteins [J]. PLoS Comput Biol, 2008, 4(11):e1000218.

  [7]COMBET C, BLANCHET C, GEOURJON C, et al. NPS@: Network Protein Sequence Analysis [J]. Trends Biochem Sci, 2000, 25(3):147150.

  [8]BENDTSEN JD, NIELSEN H, VON HEIJNE G, et al. Improved prediction of signal peptides: SignalP 3.0 [J]. Mol Biol, 2004, 340(4):783795.

  [9]LETUNIC I, DOERKS T, BORK P. SMART 6: recent updates and new developments [J]. Nucleic Acids Res, 2009 37(Database issue):D229232.

  [10]ARNOLD K, BORDOLI L, KOPP J, et al. The SWISSMODEL Workspace: A webbased environment for protein structure homology modeling [J]. Bioinformatics, 2006, 22(2):195201.

  [11]NIEDERBERGER V, STUBNER P, SPITZAUER S, et al. Skin test results but not serology reflect immediate type respiratory sensitivity: a study performed with recombinant allergens molecules [J]. Invest Dermatology, 2001, 117(5):848851.

  [12]NIKOLAIZIK WH, WEICHEL M, BLASER K, et al. Intracutaneous test with recombinant allergens in cystic fibrosis patients with allergic bronchopulmonary aspergillosis and Aspergillus allergy [J]. Am J Respirat Crit Care Med, 2002, 165(7):916921.

医思倍微信
医思倍移动端
医思倍小程序