幽门螺杆菌cagA基因3’端多态性分析及其临床意义
发表时间:2010-10-18 浏览次数:440次
作者:胡琳,徐灿霞,罗小玲 作者单位:410013 湖南长沙,中南大学湘雅三医院消化内科
【摘要】 目的 探讨幽门螺杆菌(H.pylori)cagA基因3’端多态性及其与临床疾病的相关性。方法 收集NCBI网络数据库H.pylori cagA基因全序列95条,cagA基因3’端可变区碱基、氨基酸序列387条,用Vector NTI advance 10软件对已知疾病背景的256条网络数据库cagA氨基酸序列进行多序列比较,分析cagA基因3’端序列特征及其与临床疾病的相关性。结果 (1)91条cagA基因全长氨基酸序列之间相同氨基酸百分比为27%,相似性较低;其3’端序列之间差异明显,存在大量氨基酸的插入、缺失、替换外和重复,而5’端序列相对保守。(2)cagA基因3’端氨基酸序列含有六种重复序列,分别命名为C1,C2,C3,C4,C5,C6;其中C3,C4,C6可分为两种类型,东亚型(Cn东)和西方型(Cn西)。大部分(81.86%)cagA基因3’端氨基酸序列基本结构为C1-C2-C1-C3东/C3西-C4东/C西-C5-C1-C6东/C6西。少数菌株cagA基因3’端氨基酸序列长度较长,具有不同的重复序列数目及组合方式,根据其重复序列数目及组合方式不同,可将这少数菌株cagA基因3’端氨基酸序列分为10型,其中1、7、9、10型仅存在于西方来源菌株,2、3、5、8型仅存在于东方来源菌株,4、6型为东西方菌株共有类型。(3)>4个EPIYA模体的菌株检出率在萎缩性胃炎组(11.90%)与消化性溃疡(PU)组(1.27%)比较差异有统计学意义(P<0.05),且含有4个以上EPIYA模体的菌株87.5%是在萎缩性胃炎及胃癌(GU)中检出。含多个EPIYA-C/D位点的菌株在胃癌患者中的检出率(16.67%)显著高于消化性溃疡(5.06%)患者(P<0.05)。C4数目=3时,GC组(14.81%)与PU组(2.53%)比较差异有统计学意义(P<0.05),其余重复序列数目在不同胃十二指肠疾病中无统计学意义(P>0.05)。第6型菌株在胃癌患者中的检出率(14.81%)显著高于消化性溃疡(2.53%)患者(P<0.05)。结论 (1)H.pylori菌株cagA基因3’可变区多态性明显,其差异主要由重复序列的种类、数目和组合方式造成。(2)感染>4个EPIYA模体的CagA+H.pylori可能与萎缩性胃炎及胃癌有关。(3)含多个EPIYA-C/D位点的CagA+H.pylori及第6型CagA+H.pylori可能与胃癌有关
【关键词】 幽门螺杆菌;CagA;序列分析;多态性;疾病类型
自1984年Marshall和Warren[1]首次报道H.pylori以来,幽门螺杆菌感染已被确认为在人类胃、十二指肠疾病的发生发展中起重要作用。目前世界范围内成人H.pylori感染率达50%~80%,但H.pylori感染人群症状多种多样;目前已普遍认识到,不同菌型H.pylori的致病性存在显著差异,不同菌型之间毒力因子不同可能是致病力差异的根本原因之一。其中细胞毒素相关蛋白A(cytotoxin associated protein A,CagA)是目前已知的H.pylori最重要毒力因子之一。研究显示CagA不仅是H.pylori cag毒力岛(cag pathologinicity island,cag-PAI)的标志,而且通过由CagAPAI编码蛋白构成的细菌Ⅳ型分泌系统进入胃上皮细胞[2],CagA由SRC激酶家族(SFK)激酶激活发生酪氨酸磷酸化,磷酸化的CagA与含Src 同源序列SH2的酪氨酸磷酸酶SHP-2(Src homology 2 domain-containing tyrosine phosphatase)形成络合物,导致宿主细胞肌动蛋白细胞骨架重排,细胞形态呈蜂鸟样改变,并激活宿主细胞的信号系统,从而促进细胞增殖、细胞周期加速[3~6]。目前认为H.pylori感染者临床表现的差异除与宿主基因易感性、环境因素有关外,其主要原因在于cagA 核苷酸序列及CagA 抗原性具有多态性,CagA磷酸化及其与SHP-2结合活性有差异,导致不同CagA 的致病性存在差异。cagA基因片段5’端相对保守,3’端相对多变,且CagA磷酸化及其与SHP-2结合位点均位于3’端。故本研究的目的是充分利用网络数据库检索到的全部H.pylori cagA基因3’端可变区碱基、氨基酸序列,试图分析其cagA基因3’端多态性及与临床疾病的相关性。
1 材料与方法
1.1 材料 网络数据库CagA基因碱基、蛋白质氨基酸序列及背景资料来源:以“Helicobacter pylori AND CagA(Gene Name)”为关键词,检索NCBI的核酸和蛋白数据库。
1.2 方法
1.2.1 序列的选择 (1)重复提交的菌株序列经比对后选择其中一条,排除重复序列提交和存在提交错误的序列。(2)H.pylori cagA基因、蛋白质氨基酸全序列。(3)保存已知疾病、地域特征的cagA基因3’端碱基、氨基酸序列;考虑到临床疾病具有年龄差异,幽门螺杆菌存在东西方地域差异,为排除这些因素的影响,根据年龄(成年)、地域(东亚)匹配条件筛选出符合条件的序列。
1.2.2 序列分析 网络数据库筛选出的cagA基因3’端氨基酸序列运用Vector NTI advance 10 软件进行多重序列比对,分析其序列特征以及和临床疾病的相关性。
1.2.3 统计学处理 实验结果采用χ2 检验、Fisher’s精确概率法进行统计学处理。所有计算由SPSS 11.5软件完成。P<0.05认为差异有统计学意义。
2 结果
2.1 序列检索结果 共检索到845条序列,其中95条全序列,其中J99提交了三次(GeneBank接受号AE001439,AE001483,NC000921),ATCC43526(GeneBank接受号AB015413,AF001357,AB003397)其中AF001357和AB003397序列完全一样,为同一作者重复提交,AB015413为另一作者提交,序列与另外两条有26个碱基不同;NCTC11637检索到三条序列(GeneBank接受号AB015416和AF202973)其中AB015416序列与NCTC11638序列完全相同,可能是提交时菌株号写错。排除重复提交和错误序列,检索到部分序列750条,其中3’端序列387株,5’端序列363株。在91条全序列和 387条3’端序列中已知疾病背景菌株共有256株,其中慢性胃炎76株,消化性溃疡124株,胃癌56株。
2.2 cagA基因3’端的多态性及其临床意义 cagA全长序列和3’端部分序列内存在大量碱基的插入、缺失、替换和重复。cagA基因5’端相对保守,差别是由于替换、缺失和小的插入造成。其3’端序列由于存在多种重复序列,序列之间差异更加明显。cagA全长氨基酸序列之间相同氨基酸百分比为27%,相似性较低,除存在大量氨基酸的大片段插入、缺失、替换外,主要是由于cagA基因3’端可变区存在多种重复序列。分析表明cagA基因3’端重复序列的可分为六种,C1:EPIYA 所有菌株共有,至少重复三次;C2:Q/KVNKKKTEQVASPE;C3:可分为两种类型,东亚型C3东(QVAKKVSAKIDQLNEASTS)和西方型C3西(QVAKKVNAKIDRLNQIASGLGNVGQAAG);C4:也可分为两种类型,东亚型C4东(AINRKIDRLNKIASAGKGVGGFSAG)和西方型C4(FPLKRHDKVDDLSKVG),C4西为西方菌株共有,至少重复两次;C5:RSASP/RSVSP;C6:可分为两种类型,东亚型C6东(TIDFDEANQAG)和西方型C6西(TIDDLGGP)。C4东/C4西-C5-C1-C6东/C6西即相当于ESS/WSS,即东亚型/西方型的CagA酪氨酸磷酸化后与SHP-2结合并刺激其磷酸酶活性的位点EPIYA-C/D。根据重复序列的不同,可将cagA基因3’端氨基酸序列分为两种类型:东亚型和西方型。两种类型分别具有其特有的C3、C4、C6。大部分(85.15%)cagA基因3’端氨基酸序列基本结构为C1-C2-C1-C3东/C3西-C4东/C4西-C5-C1-C6东/C6西,命名为标准型;少数菌株cagA基因3’端氨基酸序列长度较长,具有不同的重复序列数目及组合方式,根据其重复序列数目及组合方式不同,可将这少数菌株cagA基因3’端氨基酸序列分为10种类型,各型氨基酸结构见表1,其中1、7、9、10型仅存在于西方来源菌株,2、3、5、8型仅存在于东方来源菌株,4、6型为东西方菌株共有类型。另外有4株不属于以上10种类型,其中序列号为BAC10429的菌株为东亚型菌株,氨基酸序列间含有一段西方型菌株的重复序列,结构为C1-C2-C1-C3西-C4西-C5-C1-C6东-C5-C1-C6东;序列号为BAC10422、BAC10423、BAC10460的菌株cagA基因3’端氨基酸序列间存在大片段的氨基酸插入。部分序列比对结果见图1。表1 各序列类型氨基酸序列结构 根据年龄(成年)、地域(东亚)匹配条件筛选出网络数据库中已知疾病背景的175条序列,其中萎缩性胃炎(CAG)组42条、消化性溃疡(PU)组79条、胃癌(GC)组54条cagA基因3’端氨基酸序列,综合分析各重复序列数目及组合方式与疾病类型的关系。结果显示>4个EPIYA模体的菌株在CAG组检出率(11.90%)明显高于PU组(1.27%,P=0.019<0.05),且含有4个以上EPIYA模体的菌株87.5%是在CAG及GC组中检出见表2。 表2 CagA EPIYA模体数目与不同疾病的关系注:*EPIYA模体数目为5时,CAG组与PU组比较差异有统计学意义(P<0.05)
已知东西方CagA蛋白分别通过EPIYA-C、EPIYA-D位点与SHP-2结合,从而干扰细胞信号传导;本研究分析了EPIYA-C或 EPIYA-D位点数目与临床疾病的关系,发现含多个EPIYA-C/D位点的菌株在胃癌组的检出率显著高于消化性溃疡组的检出率(χ2=4.897,P=0.027<0.05),见表3。表3 特殊序列特征在各疾病类型中的分布 注:*胃癌组与消化性溃疡组比较差异有统计学意义(χ2=4.897,P=0.027<0.05)
在筛选出的少数东方菌株中,重复序列C2、C3的重复次数为2次,C4的重复次数为2~4次、C5、C6的重复次数为2~3次;C4数目=3时,GC组与PU组比较差异有统计学意义(P=0.008<0.05)(表4),其他重复序列数目在不同胃十二指肠疾病中分布差异无统计学意义(P>0.05)。表4 不同C4数目在各疾病类型中的分布注:*C4数目=3时,GC组与PU组比较差异有统计学意义(P=0.008<0.05) 根据重复序列种类、数目及组合方式不同,可将这少数菌株cagA基因3’端氨基酸序列分为10型。而筛选的东方菌株含其中2、3、4、5、6、8型,各序列类型在不同胃十二指肠疾病的分布见表5,其中第6型菌株在胃癌患者中的检出率(11.59%)显著高于在消化性溃疡患者中的检出率(2.17%)(P=0.02<0.05)。 表5 不同序列类型在各疾病类型中的分布注:*第6型菌株在GC患者中的检出率显著高于在PU患者中的检出率(χ2=6.96,P=0.008<0.05)
3 讨论
许多研究证实H.pylori存在明显的地域、致病力差异,cagA是目前已知的H.pylori最重要毒力因子之一。 但不同国家、地区对cagA/CagA阳性菌株感染与胃十二指肠疾病关系的研究报道很不一致[7~11],其主要原因在于cagA 核苷酸序列及cagA 抗原性具有多态性,cagA磷酸化及其与SHP-2结合活性有差异,导致不同cagA 的致病性存在差异。另外,许多研究所获取的菌株数目较少,尚不能确定不同cagA基因型与临床疾病类型的关系。我们充分利用NCBI的核酸和蛋白数据库中检索到的已知疾病背景的cagA基因3’端可变区碱基和蛋白质氨基酸序列,分析了cagA 3’端结构特征及其与临床疾病的关系。
3.1 cagA 3’端结构特点 同H.pylori其他基因一样,cagA 基因也具有显著多态性,cagA蛋白的大小和抗原性在不同菌株间存在显著差异。cagAg/cagA的多态性主要源于cagA基因3’端可变区内重复序列种类、数目及其碱基、氨基酸序列的变化。Covacci等[12]通过CCUG17874和G39菌株测序分析比较,发现CCUG17874包括EFKNGKNKDFSK和EPIYA重复序列,G39包括2个拷贝的102bp重复序列,相应氨基酸序列为D1(PEPIYA)、D2(DDL)、D3(FPLKRHDKVDDLSKV)。后来,Evans等[13]通过PCR扩增和测序,分析了13株菌包括cagA 3’端可变区在内的1059NT核苷酸序列,发现除102bp重复序列外,还含有12-99bp不等的重复序列,相应氨基酸序列为D1a(EPIYA)、D1b(QVNKKKTGQATSPE)、D2(TIDDLGGP)、D3(FPLKRHDKVDDLSKV)、D4(GRSVSP)、D5(KIDQ/RLN-Q or KIDNLN/SQ),D6(D6=D3-D4-D1a-D2)。Yamaoka等[14]对155株日本菌株cagA基因3’端进行PCR扩增和测序的结果表明,cagA 3’端包含15bp.42bp和147bp三种重复序列(分别称作Rl,R2,R3),其氨基酸序列分别为R1(EPIYA)、R2(QVNKKKTGQATSPE)、R3(QVARKVSAKIDQLNEATSAAINRKIDRINKIASAGKGVGGFSGAGRSANP)。依据重复序列的组合形式,可将cagA 分A(R1-R2-R1-R3-R1),B(R1-R2-R1-R2-R1-R2-R1-R3-R1),C(R1-R2-R1-R3-R1-R3-R1),D(RI-R3-R1-R3-R1)4种类型。本实验对网络数据库CagA基因3’端氨基酸序列进行序列比对,表明cagA基因3’端含有六种重复序列,即C1、C2、C3、C4、C5、C6。根据序列比对结果和系统进化树分析,可将cagA基因3’端氨基酸序列分为两种类型:东亚型和西方型,两种类型分别具有其特有的C3、C4、C6,C4东/C西-C5-C1-C6东/C6西即相当于ESS/WSS。大部分cagA基因3’端氨基酸序列基本结构为C1-C2-C1-C3东/C3西-C4东/C西-C5-C1-C6东/C6西,少数菌株cagA基因3’端氨基酸序列长度较长,具有不同的重复序列数目及组合方式,根据其重复序列数目及组合方式不同,可将这少数菌株cagA基因3’端氨基酸序列分为10型,可见H.pylori菌株cagA基因3’可变区结构多态性明显,其差异主要由重复序列的种类、数目和组合方式造成。
3.2 cagA基因3’可变区的序列特征及其与临床疾病的关系 近期研究表明cagA酪氨酸磷酸化位点在cagA基因的EPIYA基序上,EPIYA 基序有四个不同的作用位点:EPIYA-A,EPIYA-B,EPIYA-C和 EPIYA-D。其中EPIYA-A,EPIYA-B存在于所有cagA阳性H.pylori菌株中,是酪氨酸磷酸化后的cagA与Src激酶(CSK)的c端SH2区域结合的位点。EPIYA-C通常是西方型cagA的酪氨酸磷酸化作用位点[15]。从东亚国家如日本,韩国和中国H.pylori中分离的cagA(东亚型cagA)不含EPIYA-C,取而代之的是一个独特的序列称为EPIYA-D。EPIYA-D是大部分东亚型cagA酪氨酸磷酸化作用位点[16]。本研究证实>4个EPIYA模体的菌株检出率在萎缩性胃炎组与消化性溃疡组比较差异有统计学意义,且2/3含有>4个EPIYA模体的菌株是在萎缩性胃炎及胃癌中检出。近来Higashi等[17]研究发现,EPIYA基序除是cagA酪氨酸磷酸化位点外,还是作为一个cagA与胃黏膜上皮细胞作用的前导信号。故EPIYA基序可能是cagA阳性H.pylori菌株的一个主要治疗靶点。本研究发现含多个EPIYA-C/D位点的菌株在胃癌的检出率显著高于消化性溃疡患者的检出率,第6型菌株均含有多个EPIYA-C/D位点,且在胃癌的检出率显著高于消化性溃疡患者的检出率,而C4重复3次的菌株也均为第6型菌株,综上推测含多个EPIYA-C/D位点的cagA+H.pylori及第6型cagA+H.pylori可能与胃癌有关。这可能是因为含有多个EPIYA-C或 EPIYA-D位点的cagA蛋白有更强的SHP-2结合活性,抑制cagA介导的CSK活化对cagA/SHP-2信号的负调控,从而引起宿主细胞形态改变和异常增殖,这可能是cagA+H.pylori致胃癌发生的一个机制。本研究发现某些特殊的序列特征与萎缩性胃炎、胃癌有关,但是仅少数菌株含特殊序列特征;这说明除菌株因素外,还有其他因素引起H.pylori感染临床结局的不同,如宿主因素就是其中另一个重要因素。最近研究发现IL、TNF等细胞因子的多态性和H.pylori感染及H.pylori相关临床疾病都有关系[18,19]。还有报道显示编码SHP-2的PTPN-11基因突变与许多人类恶性疾病有关[20,21]。H.pylori感染是胃癌发生多因素、多步骤过程中的一个因素,影响其中一个步骤或多个步骤,还有其他许多因素影响H.pylori感染后致病的最终结局。
【参考文献】
1 Warren JR,Marshall BJ.Unidentified curced bacilli on gastric epithelium in active chronic gastritis.Lahcet,1983,1(8336):1273-1275.
2 Odenbreit S,et al.Translocation of Helicobacter pylori CagA into gastric epithelial cells by type Ⅳ secretion.Science,2000,287:1497-1500.
3 Segal ED,Cha J,Lo J,et al.Altered states: involvement of phosphorylated CagA in the induction of host cellular growth changes by Helicobacter pylori.Proc Natl Acad Sci USA,1999,96:14559-14564.
4 Asahi M.Helicobacter pylori CagA protein can be tyrosine phosphorylated in gastric epithelial cells.J Exp Med,2000,191:593-602.
5 Stein M,Rappuoli R,Covacci A.Tyrosine phosphorylation of the Helicobacter pylori CagA antigen after cag-driven host cell translocation.Proc Natl Acad Sci.USA,2000,97:1263-1268.
6 Higashi H. SHP-2 tyrosine phosphatase as an intracellular target of Helicobacter pylori CagA protein.Science,2002,295(5555):683-686.
7 Kuipers EJ,Perez GI,Meuwissen SG,et al.Helicobacter pylori and atrophic gastritis:importance of the cagA status.J Natl Cancer Inst,1995,87:1777-1780.
8 Huang JQ,Zheng GF,Sumanac K,et al.Meta-analysis of the relationship between cagA s-eropositivity and gastric cancer.Gastroenterology,2003,125:1636-1644.
9 Maeda S,Ogura K,Yoshida H,et al.Major virulence factors,VacA and CagA,are commonly positive in Helicobacter pylori isolates in Japan.Gut,1998,42(3) : 338.
10 Zheng PY,Hua J,Yeoh KG,et al.Association of peptic ulcer with increased expression of lewis antigens but not cagA,iceA,and vacA in Helicobacter pylori isolates in an Asian population.Gut,2000,47(1) :18.
11 Chen XJ,Yan J,Shen YF.Dominant cagA/ vacA genotypes and coinfection frequency of H.pylori in peptic ulcer or chronic gastritis patients in Zhejiang Province and correlations among different genotypes,coinfection and severity of the diseases.Chin Med J,2005,118(6) :460.
12 Covacci A,Censini S,Bugnoli M,et al.Molecular characterization of the 128-KDa immunodominant antigen of helicobacter pylori associated with cytotoxity and duodenal ulcer.Proc Natl Acad Sci USA,1993,90:5791-5795.
13 Evans DJ,Queiroz DMM,Mendes EN,et al.Diversity in the variable region of Helicobacter pylori cagA gene involves more than simple repetition of a 102-nucleotide sequence.Biochem Biophys Res Commun,1998,245: 780-784.
14 Yamaoka Y,Kodama T,Kashima K,et al.Variants of the 3’ region of the cagA gene in Helicobacter pylori isolates from patients with diferent H.pylori-associated diseases.J Clin Microbiol,1998,36: 2258-2263.
15 Backert S,Moese S,Selbach M,et al.Phosphorylation of tyrosine 972 of the Helicobacter pylori CagA protein is essential for induction of a scattering phenotype in gastric epithelial cells.Mol Microbiol,2001,42:631-644.
16 Higashi H.Biological activity of the Helicobacter pylori virulence factor CagA is determined by variation in the tyrosine phosphorylation sites.Proc Natl Acad Sci USA,2002,99:14428-14433.
17 Higashi H,Yokoyama K,Fujii Y,et al.EPIYA motif is a membrane targeting signal of Helicobacter pylori virulence factor CagA in mammalian cells.J Biol Chem,2005,280(23):130-137.
18 Hwang IR,KodamaT,Kikuchi S,et al.Effect of interleukin I pobrmorphisms on Gastricmucosal interleukin Ⅰ beta production in Helicobacter pylori infection.Gastroenterology,2002,123(6):1793-1803.
19 Machado JC,Pharoah P,Sousa S,et al.Interleukin 1β and interleukin IRN polymorphisms are associated with increased risk of gastric carcinoma.Gastroeiterology,2001,121(4):823-829.
20 Tartaglia M,Niemeyer CM,Fragale A,et al.Somatic mutations in PTPN11 in juvenile myelomonocytic leukemia,myelodysplastic syndromes and acute myeloid leukemia.Nat Genet,2003,34: 148-150.
21 Bentires-Alj M,Paez JG,David FS,et al.Activating mutations of the Noonan syndrome-associated SHP-288/PTPN11 gene in human solid tumors and adult acute myelogenous leukemia.Cancer Res,2004,64: 8816-8820.