植物乳杆菌的比较基因组学研究
发表时间:2014-08-12 浏览次数:799次
植物乳杆菌属于乳杆菌科中的乳杆菌属,兼性异型乳酸发酵。植物乳杆菌可以生存在多种环境中,包括乳制品,肉制品以及许多蔬菜发酵制品中,此外,它还是人体胃肠道的土著菌群,具有维持肠道内菌群平衡,降低胆固醇水平,提高机体免疫力,促进营养物质吸收等多种功能。由于其特殊的性质,使得它无论在食品发酵,还是在工业乳酸发酵以及医疗保健等领域,都有着广泛的应用。
近年来,随着各种高通量测序技术的广泛应用,基因组、转录组、蛋白组、代谢组等已广泛应用于乳酸菌研究中。自2001年完成第一株乳酸菌孑1酸乳球菌乙全基因组测序工作以来[2],在世界范围内掀起了乳酸菌全基因组测序的浪潮,至2013年7月,已有超过100株乳酸菌基因组测序工作相继完成并向国际公共数据库递交了全基因组序列。在这些测序的乳酸菌中,植物乳杆菌由于其益生性质及实用性,被广泛研究,目前为止,已完成基因组全图6株,草图8株,同时还有多个正在进行的项目。这些数据为我们深人全面了解和认识植物乳杆菌揭开了新的篇章。植物乳杆菌ST-Ⅲ是从泡菜中分离得到的具有降胆固醇、降血脂、粘附肠道上皮细胞等多种益生功能的植物乳杆菌[35],添加sT-Ⅲ的酸奶及酸乳饮料已完成产业化,市场反映良好。2011年,叩-III通过采用Roche454和I11ullllna“lexa两种高通量测序技术补充数据和纠错相结合的方法完成了全基因组精细图谱的测序工作[6],为深入系统地了解STⅢ益生特性打下了基础。为了分析和了解同种不同菌株性状差别的原因,本研究以田III基因组为主要研究对象,采用比较基因组学分析和比较几株测序植物乳杆菌的基因组特点,重点分析了与植物乳杆菌生长、环境耐受性、风味产生等益生功能有关的基因,为从系统生物学角度分析植物乳杆菌的生物学功能及形成机制提供了理论依据。
1材料与方法
1.1材料选择已完成测序的植物乳杆菌5株,和另外17株具有代表性的乳杆菌进行比较基因组分析,具体菌株信息见表1。
1.2方法使用基本比对工具BLAsT(http:〃blast llch nlm.lllh四v/)对ST-Ⅲ基因组中各基因搜索同源蛋白序列并对其基本情况进行分析,阈值设置为1e4;综合Inte屮⑩平台(w-山ac uˇillterplcl/)、ΚEGG数据库(http:〃邯唧。genome jp/keg酽)分析叩-III基因组的基本代谢途径,从系统生物学水平上确认和预测基因产物在各种生物学过程中行使的功能[7];使用MUMmer(http:〃www,"gr.嘤冖onware/mumme')软件和Mauve(http://asap,ahabs.诫sc.ecl√mauve/)软件对3株已完成全基因组测序的植物乳杆菌菌株WC"1,JDM1和s⒎Ⅲ基因组进行比对,阈值设置为1e5[:];使用BLAST工具对上述3株植物乳杆菌的细菌素合成相关基因簇进行比较分析;使用AHemis Comparison Tool(http:〃www sanger ac,uk/S洫ware/ACT//)又寸上述3株植物乳杆菌的多糖相关序列进行分析。
2结果与讨论
2.1植物乳杆菌基因组的基本特点图1是S⒎Ⅲ基因组图谱,由一个染色体组和一个质粒组成。两者均为环状分子,长度分别为夕54376bp和53560bp,平均G+C含量分别为狃,58%和38 69%。
2.3基因组共线性分析采用Mauve和Mummer软件,分析3个植物乳杆菌菌株(WC"1,JDM1和sT-III)基因组之间的差异(图3)。发现植物乳杆菌种内遗传稳定,突变重组较少。sT III与另外2株菌(WC鸭1,JElM1)均保持良好的线性关系,没有发生过大规模的插人、缺失、倒位等现象,仅发现小的插人或倒位,表明菌株在进化过程中发生过小范围的基因重组和转移。sT-III基因组未发现任何致病基因,这与动物实验及人体实验结果相一致,表明ST-Ⅲ可靠的安全性。与另外两株植物乳杆菌(WC"1,JDM1)相比较,sTⅢ缺失了100多个基因,这些基因主要涉及到钼辅囚子的生物合成及硝酸还原酶等与电子传递链有关的蛋白。相对比的是,叩III多出’O0个基因,其中大的插人片段(>5kb)包括与噬菌体相关蛋白(LPST_C1678-LPST_C1689,LPST~C1997-LPST_C2022),电子传递链才目关(LPST_C2360-LPST_C2375),还刁笥——后殳位于植物乳杆菌生活适应岛区域中Ⅱl(LPS”9442900),证明了该区域多样性的特点。在ST-Ⅲ基因组中还发现了一个脂肪族磺酸盐ABC转运系统簇ss沮"(L"T_Cα20乇PST_∞432)。许多脂肪族磺酸盐,例如牛磺胆酸盐,脱氧牛磺胆酸盐能显著增加乳酸菌的降胆固醇能力,这个发现与叩-III具有很好的耐胆盐、降胆固醇能力相一致,为深人探讨SΙⅢ降胆固醇机理提供了思路。同时,在ST-Ⅲ中还存在一个大小为53560bp的质粒,共编码狃个蛋白序列[5:。在这些编码序列中,32个基因功能经同源性比对性质已注释。其中发现8个和离子的转运有关,特别是发现一个完整的Κ+吸收系统Kdp簇(LPST P0005-LPST_PCl009)。它属于高亲和度的K+吸收系统,当环境中Κ+含量不足或者渗透压高时才表达。该簇主要存在于大肠杆菌和产气荚膜梭菌中,在乳杆菌属中为第一次发现,推测与其耐盐、耐高渗能力有关。还发现一个甘氨酸/月旦碱/肉碱转运系统(LPST P00m~LPsT_P0030),推测此与其抗高渗、抗寒能力相关。这些性质的发现与叨-Ⅲ来源于泡菜的结果相符,表明了该菌具有耐高渗的能力。
2.4植物乳杆菌素合成相关基因簇植物乳杆菌素(plant舶on)是植物乳杆菌代谢过程中合成并分泌到环境中的一类对同种的或亲缘关系较近的有抑制作用的杀菌蛋白或多肽物质。植物乳杆菌所产植物乳杆菌素有20多种,其中对lDlantaricin C「叫、plantaricin A[14]、plantaricin EF、plantaricin JIC115J、l,lant疝0nS[⒗]等研究得较为深人。植物乳杆菌素大都属于I类或Ⅱ类细菌素,分子量较小、热稳定性高,可被蛋白酶降解,主要抑制乳酸菌和革兰氏阳性细菌,此外plantaricin LP84[⒘]还具有抑制革兰氏阴性菌的胄邕力。通常,负责编码产生细菌素的基因与其免疫基因在染色体紧密排列组成一个完整的操纵子。我们根据基因预测结果,在3株已测序的植物乳杆菌基因组中,均发现一个典型的与Ⅱb类细菌素分泌合成相关的基因簇。IIb类细菌素最早在乙pJ色刀rarⅡm C1r呐J中发现,由两个不同氨基酸序列的多肽链组成,每条多肽链由15~30个氨基酸组成,含有双甘氨酸引导序列。两组分在抑菌功能上一般具有累加作用,当数量相等时,抑菌活性最大。编码该类细菌素的基因簇由大约药个基因组成[1°],长度为18~19l,由5~6个操纵子组成。通过同源性比较发现,该基因簇在3株植物乳杆菌中间既有保守区域,又存在可变序列(图4)。其中ST-Ⅲ植物乳杆菌基因簇与已经报道植物乳杆菌Cl1的基因簇完全相同,PJnEFF与PJ刀J虬R分别编码两条肽链和相应的免疫蛋白,其中,f,JⅡr与PJ刀乙为Abi基因,赋予了菌株对所产植物乳杆菌素的免疫性;PJVW包含两个基因,其中PJ说Ⅱ编码含有双甘氨酸引导序列的ABC转运系统,pJⅡrylFw编码功能未知的Ⅱ型CAAX蛋白酶;PJ汹BCD为调控子,调控整个基因簇的群体感应网络;PJJ,JlflVOP编码的蛋白功能未知,其中lDlnN含有疑似的双甘氨酸引导序列。WCFS1的PJ刀基因簇与STⅢ的结构几乎一致,但在PJⅡCⅡSr口lT/后其还有PJ济y两个基因,这两个基因编码类似质粒中的毒素-抗毒素系统,常在质粒中出现,与质粒稳定性有关。这两个基因在P`刀基因簇中的作用尚不明确。与上述两株菌相比,JDM1的PJⅡ基因簇并不完整,不包含pJ汕仰@P操纵子,plnJKLR不完整,不含PJ刀仄,类plnR基因与其相对应的基因相比,可能为截短基因。ST-Ⅲ和WC"I均有产细菌素或类细菌素的报道,尽管从基因结构上与Cll极为相似,但其具体结构及其构效关系仍需实验进行研究。
2.5氨基酸的生物合成和蛋白水解系统氨基酸是乳酸菌生长发育过程中必需的营养因素之一c乳酸菌既具有从头合成氨基酸的能力,也会从环境中摄取用以蛋白质的合成,代谢能的储藏和产生,以及辅助因子的循环使用。这些氨基酸既与乳酸菌本身的生理代谢息息相关,同时也是风味化合物产生的重要来源。乳酸菌自身从头合成氨基酸的能力差异很大,例如植物乳杆菌编码相对完整的氨基酸生物合成途径,除亮氨酸,异亮氨酸,缬氨酸之外,可自身合成几乎所有的氨基酸9];而几乎不具各合成氨基酸的能力.通常乳酸菌均编码相对完善的蛋白水解系统,主要由三部分组成:细胞壁表面的蛋白水解酶,不同类型的氨基酸和寡肽转运系统,以及一些胞内肽酶(内肽酶、氨肽酶、脯氨酸特异性酶、三肽酶和二肽酶)c菌株利用蛋白质的机理首先由细胞壁蛋白水解酶降解酪蛋白成为寡肽,之后通过特定的肽转运系统运输到细胞内,进一步由胞内各种肽酶将寡肽降解为更小的肽和游离氨基酸以提供给菌体生长利用[23]。在已报道的植物乳杆菌基因组中,发现均不编码细胞壁蛋白水解酶,这是植物乳杆菌与其他种类乳杆菌的重要差异。乳酸菌对乳蛋白利用的第二步是通过肽转运系统将水解蛋白得到的寡肽转运到细胞内。到现在为止,发现三种类型的肽转运系统,Opp、Dpp和DtpT,植物乳杆菌中同时存在Opp和DtpT两种类型的转运系统(表3)。ST-III编码一个完整的口pp操纵子r’f’pdBα'(LPST_C1⒆4-LPST_C1⒆8)和一个单独的寡肽结合蛋白OPPA(LPST_C0441)。此外,ST-Ⅲ还编码有一个DtpT转运蛋白(LPsT_C04⒆),这个蛋白主要负责转运亲水性和带电荷的二肽和三肽物质。由转运系统转运到细胞内的肽类进一步由胞内各种肽酶作用2.6糖代谢相关基因植物乳杆菌是一类可在多种环境下生存的乳杆菌,可以利用多种碳源,包括单糖,低聚糖,糖醇等促进其生长。这种生存环境的多样性反映在其基因组编码多种与糖运输、代谢有关的基因及其相应的调控蛋白。植物乳杆菌基因组特点之一就是其编码有大量依赖磷酸烯醇式丙酮酸-糖类磷酸转移酶系统(phosphotransferase wstem,PTS)。PTS系统是细胞内转运糖类物质的主要功能组分之一,它一般由非专一性的能量耦合蛋白酶I(EI)和磷酸转移蛋白(HPr)以及糖专一性的PTS转运蛋白酶复合体(EII)组成,HPl蛋白15位组氨酸残基是依赖磷酸烯醇式丙酮酸(PEP)的磷酸化位点,由EI催化形成H“-RHPr,在糖吸收代谢过程中发挥传递磷酸基团的功能[24]。本实验通过同源序列比对,在ST-Ⅲ基因组中发现共有M个与多种糖类相关的ⅡS型糖类转运蛋白,编码19个完整的具有潜在功能PTS基因复合体,比WC吒1报道的完整PTs系统少6个。根据转运蛋白数据库,这些成员可归属为7个PTS家族,分布情况为(括号内为各个家族PTs的数目):葡萄糖苷(8))甘露糖/醇(3))蔗糖=N-乙酰葡萄糖胺(2))果糖=纤维二糖=山梨糖=半乳糖醇(1),显示出广泛的底物特异性。植物乳杆菌基因组中另一个特点是含有多个与低聚糖和糖醇代谢相关的操纵子,这些操纵子一般由一个转运蛋白(透性酶,PTS或ABC系统),一个调节蛋白和相应的代谢糖类的酶组成,有的还含有后续代谢所需的酶类。本实验中通过同源序列的比较分析,在S⒎III的基因组中共发现有I1个相关操纵子(图5),比DM1和WC"1各多两个操纵子。在STⅢ的基因组中,这些操纵子相对集中地分布,其中5个操纵子位于基因组3.0名。乃Mb之间,这个区域的GC含量比整个基因组低,同时碱基组成也存在很大差异,表明该区域可能通过水平转移等方式从环境中其他生物中获得,作为一个独立的生活适应岛维持宿主菌的生长。同时我们还发现在叨-III基因组中部分低聚糖代谢功能基因如利用纤维二糖和乳糖/低聚半乳糖的基因簇以多拷贝的形式出现,这种编码冗余现象可增强其利用这些碳源的能力。Ganzle等[25]研究则发现,代谢糖类的操纵子具有代谢多样性的特点,既可以转运和代谢单糖、二糖,还包括不能被人体直接利用的三糖、四糖和更高聚合度的低聚糖及糖醇类。以上这些功能都为ST¨Ⅲ在复杂的环境中特别是胃肠道中利用低聚糖类取得竞争性优势提供了重要的条件。
2.7胞外多糖合成相关基因胞外多糖是乳酸菌在生长代谢过程中分泌到细胞壁外的一类糖类化合物,有的多糖黏附于细胞表面形成荚膜多糖(capqLlla1·polys犯cllahdes,CPS),有的分泌至周围培养基中形成黏液多糖(shme polysacc·halltles,SPS)[26]。胞外多糖的形成有利于乳酸菌与环境的相互作用,抵抗不良环境如有毒物质的作用以及巨噬细胞的侵袭等,同时菌株发酵过程中产生的胞外多糖不仅能赋予发酵乳制品一定的工艺特性,例如可以改善乳制品的组织状态和流变学特性等。研究表明乳酸菌胞外多糖的合成依赖于定位于质粒或染色体上胞外多糖合成相关基因簇,该基因簇一般分为4个区,具有典型的多糖合成簇的特征。
第一区为含有调节基因的调控区,第二区编码检测聚合链长度的相关蛋白,第三区为合成胞外多糖重复单元的糖基转移酶基因,而第四区与多糖的聚合、转运和输出有关[27]。根据同源比对的结果,我们发现在已测序的3株植物乳杆菌多糖合成基因簇分别位于基因组的两个区域,其中一个基因簇大小约为14lcb,不同株植物乳杆菌间其结构和基因组盛几乎一致;另一个一般含有1~3个数目不等的多糖基因簇,由于其多样性困而被认定为一个生活适应岛。通过采用ACT工具分析比较3株已测序的植物乳杆菌可变区域的多糖基因簇(图6),发现C基因簇只在WC"1中存在;Ⅲ中含有部分的CPS2基因簇和C"3基因簇;而JDM1中,除个别基因与其他两株植物乳杆菌对应位置的基因存在一定的同源性外,几乎整个区域都完全缺失。Remus等通过结构分析,发现植物乳杆菌WCFs1部分多糖基因簇如C1和C3在功能上是不完整的,然而通过基因敲除发现,在WC"1中这4个基因簇都是有功能的,缺失掉任何一部分都会影响其胞外多糖的组成。因而根据以上分析,我们可以发现3株已测序的植物乳杆菌的胞外多糖在基因构成上存在明显的多样性的特点,其对宿主细胞的影响仍需后续实验进行研究。
3结论
与展望对于植物乳杆菌的全基因组和比较基因组学研究表明,尽管植物乳杆菌基因组在基因顺序和内容上存在很大的相似性,但不同菌株仍然含有独有的基因,许多独有的基因均位于其特定的生活适应岛上,通过基因转移或者重组获得,赋予宿主新的性状;另外,许多共有结构如胞外多糖基因簇和植物乳杆菌素合成基因簇在不同菌株之间也存在多样性和复杂性的特点。这些基因上的差异和多样性,表现在表型上即为不同菌株在性状上的差异,使得即使是同一种类的不同菌株,功能也会差别很大。因而我们在选择有益生功能的乳酸菌上,不能通过简单的种类进行辨别,必须根据其具体功能,综合分析加以判断。作为一株已证明具有多种功能的益生菌,ST-Ⅲ基因组表现出许多与另外几株不同的特点,如具有降胆固醇相关基因、耐渗透压基因,另外基因组中多个PTS家族成员和低聚糖代谢相关基囚均伴有编码冗余现象。这些现象一方面与ST-Ⅲ已发现的性状相呼应,另一方面赋予其许多潜在的尚未发现的功能,值得更深人的研究。随着系统生物学的发展,有助于我们将乳酸菌的基囚型与其表型相联系,使得我们可以通过生物信息学手段进行乳酸菌菌株的高通量筛选,这是传统筛选的重大变革,将会极大地提升筛选的效率。另一方面,以基因组序列为基础的系统生物学的发展,有助于全面、系统地了解乳酸菌基因组的结构和组成,为从系统生物学角度分析乳酸菌的生物学功能及形成机制,进而为成功改造和选育优良益生乳酸菌奠定基础,为人类健康事业做出更大贡献。
参考文献
[1]Siezen R J,van Hylckama Vlieg J E.Genomic diversity and versatility of Lactobacillus plantarum,a natural metabolic engineer[J].{H}MICROBIAL CELL FACTORIES,2011,(Suppl 1):S3.
[2]Bolotin A,Wincker P,Mauger S.The complete genome sequence of the lactic acid bacterium Lactococcus lactis ssp.lactis IL1403[J].{H}GENOME RESEARCH,2001,(05):731-753.
[3]Liu Z,Guo B,Wang Y.Cholesterol removal from media by Lactobacillus plantarum ST-Ⅲ[J].{H}MILCHWISSENSCHAFT-MILK SCIENCE INTERNATIONAL,2008,(02):134-137.
[4]Ren J,Sun K,Wu Z.All 4 bile salt hydrolase proteins are responsible for the hydrolysis activity in Lactobacillus plantarum ST-Ⅲ[J].{H}Journal of Food Science,2011,(09):622-628.
[5]Chen C,Ai L,Zhou F.Complete nucleotide sequence of plasmid pST-Ⅲfrom Lactobacillus plantarum ST-Ⅲ[J].{H}PLASMID,2012,(03):236-244.
[6]Wang Y,Chen C,Ai L.Complete genome sequence of the probiotic Lactobacillus plantarum ST-Ⅲ[J].{H}Journal of Bacteriology,2011,(01):313-314.
[7]Kanehisa M,Goto S,Kawashima S.The KEGG resource for deciphering the genome[J].{H}Nucleic Acids Research,2004,(Database issue):277-280.
[8]Delcher A L,Kasif S,Fleischmann R D.Alignment of whole genomes[J].{H}Nucleic Acids Research,1999,(11):2369-2376.
[9]Kleerebezem M,Boekhorst J,van Kranenburg R.Complete genome sequence of Lactobacillus plantarum WCFS1[J].{H}Proceedings of the National Academy of Sciences(USA),2003,(04):1990-1995.
[10]Zhang Z Y,Liu C,Zhu Y Z.Complete genome sequence of Lactobacillus plantarum JDM1[J].{H}Journal of Bacteriology,2009,(15):5020-5021.