《1、 引言》

1、 引言

许多微生物(包括真核生物、古细菌、细菌和病毒)栖息在人类的胃肠道中[1]。二代测序技术大大提高了人们甄别这些微生物分类组成的能力,进一步的功能和关联性研究揭示了微生物群(即微生物的集合)和微生物组(即其基因)在人类健康和疾病中发挥的关键作用[23]。然而,随着时间的推移,大多数微生物物种在宿主之间甚至宿主内部都存在大量菌株水平的遗传变异[4]。一般来说,单核苷酸变异(single-nucleotide variants, SNV)和插入/缺失是肠道微生物中最常见的突变类型。非同义突变率/同义突变率(dN/dS)通常用于解释蛋白质水平的进化趋势,包括净化选择(dN/dS < 1)、中性进化(dN/dS = 1)和正向选择(即适应性进化,dN/dS > 1)[4]。适应性进化是一个使种群能够在其环境中更好地生存的过程。值得注意的是,中性进化和净化选择是人类微生物组中的主导进化力量[56],净化选择会影响人类微生物组中dN/dS小于1的大多数微生物[78]。相比之下,结构变异(structural variants, SV)并不常见[9]。然而,目前对微生物组背景下基因突变的理解仍然很有限。

本文聚焦于微生物组内菌株之间的共同进化,这塑造了宿主肠道微生物种内和种间的菌株水平多样性。与健康特别相关的是,近期研究表明微生物组中的特定基因组突变与人类常见的代谢疾病有关。本文还讨论了有关有益和有害微生物入侵、定植和在宿主体内存活过程中的适应性进化。最后,讨论了注释和分析微生物基因组突变方法和算法的最新进展,并指出对未来发展有价值的方向。

《2、 微生物群在宿主内的适应性进化》

2、 微生物群在宿主内的适应性进化

传统观点认为,自然选择导致了细菌在自然环境中的适应性进化,肠道中的微生物与人类共同进化了数万年,这意味着宿主肠道环境只是肠道微生物组进化的另一个驱动因素。然而,最近的研究表明,进化和协同进化的时间尺度非常不同。最近对宏基因组数据的分析表明,由于肠道微生物之间的竞争和新菌株的入侵,微生物种群在短时间内就可以在人类肠道中进化[510]。总体而言,适应性进化可能是由个体特异性和特定暴露因素(如饮食、地区、抗生素的使用等)引起的。特别是地区和饮食,可能是肠道菌株多态性和进化的主要原因[11]。鸟枪法宏基因组测序可以实现功能和分类学数据的获取,表明抗生素可以迫使单个物种的基因组发生快速的遗传变化,而不会使该物种的相对丰度发生显著变化[12]。研究还发现宿主年龄是一个重要的驱动因素。此外,肠道微生物的组成和基因组会随着时间的推移而动态变化,从而导致适应性进化和菌株替换[1314]。Chen等[15]对包含51种人类学类型的338名个体的肠道微生物组进行了4年的研究,描述了微生物的稳定性和变异与宿主生理之间的关系。他们发现,微生物的进化在宿主之间差异很大,但在每个宿主内表现出暂时稳定、长期显著改变的特点。一些菌株表现出显著的遗传多态性,如脆弱拟杆菌(B. fragilis)、普氏粪杆菌(F. prausnitzii)、直肠真杆菌(E. rectale)和普雷沃氏菌(P. copri)。了解指定宿主中微生物群稳定性或不稳定性背后的因素,以及这种稳定性或不稳定性如何与疾病联系,将会推动对进化机制和特定疾病模型的建立产生新见解。

脆弱拟杆菌是肠道中的一种广义共生细菌,具有遗传可塑性,部分原因是由于移动遗传元件所介导的倒置、复制和水平基因转移[1618]。这些特性有利于该菌株适应不同的生态环境,增强对抗生素的耐药性[1920]。Zhao等[7]对脆弱拟杆菌分离株进行了宏基因组测序,并探索了它们在健康人类中的适应性进化。在12个健康宿主的粪便样本中发现16个脆弱拟杆菌基因的平行进化,其中许多基因与细胞膜的生物合成和多糖利用有关;此外,突变保留在同一宿主内的连续适应性进化中。公共宏基因组数据的补充显示,脆弱拟杆菌的常见适应性突变经常发生在西方人的肠道微生物组中,而在中国人肠道微生物中并不常见,表明区域或饮食因素在推动进化中发挥作用。

普氏粪杆菌普遍存在于健康成人的肠道中,展现出极大的遗传多样性。而这种多样性的普遍程度因年龄、地理位置、生活方式和疾病而异[2,21]。最近的一项研究从全球范围内的7907份人类和203份动物肠道宏基因组数据中重建了3000个组装基因组,并将它们分为12个类似于粪杆菌属的物种水平基因组(species-level genome bins, SGB)[22]。发现这12个SGB广泛分布于全球人类肠道中,呈现出地区多样性。粪杆菌属的多样性和相对丰度的增加与复杂多糖代谢潜力的增加相关,这可能是由富含纤维的饮食促进的。与西方人群相比,在中国人群中富集的粪杆菌属SGB中,发现了淀粉降解相关基因的比例较高。相反,乳糖和蛋白质代谢相关基因的含量较低,主要是由于亚洲人摄入更多富含大米的饮食,以及牛奶和蛋白质摄入不足所致[2324]。此外,与其他西方国家的受试者相比,欧洲和中国的受试者中观察到了与抗生素抗性相关的基因富集[22]。这表明抗生素的使用在菌株的适应性进化中发挥了驱动作用。最近的一项研究揭示了普氏粪杆菌基因组普遍的适应性突变,这是由益生菌干预引起的[25],表明普氏粪杆菌在不断适应来自益生菌的选择压力。结果显示,肠道微生物菌株的不同功能基因出现了多样化的进化趋势(即适应性进化和纯化选择)。有趣的是,传感器组氨酸激酶(sensor histidine kinase; KdpD)被发现处于纯化选择状态,表明kdpFABC的表达可能没有被激活。

作为一种常见的人类肠道微生物,普雷沃氏菌因存在与宿主健康呈正负相关的相互矛盾的报道而备受争议[2627]。在一项包含6500多个宏基因组样本的跨洲际研究中,普雷沃氏菌被分为4个独特的进化支系。不同的支系共存于非西方化饮食人群中,总体上这些人群的多样性要高于西方生活方式的人群,并且存在显著的功能多样性,尤其是在碳水化合物代谢方面[28]。另一项研究发现,富含纤维的饮食与能够增强碳水化合物降解的普雷沃氏菌类型相关。与杂食饮食相关的普雷沃氏菌具有较高的leuB基因患病率,该基因参与支链氨基酸的生物合成,是葡萄糖不耐受和2型糖尿病(T2D)的关键因素[29]。所有这些证据表明,饮食驱动了普雷沃氏菌在人类中的进化过程。

由进化和菌种替换引起的微生物基因组变化,如细菌单核苷酸多态性(SNP)、SV和拷贝数变异(copy number variations, CNV),越来越多地被发现对人类健康具有重要意义[9],前两类变异已经(被发现)与人类疾病的发展相关联[3031]。即使在其他类型的遗传变异很少的情况下,CNV也可能导致细菌重要的表型差异[3233]。其他类型的微生物基因组结构变异也是重要且普遍存在的,并与宿主疾病的危险因素相关,这些结果可以在独立队列中得到验证。例如,丁酸弧菌(Anaerostipes hadrus)编码复合肌醇降解-丁酸生物合成途径的基因存在结构变异,且与较低的宿主代谢性疾病风险相关[9]。目前,宏基因组研究已经开始关注不同疾病状态下肠道微生物组的基因组变异(表1),如结直肠癌(colorectal cancer, CRC)、T2D和格雷夫斯病(Graves’ disease, GD)。

《表1》

表1 与疾病相关的单核苷酸多态性位点

DiseaseSNP sitesSNP enrichedSpeciesGeneFunction annotation
Colorectal cancerEr_SNV1CaseE. rectaleGene 3113Fusaric acid resistance protein-like
Er_SNV2CaseE. rectale
FP_SNV1CaseF. prausnitziiGene 93Methyltransferase
FP_SNV2CaseF. prausnitziiGene 1771ZF-HC2 domain-containing protein
Graves’ diseaseSNP0017ControlE. rectaleDNA-binding transcription
SNP3590ControlF. prausnitziiHypothetical protein
SNP3800ControlF. prausnitziiTranslation initiation factor
T2D56 SNPsControlB. coprocolaEDU99824Glycosyl hydrolase
80 SNPsControlB. coprocolaEDV02303Response regulator receiver domain protein

先前的研究发现T2D与肠道微生物群中产丁酸的细菌丰度增加相关。Chen等[34]发现拟杆菌属Bacteroides coprocolaB. coprocola)的SNP分布在T2D患者和健康人群之间存在显著差异,尽管B. coprocola的相对丰度在这些受试群体之间没有差异。与T2D相关的65个基因中的SNP具有多样性,其中两个突变基因编码糖苷水解酶,特别是位于肠道中的α-葡萄糖苷酶还是T2D重要的药物靶点之一,这提示不同的B.coprocola菌株可能在人类肠道中产生与T2D疾病过程有关的其他影响。

肠道微生物的基因突变可能具有疾病特异性,甚至可以在早期进行疾病预测。研究表明,基于菌株水平的单核苷酸变异构建的结直肠癌预测模型在训练[曲线下面积(AUC)= 75.35%]和验证队列(AUC = 73.08%~88.02%)中显示出较高的准确性。另外,直肠真杆菌中的两个单核苷酸变异与萎蔫酸抗性相关,而普氏粪杆菌中的另外两个单核苷酸变异位于编码甲基转移酶和ZF-HC2结构域蛋白的基因中[30]。另一个疾病预测模型结合微生物物种、宏基因组组装基因组(MAG)、基因和单核苷酸变异来预测格雷夫斯病,在全球交叉疾病多队列分析中显示出较高的准确性(AUC = 98.08%)和特异性。属于普通拟杆菌(B. vulgatus)、普氏粪杆菌和直肠真杆菌的275个SNP在健康组和格雷夫斯病组之间存在显著差异,主要位于编码木聚糖酶活性、甘露聚糖脱水酶活性、β-内酰胺酶活性和β-半乳糖苷酶活性的基因中[31]。该研究证明了基于粪便的非侵入性诊断在这些疾病中潜在的实用性。

《3、 病原体的适应性进化与毒力密切相关》

3、 病原体的适应性进化与毒力密切相关

细菌的毒力和致病性取决于细菌的特定功能。病原体的累积突变可能增强其毒力或传播力。这些突变包括基因重排、优化基因表达、损失不必要的基因以及与其他细菌的水平基因转移(horizontal gene transfer, HGT)。例如,大多数大肠杆菌(E. coli)菌株在人体肠道中无害,但少数菌株可引起严重疾病。一项研究考察了HGT对大肠杆菌菌株的选择效应,并证实噬菌体驱动的HGT进化赋予了代谢生长优势[35]。同样,Lescat等[36]完成了大肠杆菌初始菌株和突变菌株的表型分析,并证实突变菌株在最低培养基D-半乳酸盐中比野生型菌株生长更快。然而,研究人员还发现,基于110株大肠杆菌菌株的基因组数据库,三个半乳糖酸操纵子处于强纯化选择之中。因此,探索宿主中病原体和共生体的进化有助于制定对抗病原体的策略,防止其进一步进化。

物种间的相互作用可以形成遗传多样性和可移动基因元件的交换,从而导致功能多样性。单个微生物物种的进化可以塑造它们的功能多样性。表皮葡萄球菌(S. epidermidis)是一种重要的皮肤微生物和条件致病菌。对来自5名健康人的1482株表皮葡萄球菌进行宏基因组分析显示,从皮肤分离的表皮葡萄球菌具有明确的个体和身体部位特异性,且属于多个祖先株,而不是单一的定植者[37]。表皮葡萄球菌在种群水平上广泛的个体变异可以在纯化选择下形成其品系和功能多样性,导致表皮葡萄球菌在皮肤部位的种群混合和个体内耐药基因的传播,从而提高了表皮葡萄球菌的毒力。本研究还指出,快速和足够强大的净化选择有利于特定遗传结构的生长,并驱动一个独特的亚种群的形成。

耐碳青霉烯肺炎克雷伯菌(K. pneumoniae)是一种与高死亡率相关的威胁因素[3839]。肺炎克雷伯菌的毒力和致病性通过荚膜生物合成基因wzc的两种相反类型的突变而增强。一种功能突变的获得导致高荚膜产生突变体,另一种功能突变的丧失导致荚膜缺陷突变体。在高荚膜突变体中传播率和死亡率增加,这与血液感染有关。相反,在荚膜缺陷的突变体中,上皮细胞侵袭和尿路感染的持续性增加。持久性和毒力的进化可能是肺炎克雷伯菌感染的普遍特征[40]。

病原体谱系也可以进化到在宿主体内的特定组织中定植。结核分枝杆菌(M. tuberculosis)是造成全球患者死亡的主要原因,尤其是在获得性免疫缺陷综合征(acquired immune deficiency syndrome, AIDS)患者中[41]。对来自44名受试者死后肺和肺外器官的2693份样本进行基因组分析,发现结核分枝杆菌在个体内多样化,并形成共存多年的亚谱系。有强有力的证据表明,净化选择发生在患者个体中,不需要患者之间的传播。这些不同的菌株在肺内的分布不同,但许多新的突变在肺内的不同部位是共享的。此外,这种分布既不是预期的,也不是长期的[42]。

《4、 益生菌在体内的适应性进化,以提高适应度和定植》

4、 益生菌在体内的适应性进化,以提高适应度和定植

益生菌是一种活的微生物,当摄入足够的数量时,可以给宿主带来健康益处[43]。许多研究已经探讨了由于食用益生菌的生态和进化力量对肠道微生物群的生态影响,包括重塑本地微生物群落[4445]和改善肠道或免疫健康[46]。然而,由于肠道菌群引起的肠道选择压力,在给药过程中,食用益生菌的基因组和功能特征可能会发生变化,以促进定植[4748]。益生菌菌株基因组中的这些适应性突变可能赋予其适应性优势,如改善碳水化合物利用和定植[47,4950]。然而,它们可能会导致潜在的安全问题,如抗生素耐药基因或毒力因子的转移[51]。因此,探索益生菌在人类肠道中的适应性进化是微生物组和群体遗传学领域的一个令人兴奋的前沿方向。

尽管基因工程益生菌的前景是光明的,但预期的治疗效果和安全性受到肠道环境中的自然选择的影响。此外,基因工程益生菌在不同肠道微生物群和宿主饮食下的体内进化也有待探索。为了实现这一目标,Crook等[47]将候选益生菌大肠杆菌 Nissle(EcN)暴露于小鼠消化道数周,以研究EcN对各种饮食和不同复杂程度的背景微生物群的应激效应[图1(a)]。研究表明,EcN积累了调节碳水化合物利用的基因突变,以获得竞争适应性,但抗生素的用药史也赋予了对EcN的抗性。接下来,研究人员使用表达苯丙氨酸解氨酶2(phenylalanine ammonia lyase 2, PAL2)的基因工程益生菌EcN来治疗苯丙酮尿症小鼠模型,发现EcN基因在一周内保持稳定。这项研究证明了EcN作为益生菌工程的基础的效用,至少在临床前模型中是如此。总的来说,这项研究为更好地了解益生菌的安全性和工程潜力提供了一次机会。

《图1》

图1 益生菌在不同宿主中的适应性进化。在饮食、抗生素和肠道固有微生物的选择压力下,益生菌大肠杆菌Nissle(a)、植物乳杆菌HNU082(b)、植物乳杆菌NIZO2877(c)和鼠李糖乳杆菌(d)发生适应性突变,主要表现为碳水化合物利用、抗生素耐药性和酸耐受能力。图中蓝色方块代表三个单核苷酸多态性;图1(a)用省略号表示大量的蓝色方块。

在塑造宿主与微生物共生关系上,饮食是另一种至关重要的进化驱动力。Martino等[52]证实,宿主饮食是宿主微生物共生关系中植物乳杆菌(L. plantarum)进化的驱动力量[图1(b)]。他们在植物乳杆菌的ackA基因中发现了衍生自果蝇饮食中的新突变体,这种突变增强了植物乳杆菌促进动物生长的潜力。此外,植物乳杆菌发生的突变似乎进一步增强了共生效益,这很好地证实了细菌对宿主饮食的适应可能是动物与微生物共生的第一步。考虑宿主来源可能对益生菌菌株的选择有重大影响,因此,了解微生物与宿主的共同进化需要仔细考虑多种宿主模型和益生菌菌株[53]。

为了充分了解植物乳杆菌在多种宿主中的进化策略,在之前的研究[54]中,本文研究团队使用健康人类、小鼠和斑马鱼生物学模型,探索植物乳杆菌HNU082干预后在体内的肠道适应策略[图1(c)]。植物乳杆菌HNU082在肠道中定植并适应环境后,在所有宿主中都表现出高度一致的单核苷酸变异,提高了碳水化合物的利用和酸耐受性能力,并且显著促进了其体内的竞争适应性。此外,与植物乳杆菌HNU082呈竞争关系的肠道本地微生物菌株(如拟杆菌属和双歧杆菌属)在对抗植物乳杆菌HNU082入侵的过程中积累了比平时多10~70倍的进化变化,且人类肠道菌群的生态和遗传稳定性均高于小鼠。综上所述,植物乳杆菌HNU082在不同的宿主环境和动物模型中表现出高度趋同的适应性,这一发现为工程益生菌更好地定植在人体内奠定了基础。

尽管肠道环境有助于促进益生菌的适应性进化,增强其定植能力,但由益生菌导致的安全问题不容忽视。研究表明,在特定情况下,益生菌的使用存在显著风险。例如,益生菌鼠李糖乳杆菌(L. rhamnosus)的血液分离株含有新的突变,包括非同义单核苷酸变异,导致1例患者产生抗生素耐药性,这与患者菌血症[55]相关[图1(d)]。这些发现支持以下观点:益生菌菌株可直接导致菌血症,并在重症监护病房(intensive care unit, ICU)患者中适应性进化。此外,宿主内的进化可以增强益生菌菌株的存活率,但也伴随着进化出特异性抗生素耐药性[47]。相反,益生菌植物乳杆菌P-8确实丢失了1~3个质粒,表明益生菌可能有减少宿主基因组的趋势。然而,基因缺失对益生菌的益处目前仍存在争议[56]。

了解益生菌摄入导致的本地肠道微生物群普遍发生的适应性突变至关重要。为此,一项全球性、跨队列的宏基因组荟萃分析研究了由于摄入益生菌而导致的本地肠道微生物的共同进化[25]。结果表明,多种益生菌摄入可以引发小鼠和人类自然肠道微生物广泛的单核苷酸变异。有趣的是,引入的相同益生菌菌株后,在小鼠肠道本地菌群中发现的单核苷酸变异远多于在人类中发现的单核苷酸变异。此外,益生菌诱导的单核苷酸变异模式具有高度的菌株特异性。综上所述,本研究大幅度扩展了我们对益生菌和肠道本地菌群共进化的理解,强调了以综合方式对益生菌功效和安全性进行严格评估的重要性。因此,益生菌的体内进化可能成为评价益生菌的新基准。

《5、 肠道微生物基因组变异分析流程进展》

5、 肠道微生物基因组变异分析流程进展

影响新突变结果的主要原因包括遗传漂变、选择、转移或迁移以及重组[4]。据估计,在成人个体内的微生物群组中,每天约有数十亿细菌发生突变,其中有一部分变异可能具有临床研究价值[7]。值得注意的是,即使在个体微生物群组中检测到了极少的适应性突变,都可能与细菌在人体内长久定植息息相关[5758]。因此,找到一种方法来揭示准确、可靠的突变至关重要。

单菌株分离后重测序是可行的,可以识别整个基因组中的突变位点[59]。然而,在必须避免偏差的情况下,通过在微生物群中分离突变株来进行表型分析和基因组测序十分耗时,也非常昂贵。而最初的突变检测方法,即基因组组装之后进行全基因组比对,在许多测序平台都表现良好[60]。然而,将该方法应用于低丰度菌株和无法体外培养的菌株却充满挑战。同时,不幸的是,许多细菌和古生菌都无法培养[61],在19种培养基中,有五分之一的常见菌株最终没有成功生长[62]。此外,全基因组比对依赖于高度精确和连续的菌株组装,例如,一个菌株可能需要分离数百个分离株,这是十分昂贵的。

独立培养的宏基因组分析能够低成本高通量地揭示进化机制和代谢变化。目前常用于鉴定微生物组中的单核苷酸多态性的软件有Constrains [63]、MIDAS2 [64]、metaSNV [65]、DESMAN [66]和inStrain [67]等,原理是通过将鸟枪法短读段与参照基因组进行比对实现对突变位点的甄别。StrainPhlAn [68]能够被用于宏基因组水平鉴定菌株单核苷酸变异。在计算核苷酸多样性和连锁不平衡、识别单核苷酸变异以及计算准确的覆盖深度和广度方面,inStrain均表现出更高的准确性和敏感性。对于一种特定代表菌株的基因组,可使用inStrain完成单核苷酸变异注释。但如果参考菌株基因组缺失,进行数据库比对可能会遗漏关键基因。另外,MIDAS可以将短序列与拥有超过30 000个参考基因组的数据库进行比对,从而识别每个样本中每一株菌的遗传性变异。然而,到目前为止,还没有针对某些具有高菌株水平多样性的细菌物种(如普氏粪杆菌、普雷沃氏菌属以及大肠杆菌)的参考基因组选择。

基于此,基于单细胞技术的新兴方法正逐步发展,包括通过微滴微流体进行的单细胞基因组测序(SiC-seq)[69]、拉曼激活的重力驱动单细胞封装和测序(RAGE-Seq)[70],以及拉曼激活的细胞分选和测序(RACS-Seq)[71]。单细胞测序结合深度测序和特定的生物信息学方法可以识别遗传变异和迁移基因[72],与分离培养相比,这种方法可能更加快速、精确。总体而言,人类微生物组内的定量基因组变异将为微生物组基因组学的应用提供一个新的和精确的视角。

《6、 展望》

6、 展望

关于人类微生物组的更多研究,尤其是针对微生物遗传和基因组变异的研究将会在未来10年内快速发展。微生物基因组的变异已经被用作一系列临床疾病的生物标志物。未来这些研究应该扩展到构建代谢性疾病的预测模型,最终揭示微生物组与代谢性疾病间的因果关系。此外,还需要对常见和致病细菌的纯化、选择和体内适应性进化益生菌进行更深入的研究,以了解有害和有益微生物的机制以及它们与宿主的相互作用。最后,基于单细胞测序技术和用于微生物基因组突变分析的更全面和更智能的生物信息学流程的进展将极大地推动所有旨在了解复杂宿主相关群落背景下的微生物进化的研究。