lol比赛押注平台(中国)官方网站 - app下载
lol比赛押注平台(中国)官方网站前瞻性观点丨Nature子刊(IF:41):研
发布:2024-04-16 18:09:23 浏览:

  lol比赛押注平台(中国)官方网站前瞻性观点丨Nature子刊(IF:41):研究宿主遗传学对肠道微生物组影响的挑战和未来方向前瞻性观点丨Nature子刊(IF:41):研究宿主遗传学对肠道微生物组影响的挑战和未来方向

  我们期望将系统遗传学(多组学)方法应用于人类基因组和肠道微生物组,包括表达、蛋白质组学、代谢组学和其他组学分析的整合,这将是未来更好地理解这一复杂的多界生态系统的必要步骤。

  肠道微生物组是一个复杂的生态系统,参与宿主的新陈代谢、免疫和健康等。虽然肠道微生物组成的个体间差异主要受环境因素影响,但一些肠道微生物是可遗传的,因此可以受到宿主遗传学的影响。在过去的5年中,发表了12项涉及1000多名参与者的微生物全基因组关联研究(mbGWAS),但在多项研究中只有少数基因位点得到了一致确认。本文讨论了mbGWAS的技术现状,重点关注该技术当前面临的挑战,如微生物组测量的异质性和效能问题,并阐述了微生物组遗传分析的潜在发展方向。

  价格实惠的大规模基因分型方法和多重测序技术的发展推动了遗传学的进展。自2007年以来,全基因组关联分析(GWAS)已成为群体遗传学和遗传流行病学的常规分析,确定了数千个与复杂性状相关的基因变异。同时,新一代测序技术一改传统微生物学研究,使我们从单一微生物研究转为研究整个微生物群落,包括共生体功能体系统,即微生物群及其宿主。现在可以使用第二代和第三代测序技术对人类肠道中的微生物群落(肠道微生物组)的组成进行有效量化。目前,有两种主要方法被广泛应用于微生物定量:16S rRNA基因测序(16S)和宏基因组测序(MGS)。16S测序技术主要是对细菌16S rRNA基因的高度多态域进行靶向测序,该技术可以在属水平上对细菌和古细菌进行合理准确的注释。相比之下,MGS对样品中存在的所有遗传物质进行测序,可以将微生物分类群注释至物种和菌株水平,从而能够对包括病毒、真菌和原生动物在内的其他分类群进行分析。MGS还可以对单个微生物基因和基因家族的丰度进行估计,可以将其整合以量化功能通路和功能簇,包括特定外源性物质的生物合成途径和抗生素抗性和毒性基因的功能簇。 在过去的5-10年中,肠道微生物组是中规模最大,多样性最高的微生物群落,一直是微生物组研究的热点,现在已确定其含有数百种微生物。众所周知,肠道微生物组具有显著的个体间差异:只有少数属或种(少于20种)在超过95%的个体同存在,这些共享的微生物群被称为核心微生物组。随着对大规模队列的分析,更多新的、罕见的细菌被发现,共享细菌的数量也在持续减少。在最近的案例中,对8,208个荷兰人的宏基因组研究发现了733个细菌物种(尚未进行同行评议),对5,959个芬兰人的分析确定了1,123个细菌物种,对来自不同人群和身体部位(主要来自粪便)的9,428个宏基因组的分析确定了4,930个物种水平分类群。

  许多研究表明,肠道微生物组的个体间差异主要由环境因素决定,如饮食、药物、吸烟、宠物和其他因素等。然而,在双胞胎、家庭和人群中的研究发现了一些肠道微生物具有遗传性,而可能的遗传成分对于理解宿主-微生物相互关系和共同进化很有意义。在本篇前瞻性观点中,我们总结了目前来自GWAS(mbGWAS)的关于宿主遗传学对肠道微生物组影响的认识,估计了遗传分析对不同丰度微生物的检测能力,并讨论了微生物组遗传研究的未来前景。

  宿主遗传学对微生物组的影响的研究始于2014-2015年的几项小规模研究(100人)。2016年,对来自TwinsUK队列的1,126对双胞胎进行了遗传分析和mbGWAS,确定了一部分肠道微生物具有相当大的遗传力:945个报告的分类群中有90个(9.5%)遗传力(h2)大于0.20,这些遗传力估计后来在加拿大和荷兰的家庭研究中得到证实,且这些值处于许多其他人类复杂性状的遗传力范围内,如空腹血糖水平(h2 = 0.31)、胰岛素水平(h2 = 0.25)和血压(h2 = 0.15)。在TwinsUK的研究中,克里斯滕森菌科(Christensenellaceae)及其近缘类群的遗传力最强,这也与个体的代谢参数有关。其他可遗传细菌包括双歧杆菌,其丰度与乳糖酶基因(LCT)附近的功能基因变异有关,这一发现最近被其他研究证实。2016年,荷兰、加拿大和德国人群中的三个mbGWAS报告了数十个基因位点与各种细菌的丰度和其他微生物组特征(β-多样性、微生物通路和细菌存在)的关联。这些研究的结果包括几个相关的基因,如编码C型凝集素的基因和维生素D受体基因。C型凝集素已知可调节虾和蚊子体内的微生物群组成。然而,除了LCT位点外,这些结果都没有在mbGWAS中得到复现。过去的几年里,也有其他一些研究探讨了宿主遗传学对微生物组组成的影响。到目前为止,已经有12项mbGWAS发表,包括了近或超过1000名参与者(表1和图1)。这12项研究都报告了许多在全基因组显著性水平上的结果(P5×10-8),但只有两个位点,即LCT和ABO的结果在至少三项研究中得到了一致的复现(附表1和2以及补充说明)。

  图112项微生物组GWAS发现的具有全基因组显著性的基因组位点。该图展示了用彩色六边形注释的染色体示意图。每个六边形代表一个本文讨论的12项研究中至少两项发现的在全基因组显著水平上有相关性的基因组区域。根据在同一基因组区域报告结果的研究数量对六边形着色,并标记位于这些位点的基因。FUT2基因的位置被突出显示。染色体长度和条带是根据美国国家生物技术信息中心的基因组信息页面描述的,并参考基因组构建GRCh37/hg19。值得注意的是,在两项研究中,n = 2的研究报告的位点中,没有一项在报告它们的两项研究中与同一科的细菌相关,其相应的最佳结果处于弱LD(千人基因组计划中欧洲人的r2 0.1,NMNAT3位点除外,其r2为0.34)。

  据报道,LCT基因内或附近的基因变异与放线菌(Actinobacteria)、双歧杆菌属(Bifidobacterium)及其近缘物种有关。在英国、荷兰、加拿大和芬兰人群以及MiBioGen联盟的meta分析中,已经报道了这种关联的全基因组显著性。尽管其他队列研究表明这种关联的显著性水平较低,但该位点也成为迄今为止微生物数量性状位点(mbQTL)研究中最有效的发现。事实上,双歧杆菌是英国和荷兰人群研究中遗传性最强的类群之一。LCT基因附近的功能变体rs4988235(NC_000002.12:g.135,851,076GA)或其替代基因与双歧杆菌的相关性最强。LCT编码乳糖酶,可将牛奶乳糖分解为葡萄糖和半乳糖。rs4988235*G/G基因型与乳糖酶非持久性表型相关,即断奶后乳糖代谢能力下降。由于动物驯化和断奶后牛奶摄入,这些等位基因一直处于选择压力之下,这导致乳糖酶持久性等位基因的频率增加。有趣的是,乳糖酶非持久性基因型与具有降解乳糖能力的肠道双歧杆菌的丰度较高有关,而且这种联系取决于牛奶的摄入量。

  德国、荷兰和芬兰人群队列研究已经报道了与ABO位点相关的微生物组。有趣的是,各研究中的潜在关联和报道的类群并不相同。在德国队列中,ABO位点的两个独立SNPs与粪杆菌(Faecalibacterium)和拟杆菌(Bacteroides)的丰度相关。在芬兰队列中,ABO附近的部分连锁不平衡(LD)变异与Faecalicatena lactaris和Collinsella的丰度相关。而在荷兰人群中,相同的和其他LD变异与双歧杆菌丰度、乳糖降解通路和Collinsella丰度相关。除此之外,在猪中也报道了ABO位点与肠道微生物组的关联,其中一个使ABO基因失活的常见缺失突变与Erysipelotrichaceae的丰度相关。 尽管相关的细菌类群存在差异,但三项人群研究都确定了ABO和FUT2变异与细菌丰度之间的相互作用:FUT2基因的无义突变(rs601338,NC_000019.10:g.48,703,417GA)决定了ABO抗原在粘膜细胞上的表达。具体来说,G等位基因纯合型的个体(rs601338*G/G基因型)粘膜(包括肠道粘膜)上不表达或暴露ABO的A或B抗原。这些个体被称为非分泌者。在所有的研究中,ABO对与之相关细菌的影响都取决于宿主的分泌状态。与早期对克罗恩病患者的结肠微生物组、原发性硬化性胆管炎患者的胆汁微生物组及其他的小型研究类似,德国的大型队列研究也报告了FUT2位点的提示性关联,虽然科学家们预期FUT2基因的分泌状态与肠道微生物组有关,但这一结果只在一项研究中观察到全基因组的显著水平。这些结果以及ABO和FUT2位点的基因-基因相互作用分析的一致结果表明,随着样本量的增加,该位点将在未来的研究中继续被发现。

  除了LCT和ABO位点外,在12项研究中,至少有一项报道了另外546个位点的P5×10-8(图1和附表1)。其中,有11个位点在两项研究中报告,并指出了潜在的有趣的候选基因。例如CD5,它在T细胞增殖、存活以及其他免疫功能中发挥作用,以及RBP1,其蛋白产物参与视黄醇(维生素A醇)从肝脏到周围组织的运输。然而,目前还不清楚这11个位点是否可以在不同研究中复现。事实上,在报告这些位点的两项研究中,没有一个位点与同一科的细菌具有相关性,而且它们相应的最佳结果都处于弱LD(千人基因组计划中欧洲人的r2 0.35)。 我们猜测存在与这些和其他分类群相关的其他遗传信号。MiBioGen联盟和荷兰的一项人群研究都发现了显著性和暗示性的结果数量与微生物的遗传性之间存在正相关,这表明需要更大的样本量(因此需要更高的效能)来识别更多的遗传位点。

  大多数由mbGWAS检测到的全基因组关联的可重复性差,这是生物学现实和长久以来方法学问题的结果。微生物群落包括数百个物种,但只有少数物种存在于几乎所有的样本中,而许多物种只存在于部分群落中。根据人群队列结果估计,大多数细菌类群存在于不到50%的样本中,这导致遗传分析的有效样本量减半。 正如经典GWAS首次指出的那样,群体异质性也会干扰结果的复现,并导致假阳性或假阴性关联。例如,FTO位点与2型糖尿病(T2D)的相关性的复现率出乎意料的低。后来发现,FTO变异型实际上对体重指数产生影响,而不是直接对T2D产生影响。因此,在体重指数匹配的病例-对照队列中,没有发现FTO对T2D的影响。考虑到微生物组在很大程度上受饮食和环境的影响,群体异质性也可能在mbGWAS中发挥主要作用,不匹配的队列可能会表现出不同研究间的低复现率。除了这些生物学因素,与样品处理和宏基因组数据处理有关的多种方法学问题也可能导致低复现率,我们将在下面讨论。

  此外,在分析成百上千的微生物组性状时,经典的全基因组显著性阈值P5×10-8可能过于宽松,因此应该考虑一个多次检验的全研究范围的阈值。事实上,在较大的mbGWAS中,LCT和ABO这两个跨队列可复现的位点是唯二通过这一更严格阈值的位点,唯一的例外是在芬兰人群中发现的MED13L基因附近的信号。然而,这个变异型在非芬兰人群中非常罕见(在非芬兰欧洲人的基因组集合数据库中,次等位基因频率为0.0003),因此没有在非芬兰队列中检测该位点。

  对更严格的阈值的要求强调了需要更大的样本量来检测强有力的关联和额外的位点。这个概念似乎很明显,因为这是我们经过15年的GWAS所学到的东西。在最初仅在几百个样本中发现具有较大影响的相关位点后,GWAS迅速转向使用几千个样本的数据集,现在一些GWAS具有超过一百万的个体。与人类定量表型相比,mbGWAS对巨大样本的需求更加迫切,因为大多数细菌存在于10%的样本中。然而,由于事先并不清楚它们的效应值,因此对于检测新的mbGWAS位点所需的最小样本数没有绝对的估计。在这种情况下,一个好的指导原则是估计在给定样本量下的最小可检测效应,它取决于性状的遗传结构,而不是严格地取决于它的遗传性。例如,即使是高度遗传的性状,如身高(h2≈0.8-0.9),个别常见变异(如位于HMGA2和GDF5位点的变异)仍只占总变异的0.3-0.7%,而对于其他遗传力估值较低的性状,如胎儿血红蛋白(h2≈0.6),已经发现了非常大的效应量(BCL11A基因的常见变异解释了胎儿血红蛋白水平8-14%的变异)。

  以前和最近的mbGWAS的结果可用于估计微生物组性状的最大效应的上限,因此我们能够推测出检测更多位点所需的样本量。例如,LCT位点与青春双歧杆菌(Bifidobacterium adolescentis)的相关性解释了0.8%的变异,这意味着至少需要20,000个样本才能检测到在一个位点上的关联,该位点解释的效应量是该值的一半(0.4%)。青春双歧杆菌是一种常见的细菌(存在于80%的样本中)。而对于不太常见的细菌种类(流行率为10-50%),需要一个约含有30,000-135,000个样本的数据集才能检测类似的遗传效应(图2)。然而,在其他微生物类群中可能存在具有较大效应的相关遗传变异。例如,对于两歧双歧杆菌(Bifidobacterium bifidum,双歧杆菌科的另一种细菌物种,仅在26.3%的样本中存在),ABO位点的遗传变异可以解释2.7%的变异。虽然这一估计可能由于“赢家的诅咒”现象而被夸大,或由于未计算基因-环境相互作用而被高估,但它确实表明,支撑微生物性状的多基因结构是复杂的,并可能在微生物类群之间存在很大差异。

  图2 不同类群流行率的效能分析。a, 根据荷兰微生物组计划的结果,饼状图展示了在研究队列中可检测到的不同流行率的细菌类群的比例。b, 在效能为80%和P值1×10-10的情况下,检测不同类群流行率的遗传效应(解释方差(var.)(x轴))所需的总样本量(y轴)。类群的流行率参见a)中的颜色图例。对于流行率为q的分类群,待研究队列所需的总样本量(ntot)计算为ntot=neff+neff×(1-q)×q-1,其中neff是检测遗传效应所需的有效样本量估值。遗传效应在这里用方差表示,解释了加性效应大小和次等位基因频率的变化。阴影区域(使用a中所示的颜色和流行率)表示对特定流行率范围的估值。虚线%的效应lol比赛押注平台(中国)官方网站,即Lopera等人观察到的青春双歧杆菌上LCT位点变异型效应的一半。Min.,最小值。

  除了需要更大的样本量外,其他几个因素对未来mbGWAS研究的成功也很重要。技术上的改变,如使用不同的DNA分离方法、16S结构域的选择或使用不同的分析流程和16S扩增子数据的参考数据库都会大大影响微生物鉴定和丰度的结果。例如,MiBioGen联盟对可变区域V3和V4进行测序的各种队列中,25-35%的个体存在古细菌,但在使用可变区域V1和V2的队列中,根本没有检测到。MGS方法原则上应该具有非常高的分辨率,可以鉴定微生物分类群到菌株水平。但是,目前广泛使用的基于参考序列的方法(即MetaPhlAn或Kraken)并不能提供完整准确的分类学注释。这些技术差异可以部分解释遗传性分析的低复现率。例如,克里斯滕森菌科(Christensenellaceae)在双胞胎研究中被发现是最具遗传性的细菌,但它在MetaPhlAn2中不存在lol比赛押注平台(中国)官方网站,因此在许多MGS研究中没有被分析过。理论上讲,宏基因组从头组装流程应允许识别许多新物种,但它们需要极高的样本读长覆盖率来组装低丰度的微生物基因组。还可以通过使用更好的测量方法,如可减小获得的微生物组成偏差的DNA提取试剂盒、样品中微生物细胞的量化和更长的测序读长以及其他方法,也可以获得更精确的微生物组特征信息。

  正如我们所讨论的,为了确定足够的基因位点,并超越目前建立的位点,数万个微生物组样本的规模很有必要。可以对目前可用的和即将可用的中等规模的MGS队列进行荟萃分析,分析大约20,000-30,000个样本,但这种方式的前提是各研究的分类要统一。此外,利用性状间的相关性来减少表型变异的多性状GWAS方法也可用于增加效能。

  迄今为止,mbGWAS大多关注微生物组的组成,即微生物分类群丰度或微生物功能丰度,例如微生物通路。然而,我们还需要认识到,肠道微生物组的功能可能不仅体现在某些物种或代谢通路的丰度上,还体现在微生物基因组的基因变异上。肠道微生物组包含的基因数是人类基因组的100-1000倍,其基因集可以通过突变动态地适应环境暴露和变化。有证据表明,在全球人类人口扩张的过程中,肠道微生物组已经与人类基因组共同适应了环境。细菌基因组可以发生突变,但宿主可以通过选择压力维持并将细菌基因变异遗传给下一代。此外,由于受相同的环境暴露的选择,人类基因组和肠道微生物组中基因变异的共同出现也是可以预测的。

  微生物组基因变异的关联分析面临着几个挑战。首先,尽管在技术上对于MGS数据而言是可行的(图3),但是肠道微生物组本身的基因图谱在很大程度上仍未被探索。主要的尝试性研究包括Schloissnig等人的研究揭示了252个粪便样本中的1030万个SNPs和许多其他类型的基因变异,以及Xie等人的研究揭示了超过800万个细菌SNPs的图谱,并显示双胞胎之间有较高的相似性,在分开生活几十年后缓慢下降。最近,Zeevi等人开发了SVfinder流程,并报告了肠道微生物组中7000多个结构变异。这些研究为探索细菌SNPs和结构变异谱奠定了基础。此外lol比赛押注平台(中国)官方网站,还有人开发了一些生物信息学工具,从MGS读长中发现SNPs,例如metaSNV和inStrain。此外,一般基于概率的SNPs获取工具,如HaplotypeCaller,也可用于鉴定细菌SNP,具有很好的准确性和敏感性。未来,长读长测序、单细胞微生物测序和微生物分离株的深度测序应该为微生物基因变异的鉴定提供更高的准确度和分辨率。其次,细菌基因组的突变率通常为每代0.001左右,但不同物种之间差异很大。因此,对宿主遗传与细菌遗传变异相互作用的分析应侧重于那些具有时间稳定性的遗传变异。最近的一项研究评估了338人4年来的肠道微生物组的遗传稳定性,并确定了几个物种,它们的基因组成具有个体特异性和时间稳定性。微生物基因组成的个体特异性不仅可以归因于环境暴露情况,也可以归因于宿主遗传学。有趣的是,在生命早期通过母婴传播定植于肠道的细菌物种在时间上是稳定的,并且具有很高的遗传力,例如双歧杆菌物种。第三,微生物基因变异的关联分析,而不是对其丰度或存在与否的关联分析,带来了优势和挑战。这种方法的优点是以更高的分辨率定义更具体的微生物表型,类似于疾病的内表型分析,这可以提高小样本分析的效能。它的缺点在于需要进行的统计检测数量增加,这将对检测效能产生负面影响,这已经是mbGWAS的最大问题。基因变异的数量可能达到数百万甚至数万亿的规模,这比已确定的共同分类群和通路的数量要大得多。我们设想,在短期内可达到的样本量下,对微生物基因组使用降维方法(例如,关注单倍型或编码SNPs)将是一个有趣的途径,以获得对人类遗传-微生物遗传关联的早期认识。

  图3 从MGS中表征微生物组成和基因图谱。从MGS数据中获得的关于微生物组组成、功能通路和细菌基因组基因变异的信息示意图。

  值得注意的是,组学方法也被扩展到微生物组领域。例如,宏转录组和宏蛋白组数据已经提供了与炎症性肠病和结肠癌有关的细菌通路的信息。粪便代谢组学可以被认为是肠道微生物组的功能输出,它主要是由肠道微生物组(而非宿主遗传学)决定。相比之下,血浆代谢组通常被看作是宿主-微生物相互作用的结果。因此,微生物组的组学输出可以被视为细菌内表型,以评估宿主遗传学对微生物活性和功能的影响。当使用代谢组数据作为微生物的分析数据时,必须认识到不同的场景面临不同的挑战。首先,区分仅由微生物组产生的代谢物和同时受宿主遗传学和微生物组调控的代谢物非常重要。例如,短链脂肪酸、一些维生素家族和必需氨基酸只能从饮食中获得或由微生物组产生。然而,一些代谢物的合成,如次级胆汁酸(BA)和氧化三甲胺的合成需要酶,其生产由人类基因组和肠道微生物组共同调控。对于这些代谢物,重要的是要分清遗传学和微生物组的影响。例如,在我们最近的研究中,我们评估了宿主遗传因素和微生物对BA代谢的影响,我们用次级BA与初级BA的比例来校正人类酶的活性。第二,即使是微生物调控的代谢物,它们在粪便或血液中的丰度水平仍然是人类基因组和肠道微生物组的结果,并取决于微生物的活动和宿主的吸收、运输和消除。例如,95%的短链脂肪酸被结肠细胞吸收并作为能量来源使用,而只有5%在粪便中分泌。与这些代谢物的遗传关联可能不仅指向参与微生物活性的基因,而且还指向参与代谢物的吸收、使用、运输和清除的基因。第三,当我们考虑将代谢作为微生物的分析方法时,饮食是一个重要的混杂因素。氧化三甲胺和短链脂肪酸的产生在很大程度上取决于肉类和纤维的摄入,但在mbGWAS分析中要校正饮食往往很困难,因为在大型队列中精确测量饮食成分仍不切实际。

  除了增加研究样本量、对分类群进行定量分析和关注微生物遗传学等途径外,还可以通过研究肠道生态系统中大部分尚未探索的非细菌群落,包括病毒、真菌和原生动物,以获得更多的认识。尽管肠道中的病毒数量与细菌数量相似,但病毒组测序覆盖率低、缺乏通用的病毒组分析标记基因,使得病毒的研究具有挑战性。可以应用病毒群特异性分离方案,但这些方案很耗时。此外,由于病毒比细菌更具有个体特异性,因此这些分析需要比mbGWAS更大的样本量。

  肠道微生物组遗传学仍然处于起步阶段,在复杂的人类性状方面与早期GWAS有许多相似之处。我们可以预测,过去15年从GWAS中吸取的教训,如需要更大的样本量和使用内表型,将帮助我们获得新的结果。数据共享和合作将GWAS结合到荟萃分析中是推动人类复杂性状遗传研究取得进展的主要因素。因此,我们鼓励微生物组遗传学领域的研究人员接受这些科学实践。 可以想象的是,即使有非常大的样本量,可由GWAS解释的宿主遗传学对肠道微生物组的总体影响仍将是不强的,可能在1-10%的变异范围内。

  尽管如此,我们相信,确定影响肠道微生物组的其他宿主遗传因素,即使是那些影响较小的因素,将为复杂的宿主-微生物组相互作用提供重要的见解,并可以为治疗和个性化治疗提供信息。例如,LCT位点的功能变异的影响相当小,约为双歧杆菌物种丰度变异的0.8%,然而双歧杆菌与许多条件相关,包括对抗癌治疗的反应。因此,将基因和微生物组筛查结合起来,有助于改善个性化治疗和预测药物反应。我们期望更大规模的研究将提供足够的效能来调查罕见变异的作用,从而确定其他功能变异,这可能为揭开药物反应的异质性或开发旨在调节特定微生物的药物提供线索。最后,我们期望将系统遗传学(多组学)方法应用于人类基因组和肠道微生物组,包括表达、蛋白质组学、代谢组学和其他组学分析的整合,这将是未来更好地理解这一复杂的多界生态系统的必要步骤。