中国人群肠道微生物基因组扩展图谱揭示与生理特征相关的人群特异性基因组特征
《Genome Medicine》:Expanded gut microbial genomes from Chinese populations reveal population-specific genomic features related to human physiological traits
【字体:
大
中
小
】
时间:2025年11月02日
来源:Genome Medicine 11.2
编辑推荐:
语
本研究针对当前肠道微生物参考数据库严重偏向欧美人群(占比超70%)的问题,构建了涵盖47.8万高质量基因组的人类肠道微生物参考集(GMR),包含6664个物种(26.4%为新发现物种)和超2000万独特蛋白质。研究发现中西方人群存在35.35%与32.46%的独有物种,74%的共享物种呈现人群特异性遗传分层,且新基因组整合使物种检测率提升最高达23%。该资源为解析肠道微生物在区域健康差异中的作用提供了关键数据支撑。
随着微生物组研究的深入,人类肠道中数以万亿计的微生物及其代谢活动对人类健康的影响日益凸显。然而,当前肠道微生物参考基因组数据库存在显著的地理偏差——超过70%的数据来源于欧美人群,而中国等东亚人群的贡献不足30%。这种代表性不足可能导致在针对中国人群的研究中系统性遗漏特有微生物类群,进而影响对肠道微生物多样性和功能异质性的全面解析。尤其值得注意的是,物种内遗传多样性对微生物定植、代谢及致病性具有关键作用,但针对中国人群的菌株水平基因组比较研究仍较为缺乏。
为解决这一问题,董全斌、马贝宁等研究团队在《Genome Medicine》发表了题为“Expanded gut microbial genomes from Chinese populations reveal population-specific genomic features related to human physiological traits”的研究论文。该研究整合了来自中国和非中国人群的47.8万高质量肠道微生物基因组,构建了人类肠道微生物参考集(GMR),并通过物种聚类、功能注释及人群比较分析,揭示了中西方人群在微生物组成、功能基因和抗生素耐药性等方面的显著差异。
- 1.从6657例中国人群宏基因组样本中组装18.1万个宏基因组组装基因组(MAG),结合已有数据库(如UHGG、CGR2、hGMB)进行质量筛选(完整性>50%,污染率<5%);
- 2.使用GTDB(Release 214)和dRep进行物种水平聚类(ANI>95%),构建非冗余基因组代表集;
- 3.通过Prokka、eggNOG-mapper和ResFinder进行功能基因、COG分类及抗生素耐药基因注释;
- 4.利用Roary和t-SNE分析共享物种的泛基因组和遗传结构;
- 5.将新物种标记基因整合至MetaPhlAn4数据库,并在独立队列(如CGMR、德国及非洲样本)中验证物种检测效能。
GMR共包含6664个物种级聚类,其中1762个为潜在新物种(占比26.4%)。中国人群特有物种达2356个(如Gemmatimonadota、Acidobacteriota等),非中国人群特有2163个,而双方共享物种仅2145个。在896个共享且丰度平衡的物种中,74%(225个)呈现显著的人群特异性遗传分层,其中Lachnospiraceae、Bacteroidaceae和Ruminococcaceae家族富集程度最高。例如,Lachnospira eligens_A的中国与非中国来源基因组在t-SNE分析中明显分离,4044个泛基因组基因(如mecI、mepA等抗生素耐药相关基因)驱动了这一差异。
研究预测了10.28亿个编码序列(CDS),平均每个基因组含2148个CDS。然而,47%的基因无法通过现有数据库(UniProt、RefSeq等)注释,凸显了肠道微生物功能认知的空白。聚类分析(90%氨基酸相似性)生成649万个共享蛋白簇,中西方人群特有簇分别为656万和726万个。COG注释显示,细胞壁/膜生物合成(5.81%)、转录(5.57%)和复制/修复(5.66%)为核心功能类别。
在5.2万个基因组中检测到1050个抗生素耐药基因(ARG),其中非中国人群的ARG检出率(10.97%)显著高于中国人群(10.76%)。四环素耐药基因(tet)最为常见,而dfrA1、aph(6)等在非中国人群富集,aac(6')-aph(2'')、erm(F)等在中国人群富集。一株中国来源的UBA7597 sp900542935甚至携带38个ARG,提示超级耐药菌的存在风险。
研究将579个GMR特有物种的标记基因整合至MetaPhlAn4数据库。在独立中国队列(n=1076)中,新数据库使物种检测数量提升22.8%(150个新物种), reads映射率平均提高1%。在欧洲(n=149)和非洲队列(n=179)中,物种检测率分别提升8.79%和13.41%,证实其跨人群适用性。
在CGMR队列(n=3234)中,465个新物种与年龄、居住地(城乡)、排便频率等22个表型关联分析发现325个显著相关性(FDR<0.05)。其中,Pseudoflavonifractor_A sp018374635丰度与年龄负相关(rSpearman=-0.26),Streptococcus infantis_I丰度与排便频率正相关(rSpearman=0.14)。多变量校正后,64个关联仍稳健,提示新物种在宿主生理调节中的潜在作用。
GMR资源通过大幅扩展中国人群肠道微生物基因组覆盖,揭示了物种组成、功能基因和遗传结构的人群特异性差异。其整合的标记基因数据库显著提升了微生物组检测灵敏度,为新物种与宿主健康关联研究提供了基础。该研究强调,在全球化背景下,构建平衡的微生物参考数据库对精准解析区域健康差异、开发个性化干预策略具有重要科学价值。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号