
-
生物通官微
陪你抓住生命科技
跳动的脉搏
南美微生物组档案(saMBA):通过研究被忽视人群丰富微生物组领域
【字体: 大 中 小 】 时间:2025年08月11日 来源:Nature Communications 15.7
编辑推荐:
为解决全球微生物组研究中南美人群代表性不足的问题,John F. Cryan团队创建了南美微生物组档案(saMBA)。该研究整合33项研究共2913个样本,首次系统揭示南美洲肠道菌群的高多样性特征,发现该地区存在2246个菌属(较既往认知翻倍),并开发了兼容全球微生物组数据库(HMC)的分析流程。这项工作为理解人类微生物组地理差异提供了关键数据,其开源工作流将促进欠发达地区的微生物组研究。
微生物组研究领域长期存在严重的样本偏倚——全球70%以上的公共微生物组数据来自仅占世界人口15%的欧美地区,而南美洲等发展中地区的样本严重不足。这种数据失衡不仅掩盖了人类微生物组的真实多样性,更可能影响针对区域性疾病的诊疗策略开发。尤其值得注意的是,南美洲居民拥有全球最高水平的肠道菌群多样性,但该地区在Human Microbiome Compendium(HMC)等主流数据库中仅占极小比例,且多数样本因"少于50个样本"的技术门槛被排除在外。
为填补这一空白,来自University College Cork的研究团队构建了首个南美微生物组专属数据库——South American MicroBiome Archive(saMBA)。通过系统筛查国际核苷酸序列数据库协作组织(INSDC)资源,研究人员手工筛选出33项南美肠道微生物组研究,涵盖13个国家中的9个,最终整合2913个样本(含73%首次被收录的研究)。研究采用与HMC完全兼容的生物信息学流程,确保数据可比性,并将全套分析代码开源共享。
关键技术包括:(1)通过欧洲核苷酸档案(ENA)系统检索INSDC数据库;(2)使用DADA227进行扩增子序列变异(ASV)分析;(3)建立Local Representation Index评估国家层面的样本代表性;(4)采用亚采样模拟评估区域菌群丰富度;(5)基于Jaccard距离量化国家内部菌群异质性。所有样本均来自Illumina测序平台,经严格质控保留非嵌合读段≥3.37×104/样本。
【saMBA揭示大陆尺度高生物多样性】
分析显示saMBA包含2246个菌属,较HMC报告的南美数据增加60%,其中876个菌属(96.2%)与HMC结果重叠验证了数据可靠性。α多样性指标显著高于全球平均水平:观察到的菌属中位数达72个(全球46个),Shannon指数2.7(全球2.0)。来自委内瑞拉亚马逊地区的样本表现出惊人多样性,单样本检出>150个菌属,印证非工业化人群菌群更丰富的假说。
【采样不均衡影响区域评估】
独创的Local Representation Index显示秘鲁(4.12)和厄瓜多尔(3.16)样本严重过饱和,而阿根廷(-9.79)和巴西(-2.89)显著不足。值得注意的是,阿根廷现有样本均来自工业化城市,暗示其真实菌群多样性可能被低估。Jaccard距离分析揭示秘鲁样本间差异最大,反映其包含亚马逊等特殊生态群体的采样特点。
【大陆生物多样性仍被低估】
亚采样分析表明即使已纳入2913个样本,南美菌群丰富度曲线仍未达平台期。特别在亚马逊原住民群体中,菌群多样性呈现持续上升趋势,预示现有采样远未覆盖区域全部微生物资源。研究人员强调,当前采样多集中在特殊群体(如腹泻患儿、营养不良儿童),可能扭曲整体多样性评估。
这项发表于《Nature Communications》的研究建立了首个南美微生物组综合数据库,其创新性体现在:(1)突破HMC的50样本限制,收录大量小型研究;(2)开发可量化国家代表性的新指标;(3)证实南美菌群多样性被持续低估的现状。saMBA不仅为理解人类微生物组地理进化提供新视角,其开源工作流更为其他欠采样地区(如非洲、东南亚)的研究树立范本。研究同时指出,未来采样应重点关注阿根廷等低代表性国家,并兼顾工业化与非工业化群体,才能真正揭示南美微生物组的全貌。
生物通微信公众号
知名企业招聘