
-
生物通官微
陪你抓住生命科技
跳动的脉搏
意大利结核分枝杆菌全基因组测序数据集:揭示遗传多样性及耐药谱系的国家级资源
【字体: 大 中 小 】 时间:2025年04月16日 来源:Scientific Data 5.8
编辑推荐:
编辑推荐:本研究针对意大利结核病(TB)防控需求,由多机构团队完成2520株结核分枝杆菌复合体(MTBC)全基因组测序(WGS),构建了该国最大公开数据集。通过MTBseq分析揭示Lineage 4(73.5%)为主导谱系,发现94株利福平耐药(RR-TB)及83株耐多药(MDR-TB)菌株,鉴定出18%传播簇(5-SNP阈值),为TB流行病学监测和耐药机制研究提供高分辨率基因组资源。
结核病至今仍是全球重大公共卫生威胁,每年导致上百万人死亡。随着耐药结核株的蔓延,这场人类与结核分枝杆菌的拉锯战变得愈发艰难。在意大利这个结核病低流行国家,人口流动、医疗资源不均等因素正悄然改变着疾病传播格局。更令人担忧的是,某些具有"超能力"的菌株谱系(如Lineage 2北京家族),不仅擅长躲避药物攻击,还具备更强的传播本领。要破解这些"隐形敌人"的作战策略,科学家亟需高精度的基因情报——这正是全基因组测序技术大显身手的舞台。
来自圣拉斐尔生命健康大学等十余家机构的研究团队在《Scientific Data》发表了迄今意大利最大规模的结核分枝杆菌基因组图谱。这项研究如同给细菌安装了GPS追踪系统,对2017-2020年间四个主要地区(伦巴第、拉齐奥等)的2520株临床分离株进行全基因组解码,绘制出精细的基因变异地图。通过MTBseq分析流程,团队不仅捕捉到导致药物失效的关键突变,还重建了细菌的"社交网络"——那些紧密相关的菌株如何在人群中隐秘传播。
研究采用多中心协作模式,从2935例培养阳性样本中筛选2520株进行全基因组测序。DNA提取采用Maxwell 16系统或QIAamp试剂盒,使用Illumina Nextera XT和IonTorrent平台构建文库,平均测序深度≥20×。生物信息学分析通过MTBseq流程完成,包括质量过滤、H37Rv参考基因组比对、变异检测等步骤。耐药预测依据WHO 2023突变目录,系统发育分析采用RAxML-NG构建。所有数据经严格质控后存入NCBI SRA和Zenodo。
研究团队构建的这份基因组"花名册"显示,Lineage 4(欧洲-美洲谱系)占据绝对优势(73.5%),其下Haarlem、T和LAM亚型构成主要分支。值得注意的是,7.4%的菌株属于臭名昭著的Lineage 2北京家族,这个与耐药性密切相关的谱系还形成了研究中最大的传播簇(35株)。在耐药战场上,3.7%的菌株对利福平亮起红灯,其中88.3%同时对抗异烟肼(即MDR-TB),更有23.4%的MDR菌株对氟喹诺酮类耐药,晋级为pre-XDR-TB。
样本覆盖意大利四个流行病学关键区域,通过标准化流程确保数据可比性。研究特别采用"--lowfreq_vars"参数提升低频突变检测灵敏度,这对发现耐药亚群至关重要。伦理审批由斯帕兰扎尼传染病研究所监管(批号46/2019),所有数据经过去标识化处理。
这个立体化的数据库不仅包含原始序列(NCBI SRA: SRP538783等),还整合了临床元数据如HIV状态、解剖部位等。研究者特意将传播簇判定阈值设为5个SNP,这个黄金标准帮助识别出84个传播网络,涉及432株菌株。
从DNA提取到变异呼叫的每个环节都设有"安检门"。文库大小经生物分析仪确认,测序错误率通过Phred分数监控,变异检测用已知菌株校准。耐药预测与表型药敏结果比对显示高度一致,特别是对bedaquiline和linezolid等新药的耐药突变检测。
这项研究如同为意大利结核防控安装了基因组雷达,其价值体现在三个维度:首先,建立的2520株菌株资源库将成为比较基因组研究的基准;其次,明确的谱系-耐药关联为精准治疗提供路线图;最后,传播簇分析揭示了潜在的防控漏洞。随着数据不断被挖掘,这份蓝图将指导更智能的监测策略,特别是在应对北京谱系等"高危分子"时。研究者特别指出,84.2%的拉齐奥地区菌株覆盖率提示其他区域仍需加强测序能力,这正是未来攻关方向。
生物通微信公众号
知名企业招聘