
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于全基因组关联研究和机器学习的跨宿主传播潜力评估:布鲁氏菌近缘病原体宿主来源影响解析
【字体: 大 中 小 】 时间:2025年08月22日 来源:Communications Biology 5.1
编辑推荐:
这篇研究创新性地将全基因组关联研究(pan-GWAS)与机器学习(ML)算法结合,构建了支持向量机(SVM)预测模型,量化评估了11种布鲁氏菌(Brucella)的跨宿主传播潜力。研究通过991株菌株的全基因组数据,鉴定出268个与传播潜力相关的基因特征,首次揭示了宿主来源(如人源B. melitensis比牛羊源株更具传播风险)和菌株特异性(如家猪源B. suis biovar 2比野猪源株传播潜力更高)的显著影响,为病原体风险评估提供了高分辨率分析工具。
基因组分析揭示布鲁氏菌开放泛基因组特征
通过对991株布鲁氏菌全基因组数据的泛基因组分析,研究构建了包含582个核心基因、4121个附属基因和2462个独特基因的开放型泛基因组(γ=0.25)。独特基因中13.3%注释为DNA复制重组修复(COG-L类),其中73.6%源自B. inopinata菌株,暗示该菌株可能通过DNA甲基化修饰等表观遗传机制适应生态位转换。值得注意的是,B. neotomae菌株NCTC10070仅携带1891个附属基因,其2.9 Mbp的基因组显著小于其他菌株。
传统系统发育分析的局限性
基于核心基因构建的最大似然树显示,B. abortus和B. melitensis形成独立分支,而B. ovis非人兽共患菌株单独成簇。然而,系统发育分析无法明确区分B. ceti、B. neotomae等新发菌株的传播风险,凸显传统方法在近缘病原体风险评估中的分辨率不足。
机器学习模型的突破性表现
研究比较了五种监督学习算法,支持向量机(SVM)在测试集中展现出最优性能(平均马修斯相关系数MCC=0.78)。模型利用pan-GWAS筛选的268个特征基因,准确识别出人源B. melitensis菌株的传播潜力(决策值+1.11)显著高于牛羊源株(P<0.001),并成功预测家猪源B. suis biovar 2(+0.65)比野猪源株(-0.04)具有更高跨宿主风险(P<0.01)。
模型泛化能力验证
针对未参与训练的26株B. canis(唯一具有O-多糖缺失特征的潜在人兽共患菌),模型给出平均决策值+0.49,与近年人类感染病例报道相符。对海洋哺乳动物源菌株的预测显示,瓶鼻海豚源B. ceti(+0.57)比港湾海豹源B. pinnipedialis(+0.11)风险更高,提示需加强水生宿主监测。
关键基因的功能解析
SHAP方法鉴定出十大关键特征基因,其中group_1020(MXKDX重复蛋白家族)和group_1603(ABC转运ATP酶)均被PHI-base注释为"毒力增强"相关。值得注意的是,group_4450(尿素转运蛋白)在B. melitensis 16M的胃酸应激反应中上调,可能通过抵抗宿主胃部酸性环境促进感染建立。
公共卫生应用前景
该研究建立的SVM预测模型突破了传统系统发育分析的局限,首次实现布鲁氏菌属内跨物种传播潜力的量化评估。针对B. suis biovar 2从野猪向家猪的宿主转移趋势,模型预测的家猪源株高风险特征(较野猪源株提升69%)为防控策略制定提供了分子依据。未来通过整合单核苷酸多态性(SNP)等核苷酸水平特征,可进一步拓展模型在遗传多样性更高病原体中的应用。
生物通微信公众号
知名企业招聘