基于肠道微生物组与机器学习的非侵入性结直肠癌及腺瘤早期筛查新策略

【字体: 时间:2025年10月10日 来源:Gut Pathogens 4

编辑推荐:

  本刊推荐:为解决结直肠癌(CRC)早期筛查工具侵入性强、灵敏度不足的问题,研究人员开展了基于肠道微生物组的机器学习(ML)模型研究。通过分析多队列16S rRNA测序数据,利用ANCOM-BC和随机森林(RF)算法鉴定出109个微生物标志物,构建的模型在内部验证(AUC=0.90)和外部验证(AUC=0.82)中均表现优异,并开发出微生物风险评分(MRS)。该研究为CRC早期筛查提供了可推广的非侵入性新方案。

  
结直肠癌(Colorectal Cancer, CRC)是全球癌症相关死亡的主要原因之一,但早期检测可以显著改善患者预后。目前常用的筛查工具,如结肠镜检查和粪便免疫化学测试(Fecal Immunochemical Test, FIT),要么具有侵入性,要么对早期病变的敏感性不足。因此,开发一种准确、非侵入性且易于接受的CRC筛查替代方案成为临床的迫切需求。近年来,越来越多的证据表明肠道微生物组的失调在结直肠癌发生中起着关键作用,通过慢性炎症、代谢物改变和微生物基因毒素(如BTGX)导致DNA损伤等机制介导癌变。微生物如具核梭杆菌(Fusobacterium nucleatum)和牙龈卟啉单胞菌(Porphyromonas gingivalis) consistently与CRC发展相关,这使它们有潜力成为非侵入性CRC和腺瘤检测的生物标志物。
为了应对这一挑战,Tsai等研究人员在《Gut Pathogens》发表了一项研究,通过整合多个人群队列的肠道微生物组数据与先进的机器学习技术,开发了一种新型筛查流程,能够准确检测早期CRC和结直肠腺瘤。该研究不仅鉴定了可靠的微生物生物标志物,还引入了受多基因风险评分(Polygenic Risk Score, PRS)启发的微生物风险评分(Microbial Risk Score, MRS),以基于微生物组谱量化CRC风险。这一创新方法旨在显著增强非侵入性CRC筛查,提高早期诊断率,并最终改善患者预后。
研究人员为开展本项研究,主要应用了以下关键技术方法:收集了来自北美和东亚的五项公开16S rRNA测序数据集(包括Baxter、Dadkhah、Zackular、Yang和Cong队列),使用EasyMAP和QIIME2流程进行数据预处理和扩增子序列变异(ASV)生成;采用偏误校正的微生物组组成分析(ANCOM-BC)和卡方检验进行差异丰度分析和特征选择;利用随机森林(RF)分类器构建预测模型,并通过10折交叉验证和外部验证评估性能;开发微生物风险评分(MRS)以量化风险,并在独立队列中验证其可移植性。
Gut microbial composition differentiates control, adenoma, and CRC groups
通过分析来自对照组、非晚期腺瘤、晚期腺瘤(AA)和CRC患者的粪便微生物组谱,主成分分析(PCA)显示CRC组与对照组/腺瘤组之间存在明显分离。在门水平上,厚壁菌门(Firmicutes)、拟杆菌门(Bacteroidetes)、变形菌门(Proteobacteria)、放线菌门(Actinobacteria)和疣微菌门(Verrucomicrobia)在所有组中均占主导地位,且CRC组中厚壁菌门与拟杆菌门(F/B)比率显著升高,表明存在促炎性生态失调,并与CRC风险增加相关。
Identification of microbial biomarkers for CRC and adenoma screening
差异丰度分析鉴定出对照组、腺瘤和CRC组之间的关键微生物生物标志物。细菌属的对数折叠变化计算显示,多个类群在CRC样本中显著富集。排名最高的属包括卟啉单胞菌属(Porphyromonas)、消化链球菌属(Peptostreptococcus)、 parvimonas属、 fusobacterium属、嗜血杆菌属(Haemophilus)、 atopobium属和柯林斯菌属(Collinsella)。经过错误发现率(FDR)校正和原始p值过滤后,共鉴定出109个生物标志物,其中七个最具 discriminative 的属被选为代表特征并纳入下游机器学习模型开发。
相对丰度分析进一步揭示了CRC样本中富集的属。卟啉单胞菌属、消化链球菌属、 parvimonas属、 fusobacterium属和柯林斯菌属在CRC中富集, corroborating 其报告的促肿瘤作用,而嗜血杆菌属和atopobium属在腺瘤中更丰富,表明其参与早期肿瘤变化。
Performance of microbial ML models in CRC and adenoma screening
使用选定的微生物特征在Baxter和Dadkhah数据集上训练随机森林分类器,并在Zackular数据集上进行外部验证。对于CRC与对照分类,模型在10折交叉验证中曲线下面积(AUC)为0.90(95% CI: 0.869-0.931),在外部验证中为0.82,内部和外部特异性均超过0.95。腺瘤与CRC模型也表现出强劲性能(AUC 0.90内部;0.84外部)。相比之下,对照与腺瘤分类的准确性较低(AUC 0.63内部;0.62外部)。将腺瘤和CRC组合并与对照组比较时,敏感性提高(内部0.87;外部0.97),但特异性降低。
CRC risk stratification using MRS
为量化基于微生物组的CRC风险,研究人员开发了一个包含七个关键微生物生物标志物的MRS。该评分在Baxter数据集中构建,并在独立Zackular数据集中验证,显示出强大的区分能力,能够显著区分CRC与腺瘤和对照组。在两个队列中,CRC样本的MRS值始终显著高于非CRC组。
该研究通过偏误感知的生物标志物发现结合随机森林建模和可解释的MRS,证明肠道微生物组特征能够可靠地区分CRC和腺瘤与健康状态,分层个体风险,并补充现有筛查策略。研究保持了在独立队列中的高特异性,同时揭示了在真实世界患病率条件下检测早期病变的敏感性挑战。MRS在北美和东亚人群中的可重复性强调了其作为非侵入性、可推广风险分层工具的潜在效用。持续改进——特别是提高对早期病变的敏感性——和前瞻性验证应有助于临床采用,最终增强个性化监测并改善结直肠癌结局。该微生物组框架旨在补充而非替代FIT等既定筛查工具, proposed 了一种实用的两步 pathway:FIT用于人群筛查,随后进行反射性微生物组检测以分类临界或FIT阴性结果,从而在不显著增加成本的情况下改进早期检测。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号