机器学习诊断症状性细菌性阴道病的群体预测差异研究

【字体: 时间:2025年08月01日 来源:npj Women's Health

编辑推荐:

  本研究针对细菌性阴道病(BV)诊断中存在的种族差异问题,通过16S rRNA测序数据和机器学习(ML)技术,系统评估了不同种族群体的预测性能差异。研究发现机器学习模型在黑人女性中表现较差,并揭示了不同种族群体间与BV诊断相关的显著差异菌群特征,为开发更公平的AI诊断工具提供了重要依据。

  

细菌性阴道病(Bacterial Vaginosis, BV)是全球育龄女性常见的阴道综合征,影响着数百万女性的健康。这种疾病不仅带来不适症状,更与多种不良妊娠结局、性传播感染(STI)风险增加以及宫颈癌等严重健康问题密切相关。然而,BV的诊断一直面临重大挑战——传统的Amsel标准和Nugent评分方法在面对复杂多样的阴道微生物组时,特别是在不同种族群体中表现出的微生物组成差异时,其准确性往往难以保证。更令人担忧的是,新兴的机器学习诊断技术可能无意中加剧现有的健康差异,这使得探究AI模型在不同人群中的公平性成为当务之急。

针对这一关键问题,来自美国的研究团队开展了一项创新性研究,成果发表在《npj Women's Health》上。研究人员利用220名症状性BV女性的16S rRNA测序数据,系统评估了四种机器学习算法(Random Forest, Logistic Regression, Support Vector Machine和Multi-layer Perceptron)在不同种族群体中的诊断表现。研究不仅揭示了模型性能的种族差异,还通过特征选择方法识别了群体特异性的关键细菌类群,为开发更公平的BV诊断工具提供了重要依据。

该研究采用了多项关键技术方法:基于Nugent评分的BV诊断标准(≥7为阳性);16S rRNA V3-V4区测序分析阴道微生物组;四种机器学习算法的比较评估;t-SNE降维可视化技术;以及多种统计特征选择方法(Gini Index, T-test等)用于识别重要细菌类群。研究数据来源于Srinivasan等人先前建立的包含多种族女性的队列。

模型性能的种族差异
研究结果显示,机器学习模型在不同种族群体中表现出明显差异。总体而言,模型在黑人女性中表现最差,平衡准确度(BACC)最低而假阳性率(FPR)最高。相比之下,白人女性的假阴性率(FNR)普遍较低。值得注意的是,Multi-layer Perceptron(MLP)模型在不同种族间的表现最为均衡,提示其可能更适合多群体应用场景。

配对种族训练的效果
研究人员尝试通过配对种族训练(paired-ethnicity training)来改善模型公平性。结果显示,针对特定种族群体优化的模型在该群体中表现更好,但跨种族应用时性能下降。例如,用白人女性数据训练的模型在白人群体中表现良好,但在其他种族中效果显著降低(p=0.048)。这一发现强调了开发群体特异性模型的重要性。

BV诊断的关键细菌类群
通过特征选择方法,研究识别出不同种族群体中与BV诊断最相关的细菌类群:

  • 白人女性:Eggerthella sp. type 1和Atopobium vaginae(Fannyhessea vaginae)
  • 黑人女性:Dialister sp. Type 2和Gardnerella vaginalis
  • 其他种族女性:Gardnerella vaginalis和Lactobacillus crispatus
    值得注意的是,Gardnerella vaginalis是所有种族共有的重要预测因子。

社区状态类型(CST)的分布差异
研究还发现不同种族女性的阴道微生物组构成存在显著差异。黑人女性中高多样性的CST IV型占比最高(56%),而白人女性则以L. iners主导的CST III型最为常见(39.2%)。这种微生物组成的差异很可能是导致模型性能种族差异的重要原因。

这项研究揭示了机器学习在BV诊断中存在的种族差异问题,为AI医疗公平性提供了重要实证。研究发现黑人女性的诊断准确性显著低于其他群体,这与该群体中高比例的CST IV型(高多样性)和低比例的乳酸杆菌主导型微生物组密切相关。通过特征选择方法鉴定的种族特异性细菌标志物,如白人女性的Eggerthella sp. type 1和黑人女性的Dialister sp. Type 2,为开发更精准的群体特异性诊断模型提供了分子基础。

研究的创新性在于首次系统评估了症状性BV诊断中的机器学习公平性问题,并提出了配对种族训练和特征选择等改进策略。这些发现对临床实践具有重要启示:首先,在应用AI辅助诊断时需要充分考虑患者的种族背景;其次,需要开发更多样化的训练数据集以提高模型的泛化能力;最后,针对特定人群的定制化模型可能是提高诊断准确性的有效途径。

这项研究也存在一定局限性,如"其他种族"群体的样本量较小且异质性高,以及未考虑环境和社会文化因素的影响。未来研究需要在更大规模、更多样化的队列中验证这些发现,并探索将公平性考量系统整合到AI模型开发流程中的方法。随着精准医学和健康公平理念的发展,这类关注技术应用中群体差异的研究将变得越来越重要,最终推动医疗AI向着更公平、更包容的方向发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号