编辑推荐:
卵巢癌(OC)预后差、死亡率高,早期诊断等是难题。机器学习(ML)在肿瘤领域具优势。研究人员分析 2004-2024 年相关文献,发现 ML 在 OC 中发展迅速,热点包括生物标志物发现等,为该领域提供参考。
卵巢癌(Ovarian Cancer, OC)作为女性常见恶性肿瘤,因早期症状隐匿,70% 以上患者确诊时已处于晚期,5 年生存率随分期升高显著下降(Ⅰ 期 90% vs Ⅳ 期 25%)。临床治疗依赖细胞减灭术联合铂类化疗,但约 70% 患者会出现铂耐药并在两年内复发。如何突破早期筛查、疗效预测和精准治疗的瓶颈,成为亟待解决的医学难题。在此背景下,人工智能分支 —— 机器学习(Machine Learning, ML)因其对海量生物医学数据的高效分析能力,为 OC 诊疗带来新希望。然而,当前对 ML 在 OC 领域的研究趋势和热点缺乏系统性量化分析,亟需全面梳理以指导未来方向。
桂林医学院附属医院药学部与桂林理工大学公共管理学院的研究团队,针对 2004-2024 年 Web of Science 核心合集数据库中 777 篇 ML 与 OC 相关文献,采用 VOSviewer、R 软件和 CiteSpace 等工具进行计量分析与可视化研究,成果发表于《Discover Oncology》。
研究主要技术方法包括:通过 WoSCC 数据库检索文献,运用 Origin 2018 分析年度发表趋势,借助 R 软件的 bibliometrix 包、VOSviewer 和 CiteSpace 进行科学知识图谱可视化,涵盖国家 / 机构合作网络、期刊共被引分析、关键词共现等。数据处理中设置文献数量、被引频次等阈值,并纳入 2023 年期刊影响因子(IF)评估期刊影响力。
3.1 研究概况与地理分布
20 年间相关文献量呈持续增长趋势,2020 年后增速显著,反映学术与临床对 ML 在 OC 中应用的关注度提升。中国以 254 篇居首位,美国、英国紧随其后。尽管中国发文量领先,但英国的跨国合作比例(62.2%)更高。复旦大学和中国科学院是主要合作枢纽,显示中国学者在该领域的活跃参与。
3.2 期刊与高被引分析
《Gynecologic Oncology》(IF=4.5)是发表量(44 篇)和被引频次(885 次)最高的期刊,与《Nature》《Clinical Cancer Research》等构成合作核心。高被引文献聚焦 ML 在生物标志物发现、化疗敏感性预测等领域的应用,其中 “血清蛋白质组模式用于 OC 识别” 等研究引发广泛关注。
3.3 研究热点与趋势
通过关键词共现和聚类分析,确定四大研究热点:
- ML 驱动的生物标志物发现与个性化治疗:ML 算法分析血清 CA125 动态变化、尿液代谢物等数据,构建诊断模型(如 SVM 算法敏感性 91.7%、特异性 99.2%),并预测化疗反应,助力个体化方案制定。
- 肿瘤微环境分析与耐药预测:基于基因组和转录组数据,ML 模型识别巨噬细胞相关标志物,构建预后预测模型,优于传统分期系统,同时揭示肿瘤微环境异质性与化疗耐药的关联。
- 影像诊断与风险分层:利用 CT、MRI 等影像数据,ML 模型可区分良恶性肿瘤、预测复发及生存结局。例如,深度学习模型在超声图像分析中诊断准确率优于放射科医师主观评估。
- 多中心研究:整合多中心数据构建模型,如基于七家医院超声数据的卷积神经网络模型,经内外验证显示良好泛化能力,提升模型临床适用性。
3.4 主题演化与前沿
研究主题从早期的蛋白质组模式识别,逐步转向基因表达分析、影像组学和算法优化。近年焦点集中于 AI 模型的临床验证、多模态数据整合及跨国合作研究,体现从基础向转化应用的推进。
结论与意义
本研究首次系统揭示 ML 在 OC 领域的全球发展脉络:中国在发文量上占据主导,但国际合作深度有待加强;ML 在生物标志物挖掘、影像诊断等领域潜力显著,但模型可解释性、数据异质性等问题仍需突破。研究为临床医生和研究者提供了清晰的研究热点图谱,提示未来需重点发展可解释性 ML 模型、扩大国际多中心数据协作,并通过前瞻性临床试验推动 ML 从实验室向临床实践的转化。随着技术迭代与数据积累,ML 有望成为破解 OC 诊疗困局的核心工具,为提升患者生存率和生活质量开辟新路径。