综述：用于口腔癌诊断的人工智能：基于图像和非图像模型的系统评价与荟萃分析

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《BMC Cancer》：Artificial intelligence for oral cancer diagnosis: a systematic review and meta-analysis of image-based and non-imaging models

【字体：大中小】 时间：2026年05月26日 来源：BMC Cancer 3.4

编辑推荐：

　　摘要背景人工智能（AI）日益被视为早期检测和预测口腔癌的宝贵工具，有助于解决因诊断延迟而导致的高死亡率问题。基于人工智能的诊断模型在区分恶性、癌前病变和良性口腔病变方面具有提高准确性的潜力。本系统评价和荟萃分析评估了非影像学和基于影像学的人工智能模型的诊断性能，并对口腔癌的预后和

摘要

背景

人工智能（AI）日益被视为早期检测和预测口腔癌的宝贵工具，有助于解决因诊断延迟而导致的高死亡率问题。基于人工智能的诊断模型在区分恶性、癌前病变和良性口腔病变方面具有提高准确性的潜力。本系统评价和荟萃分析评估了非影像学和基于影像学的人工智能模型的诊断性能，并对口腔癌的预后和风险分层应用的相关证据进行了叙述性综合。

方法

本研究遵循PRISMA指南以确保质量和可重复性。通过PubMed、Embase、Web of Science、Google Scholar和Scopus进行了系统性搜索，确定了2010年至2024年间关于人工智能在口腔癌诊断中应用的研究。共有16项符合预定义纳入标准的研究被纳入分析，其中包括将AI筛查与组织学检查进行比较的研究。数据提取和偏倚评估使用QUADAS-2独立完成。研究结果强调了AI在早期检测和预后方面的潜力，同时指出需要进一步验证和临床应用以提升诊断准确性。

结果

最初共识别出801项研究，其中53项经过进一步审查，最终选择了16项研究。样本量范围从70到44,000不等，从而能够全面评估AI的诊断性能。人工智能模型的敏感性（42%–100%）、特异性（63%–100%）和准确性（63%–100%）各不相同。荟萃分析显示，其合并敏感性为0.90（95%置信区间：0.81–0.98），特异性为0.89（95%置信区间：0.84–0.95），准确性为0.89（95%置信区间：0.83–0.95），但存在显著异质性（I2 = 100%）。基于影像学的模型具有更高的合并敏感性（0.94 vs. 0.76，P = 0.320）、特异性（0.93 vs. 0.79，P = 0.025）和准确性（0.93 vs. 0.81，P = 0.042）。

结论

基于回顾性临床数据，人工智能模型在口腔癌诊断方面表现出良好的性能。尽管基于影像学的模型（尤其是卷积神经网络）的合并敏感性和特异性高于非影像学模型，但这些差异在统计学上并不显著。由于存在显著异质性，应对研究结果持谨慎态度。文献中报道的进展，如多模态方法和数据增强技术，可能会提高非影像学模型的性能，并有助于缩小不同方法之间的差距。这些发展凸显了AI在提高口腔癌早期检测和预后方面的潜力。

背景

人工智能（AI）日益被视为早期检测和预测口腔癌的宝贵工具，有助于解决因诊断延迟而导致的高死亡率问题。基于人工智能的诊断模型在区分恶性、癌前病变和良性口腔病变方面具有提高准确性的潜力。本系统评价和荟萃分析评估了非影像学和基于影像学的人工智能模型的诊断性能，并对口腔癌的预后和风险分层应用的相关证据进行了叙述性综合。

方法

本研究遵循PRISMA指南以确保质量和可重复性。通过PubMed、Embase、Web of Science、Google Scholar和Scopus进行了系统性搜索，确定了2010年至2024年间关于人工智能在口腔癌诊断中应用的研究。共有16项符合预定义纳入标准的研究被纳入分析，其中包括将AI筛查与组织学检查进行比较的研究。数据提取和偏倚评估使用QUADAS-2独立完成。研究结果强调了AI在早期检测和预后方面的潜力，同时指出需要进一步验证和临床应用以提升诊断准确性。

结果

最初共识别出801项研究，其中53项经过进一步审查，最终选择了16项研究。样本量范围从70到44,000不等，从而能够全面评估AI的诊断性能。人工智能模型的敏感性（42%–100%）、特异性（63%–100%）和准确性（63%–100%）各不相同。荟萃分析显示，其合并敏感性为0.90（95%置信区间：0.81–0.98），特异性为0.89（95%置信区间：0.84–0.95），准确性为0.89（95%置信区间：0.83–0.95），但存在显著异质性（I2 = 100%）。基于影像学的模型具有更高的合并敏感性（0.94 vs. 0.76，P = 0.320）、特异性（0.93 vs. 0.79，P = 0.025）和准确性（0.93 vs. 0.81，P = 0.042）。

结论

基于回顾性临床数据，人工智能模型在口腔癌诊断方面表现出良好的性能。尽管基于影像学的模型（尤其是卷积神经网络）的合并敏感性和特异性高于非影像学模型，但这些差异在统计学上并不显著。由于存在显著异质性，应对研究结果持谨慎态度。文献中报道的进展，如多模态方法和数据增强技术，可能会提高非影像学模型的性能，并有助于缩小不同方法之间的差距。这些发展凸显了AI在提高口腔癌早期检测和预后方面的潜力。

联系信箱：

粤ICP备09063491号

摘要

背景

方法

结果

结论

背景

方法

结果

结论

热点排行