人工智能在口腔细胞学中鉴别低分化肿瘤细胞与反应性不典型增生的性能研究
《Journal of Oral Biology and Craniofacial Research》:AI performance in oral cytology for differentiating poorly defined tumor cells from reactive atypia
【字体:
大
中
小
】
时间:2025年10月19日
来源:Journal of Oral Biology and Craniofacial Research CS4.9
编辑推荐:
本研究针对口腔细胞学诊断中难以区分形态不明确的肿瘤细胞与反应性不典型细胞的难题,利用YOLOv7模型开展AI辅助诊断研究。结果表明,将可疑细胞归类为癌细胞的训练方式虽检测灵敏度高但假阳性增多,而仅使用正常与癌细胞训练的模型可识别部分可疑细胞的恶性特征且假阳性较低。该研究为优化口腔细胞学AI训练策略提供了重要依据。
在口腔黏膜疾病的诊断中,细胞学检查一直是一项重要的辅助手段。然而,口腔黏膜细胞在炎症刺激或变性作用下常出现显著的不典型改变,如核增大、核仁明显、核深染等,而高分化口腔鳞状细胞癌(SCC)有时却不表现出明显的细胞异型性。这种形态上的重叠使得单纯依靠显微镜下观察难以准确区分癌与非癌细胞,导致假阴性率高达约20%。传统的细胞学诊断高度依赖病理医师的经验,面对这些“灰色地带”的细胞时,诊断一致性常受到挑战。
随着人工智能(AI)技术在医学影像分析领域的成功应用,将其引入口腔细胞学诊断被视为提高诊断客观性和准确性的重要途径。然而,与宫颈细胞学等相对成熟的AI应用相比,口腔细胞学的AI研究仍处于探索阶段。其中一个核心难点在于:口腔样本中既存在形态不明确的肿瘤细胞(ill-defined tumor cells),又存在因炎症等因素引起的反应性不典型细胞(reactive atypia)。这些细胞在形态学上界限模糊,为AI模型的开发和训练带来了巨大困难。为了深入探究这些细胞对AI性能的具体影响,并寻找更优的AI训练策略,研究人员开展了此项研究。
本研究选取了29例非肿瘤性病变(如牙龈炎、口炎)和17例鳞状细胞癌(SCC)的液基细胞学(LBC)标本。细胞被预先注释为四类:正常、癌、橙色可疑(orange-suspicious)、绿色可疑(green-suspicious)。后两类为经免疫组化(TUBB3阳性或CK13阴性)证实为恶性但形态学特征不典型的细胞。采用目标检测模型YOLOv7,设计了六种不同的训练方案,主要区别在于如何处理可疑细胞的信息(如将其归入癌类别或排除在外),以评估不同训练策略对模型性能的影响。
模型训练以六种方式进行,并计算了每种方法的mAP50(平均精度均值,交并比阈值为0.5)。将橙色和绿色可疑细胞均作为癌细胞进行训练的模型4显示出最高的检测能力(mAP50为0.686),其次是模型2(0.664)、模型1(0.596)、模型3(0.557)、模型6(0.556)和模型5(0.287)。
在针对具有明确细胞非典型性的肿瘤细胞图像的检测测试中,模型1、3、4的癌细胞检测性能稳定,几乎都能准确识别。然而,在模型2和6中,部分肿瘤细胞被错误分类为正常细胞(假阴性)。在模型5中,检测到的细胞数量显著少于其他模型。
在针对具有不明确细胞非典型性的肿瘤细胞图像(橙色和绿色可疑细胞)的检测中,模型1和2能较准确地检测出绿色可疑细胞,但对橙色可疑细胞存在许多假阴性(判为正常)。只有模型3检测到三个橙色可疑细胞。所有模型中将可疑细胞判断为“癌”(正确判断)的情况比预期要多。模型6将部分可疑细胞检测为癌,这些被检测出的细胞其细胞非典型性更接近癌细胞。
在对因长期炎症导致细胞非典型性的非肿瘤细胞图像的检测中,除模型2外,每个模型都部分地将正常细胞识别为癌细胞(假阳性)。模型3的假阳性数量最高,其次是模型4和模型1。模型6的假阳性数量较少,但其判为假阳性的细胞均为形态不规则的变性细胞。
与预期相反,将可疑细胞信息纳入癌细胞类别进行训练的模型(模型4)获得了最高的mAP50值。然而,结合额外的检测测试结果来看,不能仅凭mAP50来评价AI性能。模型4产生了大量假阳性,而排除可疑细胞信息、仅使用“正常”和“癌”进行训练的模型6,虽然检测到的癌细胞数量减半,但减少了假阳性,并能识别出一些被我们忽视的、具有恶性特征的可疑细胞。这表明,仅凭形态学难以清晰区分不明确的肿瘤细胞和非肿瘤性不典型细胞。可疑细胞图像可能包含部分癌细胞特征,但将其明确归类为癌容易引入误判。
研究结果明确显示,即使数据相同,训练方法的差异也会导致AI性能产生显著变化。每种训练策略各有利弊,应根据实际应用目的进行选择。若允许较高的假阳性率以尽可能检测出所有可疑对象,可选择模型4;若希望区分可疑细胞与典型癌细胞,模型1更合适;若旨在以较低的假阳性率识别出那些包含潜在恶性特征、但形态不典型的细胞,模型6展现出独特价值,这可能有助于发现口腔鳞癌新的细胞学特征。
综上所述,本研究揭示了在口腔细胞学AI开发中,训练策略对模型性能具有决定性影响。单纯依靠形态学区分不明确的肿瘤细胞和反应性不典型细胞极具挑战性。将可疑细胞归类为癌会导致高假阳性,而利用纯化的“正常”和“癌”数据集训练的AI,反而能识别出一些人眼难以察觉的恶性特征。这为未来开发更精准、更可靠的口腔细胞学AI辅助诊断工具提供了重要的方法论参考和实践方向。该研究论文发表于《Journal of Oral Biology and Craniofacial Research》。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号