《Journal of Oral Biology and Craniofacial Research》:Comprehensive benchmarking of deep learning architectures for multiclass histopathological classification of oral epithelial lesions
编辑推荐:
阿赫拉·巴蒂(Achla Bharti)|尼基塔·卡希亚普(Nikita Kashyap)|马拉·坎博杰(Mala Kamboj)|卡马尔迪普·乔希(Kamaldeep Joshi)|萨希尔·胡达(Sahil Hooda)|迪皮卡·米什拉(Deepika Mishra)|哈普里特
阿赫拉·巴蒂(Achla Bharti)|尼基塔·卡希亚普(Nikita Kashyap)|马拉·坎博杰(Mala Kamboj)|卡马尔迪普·乔希(Kamaldeep Joshi)|萨希尔·胡达(Sahil Hooda)|迪皮卡·米什拉(Deepika Mishra)|哈普里特·辛格(Harpreet Singh)|德布纳特·帕尔(Debnath Pal)
摘要
背景
准确区分正常口腔上皮、口腔上皮发育不良(OED)和口腔鳞状细胞癌(OSCC)在病理学上至关重要,但这一过程耗时较长且存在观察者间差异。深度学习为数字病理学中病理图像的自动化分析提供了一种强大的方法。本研究比较评估了多种深度学习模型在将病理图像自动分类为正常口腔上皮、OED和OSCC方面的性能。
方法
研究分析了包含2363张病理图像的数据集,这些图像分别以10倍和40倍放大倍数拍摄,其中正常上皮样本1254张,OED样本976张,OSCC样本102张。数据集被分为训练集(80%)和测试集(20%)。为了解决类别不平衡问题并提高模型鲁棒性,采用了数据增强和加权损失策略,使训练数据集规模扩大到4750张图像。研究使用了7种深度学习模型——Vision Transformer(ViT)、EfficientNet-B0、InceptionV3、ResNet-50、VGG16、MobileNetV3和YOLOv11,在标准化条件下进行训练,输入分辨率为224×224,训练周期为100个 epoch。模型性能通过准确率、精确度、召回率和F1分数进行评估。
结果
EfficientNet-B0在验证集上取得了最高的准确率(97.48%),并在测试集上表现出最佳的整体性能,其宏观F1分数和加权F1分数均为0.97。InceptionV3、YOLOv11和ResNet-50也展现了较强的分类能力(F1分数约为0.96)。误分类情况较为罕见,主要发生在正常上皮、发育不良组织和早期癌变组织之间的过渡区域。
结论
深度学习能够实现口腔病理图像的高精度分类。EfficientNet-B0的表现尤为突出,证明了人工智能辅助的数字病理学在早期检测和客观评估口腔癌前病变及癌症方面的潜力。