编辑推荐:
皮肤病变发病率上升,早期准确检测至关重要。研究人员开展基于卷积神经网络(CNN)和双向长短期记忆网络(BiLSTM)的皮肤病变分类研究。结果显示,该混合模型准确率达 92.73% 。其为医疗诊断提供了有力工具,提升了检测和治疗水平。
近年来,皮肤病变已成为全球不容忽视的健康难题,其发病率呈持续攀升态势。想象一下,皮肤上突然出现的不明肿块或异常斑疹,若不能及时准确判断是良性还是恶性,可能导致病情延误,给患者带来极大痛苦。传统的诊断方式存在诸多局限,如依赖医生经验、准确性不稳定等,难以满足日益增长的诊断需求。在此背景下,为了实现皮肤病变的早期精准检测,提升医疗诊断水平,来自维洛尔理工学院(Vellore Institute of Technology)的研究人员展开了深入研究,相关成果发表于《Scientific Reports》。
研究人员采用了多种关键技术方法。在模型构建方面,将卷积神经网络(CNN)与双向长短期记忆网络(BiLSTM)相结合,利用 CNN 擅长提取图像空间特征、BiLSTM 善于处理序列数据和捕捉时间模式的优势,同时融入空间、通道和时间注意力机制,使模型能更聚焦关键信息。在数据处理上,使用平衡后的 HAM10000 数据集进行训练和验证,通过数据增强技术提升模型泛化能力。评估模型性能时,运用精度、召回率、F1 分数、马修斯相关系数(MCC)等多种指标进行全面衡量。
实验结果
- 模型性能对比:研究对比了多种模型,发现 CNN(原始架构)结合 BiLSTM 和注意力机制的模型表现最为突出,其准确率达到 92.73%,精度为 92.84%,F1 分数是 92.70%,召回率 92.73%,杰卡德指数(JAC)为 87.08%,骰子系数(DIC)92.70%,马修斯相关系数(MCC)91.55% 。在区分皮肤病变类别时,该模型对真假阳性和阴性的判断极为有效,在特异性(98.79%)和曲线下面积(AUC,99.42%)等指标上也远超其他模型,能精准区分正负类别1。
- 训练与验证分析:从模型训练和验证的性能指标来看,随着训练进行,模型在训练集和验证集上的准确率稳步上升,最终均超 90%,且两者曲线紧密贴合,表明模型有效学习且未出现过拟合。同时,训练集和验证集的损失值不断下降,最终接近 0.2,进一步证明模型能有效捕捉数据模式23。
- 混淆矩阵评估:通过混淆矩阵分析,该模型在七个类别分类中表现出色,对角元素强,误分类率低,尤其在区分相似类别上优势明显。相比之下,其他模型虽各有表现,但在部分类别准确性上存在不足,凸显了该模型捕捉复杂模式的卓越能力4。
- ROC 曲线分析:在受试者工作特征(ROC)曲线分析中,该模型在七个不同类别上的曲线都靠近左上角,AUC 在 0.98 - 1.00 之间,远超随机分类器,且不同类别曲线紧密聚集,表明其在多类别医学图像分类任务中性能稳定、准确5。
- 其他数据集验证:为测试模型泛化能力,研究人员在 ISIC 2019 和 ISIC 2018 数据集上进行验证。结果显示,模型在这些数据集上同样表现优异,各项关键指标突出,证明其能适应不同数据分布,在实际应用中具有高度可靠性6。
研究结论与讨论
此次研究成果意义重大。所提出的结合 CNN、BiLSTM 和注意力机制的模型,在皮肤病变分类任务中展现出卓越性能,为医疗专业人员提供了强大的诊断工具。其高精度意味着能更准确识别皮肤病变,减少误诊;高召回率可降低漏诊风险,帮助患者及时接受治疗。该模型对复杂特征的捕捉能力和在不同数据集上的稳定表现,显示出其在实际临床应用中的巨大潜力,有望推动皮肤病变早期检测和个性化治疗的发展。然而,研究也存在一定局限性,如在实际应用中,图像采集时的光照变化和背景差异可能影响模型准确性。未来研究可针对这些问题,借助其他视觉和图像处理技术加以改进,进一步提升模型性能,为全球公共卫生事业贡献更多力量。