《Clinica Chimica Acta》:Attention-based deep learning for immunoglobulin typing from electrophoresis and laboratory data
编辑推荐:
基于Sebia系统的免疫电泳图像结合实验室参数构建多模态深度学习模型,实现单克隆丙种球蛋白自动分类,诊断性能与资深专家相当且具有良好泛化性。
作者:赵龙 | 刘瑞华 | 张天 | 宋伟青 | 宋宁
中国青岛市健康与康复科学大学(青岛市人民医院)临床实验室
摘要
背景
血清蛋白电泳(SPE)结果的免疫分型解读仍然是一项劳动密集型任务,并且存在观察者间差异。虽然Sebia等公司提供的毛细管电泳系统提高了重复性,但检测单克隆免疫球蛋白仍需要专家进行解读。
方法
我们基于Sebia公司的毛细管免疫分型系统生成的图像数据开发了一个深度学习框架,并结合了临床相关的实验室参数——肌酐(CREA)、钙(Ca)、乳酸脱氢酶(LDH)、红细胞沉降率(ESR)、红细胞计数(RBC)和球蛋白(GLO)——构建了一个多模态分类模型。通过混合采样解决了样本不平衡问题,并引入了注意力机制以提高模型的可解释性。使用来自独立队列的200个病例进行了外部验证。此外,还将模型性能与不同经验水平的医生进行了比较。
结果
该多模态模型在平衡的内部验证集上的总体准确率为0.975,Cohen's Kappa得分为0.955,F1分数为0.975,召回率为0.985,在所有指标上均显著优于仅使用图像或仅使用实验室数据的模型。外部验证证实了其泛化能力。人与AI之间的比较显示,其性能可与资深专家相媲美。
结论
本研究提出了首个用于解读基于Sebia的SPE免疫分型图像的多模态深度学习模型。该模型具有与资深专家相当的诊断性能和强大的外部泛化能力,为临床医学中的决策支持提供了重要潜力。
引言
免疫分型在单克隆丙种球蛋白病的诊断和监测中起着关键作用,包括多发性骨髓瘤、瓦尔登斯特伦巨球蛋白血症和意义未明的单克隆丙种球蛋白病(MGUS)[1,2]。它能够识别单克隆免疫球蛋白的重链和轻链类型(例如IgG Kappa、IgA Lambda),这对于准确诊断和疾病分类至关重要[3,4]。在当前的临床实践中,免疫分型通常使用基于毛细管电泳的免疫沉淀技术进行,如Sebia系统所提供的方法。这些技术可以实现单克隆免疫球蛋白的完全自动化检测;然而,当M蛋白峰较暗或被多克隆背景掩盖时,诊断仍存在挑战[1,[5],[6],[7]。然而,对所得电泳图像的解读仍然是手动进行的,劳动强度大,并且存在观察者间差异[8,9]。
尽管有几项基于AI的研究试图自动化血清蛋白电泳(SPE)或免疫固定电泳(IFE)的模式识别,但这些方法并不直接适用于毛细管免疫分型图像[8,9]。例如,Hu等人开发了一个用于IFE解读的高性能深度学习模型;然而,他们的框架并未针对基于Sebia的免疫分型图像,也没有结合本研究中探索的多模态临床特征。尽管在其他生物医学AI应用中已经探索了多模态集成,但据我们所知,之前没有研究将这种方法应用于基于毛细管电泳的免疫分型[10,11]。
为了克服这些限制,我们开发了一个专门用于解读Sebia毛细管电泳系统生成的免疫分型图像的新AI模型。我们的研究有几个关键创新:首先,我们是第一个使用深度学习自动分类Sebia免疫分型图像的团队;其次,我们将图像数据与常规实验室指标结合以提升模型性能;第三,该模型在内部和外部队列上进行了验证,并与具有不同专业水平的医生进行了对比。
本研究旨在建立一个稳健的深度学习框架,能够准确分类Sebia生成的电泳图像中的免疫分型模式。我们假设这种方法可以达到专家水平的诊断准确率,并成为高通量临床实验室中的实用工具。
数据集和伦理
这项回顾性研究使用了来自健康与康复科学大学下属两个临床中心的数据。初始队列包括来自青岛市人民医院的8331个病例(2020-2023年)。在排除了任何选定的实验室指标中存在缺失值的样本后,保留了8003个样本用于模型开发和内部验证,外部验证队列包括来自青岛市中心医院的200个病例(2022-2023年)。
样本描述和数据分布
2020年1月至2023年12月期间,从健康与康复科学大学的青岛市人民医院收集了8003份血清样本。所有保留的样本均使用Sebia系统进行了基于毛细管电泳的免疫分型。最终的内部数据集包括4251名男性(53.12%)和3752名女性(46.88%),平均年龄为62.73±14.25岁。
这些内部数据按7:3的比例分为训练集和验证集。
与以往研究的比较
最近的深度学习研究在蛋白质电泳的自动化解读方面取得了进展。Chabrun等人使用基于逻辑的模型实现了专家水平的准确率,但仅关注模式级别而非免疫分型[8]。Lee等人将其扩展到多中心队列,但同样缺乏免疫分型级别的分析或临床数据整合[9]。
Hu等人使用分割的IFE图像训练了一个高准确率模型[10]。相比之下,我们的模型处理的是原始的多通道数据。
结论
在这项研究中,我们开发了一个多模态深度学习模型,能够通过整合电泳数据和关键实验室指标自动分类Sebia免疫分型图像。通过解决数据不平衡问题、引入注意力机制以及与专家水平进行比较,该模型的性能接近资深临床医生。我们的发现突显了AI辅助工作流程在支持免疫分型模式准确和可重复解读方面的潜力。
CRediT作者贡献声明
赵龙:撰写——原始草稿。
刘瑞华:数据整理。
张天:软件开发。
宋伟青:概念设计。
宋宁:项目管理和资金筹集。
利益冲突声明
作者声明他们没有已知的可能会影响本文所述工作的财务利益或个人关系。