Q-CaMIR:面向鲁棒跨模态放射图像分类的不确定性感知混合量子–经典学习

《Journal of Radiation Research and Applied Sciences》:Q-CaMIR: Uncertainty-Aware Hybrid Quantum–Classical Learning for robust Cross-Modal radiological image classification

【字体: 时间:2026年06月12日 来源:Journal of Radiation Research and Applied Sciences 2.5

编辑推荐:

  实现可靠的放射图像分类不仅需要高准确率,还需要良好校准的不确定性估计、面对域迁移时的鲁棒性以及跨多种成像模态的泛化能力。当前用于医学图像分类的深度学习方法频繁表现出过度自信的预测,并在真实临床条件(如标签噪声、有限训练数据以及不同机构间的分布偏移)下经历显著的

  
实现可靠的放射图像分类不仅需要高准确率,还需要良好校准的不确定性估计、面对域迁移时的鲁棒性以及跨多种成像模态的泛化能力。当前用于医学图像分类的深度学习方法频繁表现出过度自信的预测,并在真实临床条件(如标签噪声、有限训练数据以及不同机构间的分布偏移)下经历显著的性能退化。混合量子–经典机器学习已成为一种有前景的范式;然而,现有医学成像研究主要集中于单一模态和以准确率为中心的方法。在本研究中,研究人员提出Q-CaMIR(跨模态、不确定性感知混合量子–经典学习),这是一种将胸部X射线与脑部MRI(magnetic resonance imaging,磁共振成像)分类整合于统一混合量子–经典架构中的新型框架,并融入了显式的不确定性量化。Q-CaMIR利用预训练经典视觉主干提取模态无关的潜在表征,通过对比表征模块对齐跨模态特征,并将所得的紧凑嵌入输送至变分量子电路(variational quantum circuit,VQC)决策头,该决策头辅以证据深度学习(evidential deep learning,EDL)以实现不确定性感知预测。研究人员在三个公开基准数据集上对Q-CaMIR进行了评估:用于胸部X光片分类的CheXpert和MIMIC-CXR(外部验证),以及用于脑肿瘤分类的BraTS 2021,采用了一套综合指标,包括准确率、macro-F1、AUROC(area under the receiver operating characteristic curve,受试者工作特征曲线下面积)、AUPRC(area under the precision–recall curve,精确率–召回率曲线下面积)、ECE(expected calibration error,期望校准误差)和Brier分数。在低数据量条件、合成标签噪声、强度损坏以及跨机构域迁移下的广泛实验表明,与鲁棒的经典基线相比,Q-CaMIR取得了具有竞争力的分类性能,同时显著改善了校准(ECE降低高达47%)和鲁棒性。消融研究证实了量子决策头和不确定性感知训练目标的互补贡献。研究结果表明,混合量子–经典学习为不确定性敏感的放射学分类提供了有意义的归纳偏置,推进了面向放射相关诊断工作流的临床可部署AI系统的发展。
Q-CaMIR是一种面向放射图像分类的跨模态、不确定性感知混合量子–经典学习框架,相关研究发表于《Journal of Radiation Research and Applied Sciences》。该研究的提出源于深度学习在医学影像领域虽取得显著进展,但在临床应用中仍面临多重挑战:深度神经网络容易产生过度自信的预测,即使在训练分布之外或标签模糊时仍输出高概率;当训练数据与测试数据来自不同机构时,由于采集协议、扫描设备厂商和患者 demographics(人口统计学特征)的差异,分类性能常显著下降;在罕见病理或代表性不足人群的临床场景中,标准深度学习模型易于过拟合且泛化性差。这些问题在放射相关诊断工作流中尤为突出,因为决策支持系统必须在不确定性下可靠运行,标记模糊病例以供专家复核,并维持跨成像环境的可靠性。同时,现有量子机器学习(quantum machine learning,QML)医学影像研究存在三个显著不足:大多数研究局限于单一模态和单一数据集,缺乏跨模态泛化性的证据;评估主要聚焦于准确率,忽视了校准、不确定性和鲁棒性等方面;与ConvNeXt或DeiT(Data-efficient Image Transformer)等强当代经典基线的对比很少进行,从而削弱了量子实用性论断的说服力。

为填补上述空白,研究人员开发了Q-CaMIR框架。该框架的核心创新在于系统性地将对比跨模态学习、变分量子电路和证据深度学习整合于一个专为放射图像分类设计的统一架构中,能够在两种不同放射模态(胸部X射线CXR和脑部MRI)上进行评估。Q-CaMIR利用预训练经典视觉主干(ConvNeXt-Base)提取模态无关的潜在表征,通过监督对比对齐目标对齐跨模态特征,随后将紧凑嵌入送入8量子比特变分量子电路决策头,并辅以证据深度学习生成Dirichlet参数化的不确定性估计,实现aleatoric uncertainty(偶然不确定性,固有数据模糊性)与epistemic uncertainty(认知不确定性,模型无知程度)的 principle(有原则的)分解。该研究在CheXpert、MIMIC-CXR和BraTS 2021三个公开基准上进行了严格评估,涵盖外部验证、低数据量方案(5%、10%、25%训练数据)、合成标签噪声(10%、20%、30%)、强度损坏以及统计显著性检验。研究结论表明,混合量子–经典学习为不确定性敏感的放射学分类提供了有意义的归纳偏置,推进了临床可部署AI系统的发展。

在技术方法方面,Q-CaMIR首先采用ImageNet-22K预训练的ConvNeXt-Base作为共享视觉主干,配合模态特定轻量级适配器模块将特征映射至共享128维潜在空间。跨模态对比对齐模块通过余弦相似度监督对比损失促进模态无关表征的生成,且无需配对跨模态样本(仅需共享诊断类别)。核心量子组件为8量子比特变分量子电路,包含4层参数化纠缠层,采用RY–RZ旋转对及环形CNOT(controlled-NOT,受控非门)纠缠拓扑结构,通过角度编码将经典特征嵌入量子态,测量Pauli-Z期望值后经由经典线性层生成类别logits。证据深度学习层将logits转换为Dirichlet分布浓度参数αk,通过软加激活函数实现,总不确定性u(x)=K/S(S为αk之和)。复合训练目标整合证据分类损失、跨模态对齐损失及L2正则化。样本队列来源包括:CheXpert数据集(224,316张胸片,65,240例患者,聚焦5种病理)、MIMIC-CXR作为CheXpert训练模型的外部验证集(377,110张胸片,直接使用官方测试拆分,不做微调)、BraTS 2021(1,251例多参数MRI,构建2.5D合成用于三分类任务)。

研究结果部分,主分类性能显示:在CheXpert上,Q-CaMIR取得最高AUROC(0.895,p<0.05),ECE为0.034,相对ConvNeXt-B + Linear基线降低47%;在BraTS 2021上,AUROC达0.965,ECE降至0.027,同样降低47%。外部验证(CheXpert→MIMIC-CXR)表明Q-CaMIR在域迁移下性能下降最小(ΔAUROC =?0.033),绝对外部性能最高(AUROC = 0.863),ECE从0.034升至0.049(相对增加44%),显著优于经典基线。低数据量方案显示,5%数据时Q-CaMIR的AUROC为0.832,比ConvNeXt-B + Linear高2.5个点,ECE优势更为显著。标签噪声实验中,30%噪声水平下Q-CaMIR与线性基线的AUROC差距达4.0个点(0%噪声时仅0.7个点),从清洁到30%噪声的绝对AUROC下降仅6.2点,而线性基线为9.5点。强度损坏实验表明,最严重高斯噪声条件(σ=0.15)下Q-CaMIR维持AUROC 0.851,比线性基线高2.8点。校准与不确定性分析(可靠性图)显示Q-CaMIR更紧密贴合理想校准对角线,正确分类样本集中于低不确定性(u<0.15),误分类样本不确定性显著更高(u>0.2),训练动态表明Q-CaMIR最终ECE最优。消融研究证实证据损失和VQC头的关键作用:去除证据损失导致ECE增加38%(0.034→0.047),VQC替换为经典MLP使ECE增加21%(0.034→0.041),nq=8和L=4为最佳平衡点。计算成本分析显示训练时间开销增加52%,推理吞吐量降低35%,但比MC Dropout快33倍(312 vs. 9.5 img/s),量子电路仅引入64个可训练参数。统计显著性检验确认Q-CaMIR的ECE改进在所有情况下高度显著(p<0.015)。NISQ(noisy intermediate-scale quantum,含噪声中等规模量子)硬件噪声鲁棒性分析采用IBM Brisbane校准噪声模型,1×噪声水平下CheXpert AUROC保持0.893、ECE 0.038,仍优于最佳经典基线校准性能。跨模态特征不变性分析通过t-SNE可视化证实对比对齐使模态Silhouette分数从0.72降至0.31,线性探测跨模态分类准确率从58.3%提升至71.2%。跨模态少样本迁移实验显示,5% BraTS数据下Q-CaMIR比从头训练提高4.1 AUROC点,比无对齐CXR预训练提高1.9点。

讨论部分,研究人员认为量子组件的价值体现在三个方面:酉约束限制可表示变换空间,作为隐式正则化防止过度自信决策边界;纠缠层产生与经典矩阵乘法和点态非线性结构不同的特征关联,单次层内实现高阶特征交互;有界测量输出([?1,1])提供自然梯度正则化稳定证据损失优化。这些性质在低数据、噪声标签和域迁移等挑战性条件下最为有利。跨模态对比对齐在完整数据下改进适度,但在低数据场景下价值显著。临床部署方面,校准良好的不确定性估计可实现工作量减少(自动化高置信度分类)、患者安全保障(原则性识别知识不足病例)和资源优化配置(区分需更多数据的认知不确定性与需临床关联的偶然不确定性)。模拟分诊实验中,Q-CaMIR将14.1%的CheXpert测试病例转诊专家复核,其中73.8%包含至少一个真实不确定或阳性标签,相比全测试集中42.1%的基础率达到1.75倍精确度提升。NISQ实用性方面,8量子比特、64参数、4层电路在当前NISQ设备能力范围内,1×噪声下性能退化轻微,经典模拟计算可行,VQC价值在于归纳偏置而非计算加速。局限性包括:尚未在物理量子硬件上执行;CXR和MRI任务标签空间不同限制直接跨模态测试时迁移;最强经典基线上AUROC提升适度且不始终统计显著;MIMIC-CXR外部验证为单一域迁移场景;证据不确定性估计尚未经前瞻性临床试验验证。

研究结论翻译如下:研究人员引入了Q-CaMIR,一种面向放射图像分类的跨模态、不确定性感知混合量子–经典框架,解决了当前QML医学影像文献中的重大空白。通过整合鲁棒的预训练经典主干与模态特定适配器、对比跨模态对齐、紧凑变分量子电路决策头以及用于不确定性量化的证据深度学习,Q-CaMIR相对于强经典基线取得了具有竞争力的分类性能,同时提供了显著改善的校准和鲁棒性。通过严格方案在三个公开基准(CheXpert、MIMIC-CXR、BraTS 2021)上的全面评估表明,混合量子–经典架构提供了有意义的优点,特别是在临床相关的挑战性场景中。期望校准误差降低高达47%、对噪声和域迁移的一致鲁棒性、以及有效的基于不确定性的转诊机制,表明了对放射相关诊断工作流的实用价值。值得注意的是,虽然AUROC改进一致,但较为适中。研究人员将此解读为量子组件的主要贡献在于增强的校准和正则化,而非原始区分能力的证据。该研究为量子计算(即使在NISQ时代)在与现代经典深度学习深思熟虑整合时可为医学AI提供有益归纳偏置的日益增长证据体系做出了贡献。未来方向包括在真实量子硬件上的执行、扩展到额外成像模态和临床任务、基于不确定性的分诊机制的前瞻性临床验证、以及量子–经典联邦学习在隐私保护多机构训练中的探索。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号