
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于不确定性感知的跨领域增量学习框架(UDIL-DD)在抑郁症检测中的应用研究
【字体: 大 中 小 】 时间:2025年07月15日 来源:Scientific Reports 3.8
编辑推荐:
本研究针对抑郁症(MDD)检测中数据隐私、领域差异和类别不平衡等挑战,提出了一种不确定性感知的跨领域增量学习框架(UDIL-DD)。该研究整合了不确定性引导的自适应类别阈值学习(UACTL)和数据无关领域对齐(DFDA)模块,在四个基准数据集(CMDC/DAIC-WoZ/MODMA/EATD)上验证了方法的有效性,为临床抑郁症诊断提供了可靠的新范式。
心理健康领域正面临一个关键挑战:如何利用分散在不同医疗机构的抑郁症数据构建可靠的人工智能诊断模型。传统方法需要集中数据训练,但患者隐私保护、机构间合作壁垒以及数据分布差异(如文化、语言差异导致的特征偏移)使得这一设想难以实现。更棘手的是,临床抑郁症数据集往往存在严重的类别不平衡——健康人群样本远多于患者样本,导致模型容易产生预测偏差。
针对这些难题,北京科技大学计算机与通信工程学院的研究团队在《Scientific Reports》发表了一项创新研究。他们开发的UDIL-DD框架突破了传统限制,使模型能够在不访问历史原始数据的前提下,通过增量学习方式持续吸收新领域知识。这项研究的关键突破在于:首次将证据深度学习(EDL)与增量学习相结合,通过测量预测分歧和不确定性来动态调整分类阈值,显著提升了模型对少数类(抑郁症患者)的识别能力。
研究采用了四项关键技术方法:(1)基于mBERT的文本特征提取;(2)证据深度学习框架下的不确定性量化;(3)基于Jensen-Shannon散度的自适应类别阈值学习(UACTL);(4)通过最大均值差异(MMD)实现的数据无关领域对齐(DFDA)。实验数据来自CMDC、DAIC-WoZ、MODMA和EATD四个公开数据集,涵盖中英文不同文化背景的临床访谈文本。
主要研究结果
性能评估
在四组跨领域增量学习任务中,UDIL-DD的F1分数全面超越基线方法。以DAIC-WoZ→CMDC→MODMA→EATD任务链为例,在最终测试集EATD上取得66.35%的F1值,较传统增量学习方法(DIL-MDD)提升3.3%。特别值得注意的是对少数类的召回率(REC)提升,如在DAIC-WoZ数据集上达到82.56%,证明其有效缓解了类别不平衡问题。
领域适应对比
与传统领域适应(DA)方法相比,UDIL-DD展现出更均衡的跨领域性能。当以DAIC-WoZ为源域、EATD为目标域时,其源域F1仅下降0.7%,远低于DANN等方法的25%性能衰减,证实了数据无关对齐策略的有效性。
消融实验
阈值设置研究表明,固定阈值(如τ=0.5)会导致F1骤降至13.75%,而UACTL模块通过动态调整将性能提升至50.49%。遗忘分析显示,UDIL-DD在DAIC-WoZ域上的遗忘分数为-0.7%(负值表示性能反升),显著优于生成式方法(GM-based)的8%性能衰减。
不确定性分析
模型在未训练域(EATD)上的平均不确定性(0.58)显著高于已训练域(0.32),AUROC达84.20%,表明其能可靠识别分布外样本。这种不确定性感知能力为临床部署提供了重要的安全边界。
这项研究的核心价值在于建立了隐私保护与模型性能之间的平衡点。通过创新的UACTL-DFDA协同机制,既避免了原始数据共享的伦理风险,又解决了增量学习中的"灾难性遗忘"难题。临床意义上,该框架支持医疗机构在不泄露患者数据的前提下共建诊断模型,尤其有利于抑郁症早期筛查在医疗资源不均地区的推广。未来工作可向多模态(如结合EEG信号)和联邦学习方向延伸,进一步拓展其在精神健康监测中的应用场景。
生物通微信公众号
知名企业招聘