医疗隐私保护场景下基于回顾学习的跨机构持续学习算法验证研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年05月09日 来源：Computers in Biology and Medicine 7.0

编辑推荐：

　　为解决深度学习中灾难性遗忘(catastrophic forgetting)对隐私保护深度学习(PPDL)的影响，研究人员开发了基于特征可视化的生成器无关持续学习算法"回顾学习(RevL)"。通过6个模拟实验和3家真实医疗机构的106,508例患者数据验证，RevL的AUC达0.710，显著优于传统迁移学习(TL)的0.655，为电子健康记录(EHR)的跨机构隐私保护研究提供了实用解决方案。

在医疗人工智能领域，一个棘手的矛盾日益凸显：一方面，深度学习模型需要海量数据训练才能达到理想性能；另一方面，涉及患者隐私的电子健康记录(EHR)被严格隔离在各医疗机构内部，形成数据孤岛。传统解决方案如迁移学习(TL)虽能避免原始数据共享，却面临灾难性遗忘(catastrophic forgetting)的困扰——模型在新数据上训练时会迅速遗忘先前学到的知识。这种现象严重制约了隐私保护深度学习(PPDL)在真实医疗场景中的应用价值。

针对这一挑战，来自韩国首尔大学医院等机构的研究团队在《Computers in Biology and Medicine》发表创新研究，提出名为"回顾学习(Review Learning, RevL)"的新型持续学习算法。该研究通过精心设计的模拟实验和真实世界验证，证实RevL能有效缓解灾难性遗忘问题，为跨医疗机构的隐私保护AI协作提供了可行方案。

研究团队采用多模态技术路线：首先构建包含106,508例患者的真实世界EHR数据集，来自韩国三家顶级医疗中心；开发基于特征可视化(feature visualization)的数据生成方法，直接在分类模型中重构代表性样本；设计六种模拟机构场景验证算法鲁棒性；最终通过接收者操作特征曲线下面积(AUC)等指标进行量化评估。

数据模拟机构实验与回顾学习验证
在模拟实验中，研究人员构建具有特征异质性的虚拟机构数据集，测试RevL在域增量学习(domain-incremental learning)场景下的表现。结果显示，RevL生成的特征可视化样本能准确反映模型已学知识，通过联合训练新数据与生成样本，模型在脓毒症30天死亡率预测等任务中保持稳定性能。

真实医疗机构的性能验证
在三家真实医疗机构(首尔国立大学医院、高丽大学医学中心、亚洲大学医学中心)的跨机构验证中，RevL展现出显著优势。其全局AUC达到0.710，较传统TL方法(0.655)提升8.4%，证明该算法能有效保留跨机构学到的知识。特别值得注意的是，这种性能提升是在完全遵守隐私保护要求的前提下实现的。

讨论与展望
研究深入分析了RevL的三大创新价值：首先，通过消除额外生成模型，大幅降低计算负担和机构间传输开销；其次，特征可视化技术使模型能自主"回忆"重要特征；最后，建立的端到端PPDL研究流程为后续工作提供标准化模板。不过作者也指出，当前研究仍受限于二分类任务验证，未来需拓展到多分类和更复杂临床预测场景。

结论
这项研究实现了隐私保护与知识保留的双重突破：提出的RevL算法在模拟和真实医疗场景中均显著优于传统TL方法；建立的标准化PPDL研究流程包含预处理、训练和评估全环节；特别重要的是，这是首次在真实世界多中心医疗环境中验证持续学习算法对EHR数据的适用性。该成果不仅为医疗AI的合规发展提供技术支撑，也为解决更广泛的隐私敏感数据协作问题开辟了新思路。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号