基于一次性共享汇总统计的联邦混合效应逻辑回归方法及其在医疗数据隐私保护中的应用
【字体:
大
中
小
】
时间:2025年09月30日
来源:Biometrical Journal 1.8
编辑推荐:
本研究针对医疗数据隐私保护下多中心个体级数据难以获取的难题,提出了一种基于一次性共享汇总统计的联邦混合效应逻辑回归(Federated Mixed Effects Logistic Regression)方法。通过生成与真实数据汇总统计匹配的伪数据替代原始数据,实现了无需迭代通信的全局模型估计,有效兼顾数据隐私与模型解释性,为跨机构医疗研究提供了高效安全的解决方案。
在医疗研究领域,数据隐私保护(Data Privacy)已成为关键挑战,尤其当需要从多家医院等数据提供方获取个体水平(Individual-Level)数据时,估计涉及混合效应(Mixed Effects)的二项逻辑回归模型(Binary Logistic Regression Model)变得尤为困难。联邦学习(Federated Learning)作为一种替代方案,可在保护个体观测数据隐私的同时,估计出可在个体层面解释的全局模型(Global Model),但该方法通常需要数据提供方与分析方之间进行多次迭代通信。
本文提出一种新策略:仅需数据提供方一次性共享汇总统计(Summary Statistics),即可实现混合效应二项逻辑回归模型的估计。该策略通过生成与真实数据汇总统计匹配的伪数据(Pseudo-Data),并在模型估计过程中使用这些伪数据替代实际不可用的原始数据。该方法支持包含连续变量和分类变量(Categorical Variables)的多种预测因子(Predictors),且通过模拟实验证明,其估计效果至少与使用集中式个体观测数据(Pooled Individual Observations)的方法相当。文中还提供了基于真实数据的示例分析。
与典型联邦学习算法不同,本方法无需复杂基础设施(Infrastructure)投入,避免了安全风险(Security Issues),同时兼具通信高效性(Communication Efficient)和对异质性(Heterogeneity)的处理能力。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号