
-
生物通官微
陪你抓住生命科技
跳动的脉搏
一种无损的一次性分布式算法,用于解决多站点广义线性模型中的异质性问题
《Journal of the American Medical Informatics Association》:A Lossless One-shot Distributed Algorithm for Addressing Heterogeneity in Multi-Site Generalized Linear Models
【字体: 大 中 小 】 时间:2025年11月20日 来源:Journal of the American Medical Informatics Association 4.6
编辑推荐:
提出隐私保护的分布式无损耗算法COLA-GLM-H,通过机构级汇总统计重构全局似然,适用于多机构异构医疗数据整合,验证其在COVID-19后心血管风险及死亡率风险因素分析中的有效性,兼顾计算效率与准确性。
我们提出了一种具有异构性感知能力的协作式一次性无损算法(COLA-GLM-H),用于广义线性模型(Generalized Linear Model)。这是一种新颖的一次性无损分布式算法,能够在不共享患者数据的情况下整合来自不同机构的异构数据,从而保护患者隐私。
广义线性模型(GLMs)在医学研究中被广泛用于分析多种类型的结果。在多机构环境中,我们证明了仅使用机构级别的汇总统计信息即可重建全局似然分布,从而实现无需访问个体记录的无损估计。我们在两个实际研究中验证了COLA-GLM-H的有效性:(1)美国的一个儿科中心化网络(719,383名患者),用于评估COVID-19后的长期心血管风险;(2)一个国际性的去中心化网络,包含来自三个国家的120,429名住院患者的数据,用于评估COVID-19死亡的风险因素。
在中心化网络中,COLA-GLM-H产生的估计结果与汇总分析的结果完全一致。在去中心化环境中,该算法仅通过一次通信即可有效整合多个临床机构的异构数据。
COLA-GLM-H是一种保护隐私、无损且通信和计算效率高的多机构研究解决方案。它考虑了机构间的异质性,并支持指数族中的所有结果类型,从而实现了安全、可扩展和准确的协作临床研究分析。
生物通微信公众号
知名企业招聘