
-
生物通官微
陪你抓住生命科技
跳动的脉搏
一种保护隐私的联邦学习方法,用于跨学校进行可解释的学生风险预测
《Scientific Reports》:Privacy-preserving federated learning for interpretable student at-risk prediction across schools
【字体: 大 中 小 】 时间:2026年06月11日 来源:Scientific Reports 3.9
编辑推荐:
摘要针对高风险学生的早期预警系统越来越多地依赖于基于敏感教育记录训练的预测模型。然而,集中式的学习流程引发了关于隐私、机构数据主权和可审计性的担忧,尤其是在学生级别的数据需要在不同机构之间共享时。本研究提出了“具有差分隐私和训练前验证的联邦学习用于高风险学生预测”(FL-AtRi
针对高风险学生的早期预警系统越来越多地依赖于基于敏感教育记录训练的预测模型。然而,集中式的学习流程引发了关于隐私、机构数据主权和可审计性的担忧,尤其是在学生级别的数据需要在不同机构之间共享时。本研究提出了“具有差分隐私和训练前验证的联邦学习用于高风险学生预测”(FL-AtRisk-DP-PBT)框架,这是一种用于多所学校高风险学生预测的联邦学习方法,它结合了基于联邦平均(FedAvg)的训练机制、客户端端的差分隐私(DP)技术以及用于验证客户端参与度和模型状态的PBT协议。该框架使用了一个单一的可解释全局逻辑回归分类器,并在三种教育数据集上进行了评估:包含14,003名学生的合并队列(划分为10所模拟学校)、xAPI-Edu-Data点击流语料库以及学生考试表现数据集。在主要数据集上,集中式模型的准确率为99.14%,F1值为0.9915,曲线下面积(AUC)为0.9998;而FedAvg和FL+DP+PBT变体的准确率分别为98.61%/0.9863/0.9993和98.00%/0.9802/0.9992。在xAPI和考试数据集上,FL+DP+PBT的准确率约为93–94%,F1值约为0.92–0.93,AUC约为0.97–0.98。基于系数的特征重要性分析表明,FL+DP+PBT保持了与集中式和非隐私保护联邦模型相似的可解释性。与仅使用DP的联邦训练相比,PBT机制仅引入了微小的指标变化。总体而言,这些结果表明,可解释的联邦高风险学生预测方法能够在保持学生记录本地化的同时,保留竞争性的预测能力,并加入隐私保护和可验证的训练机制。这些发现应在所评估的数据集、模拟的学校划分以及标签定义的背景下进行解读。