
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多源域迁移学习与动态分布平衡的学生学业表现预测框架研究
【字体: 大 中 小 】 时间:2025年05月30日 来源:Engineering Applications of Artificial Intelligence 7.5
编辑推荐:
针对学生学业表现(SAP)预测中存在的跨域分布差异和数据不平衡问题,研究人员提出融合域选择与动态联合分布适配的多源迁移学习回归框架(MTSAP)。该研究通过混合特征提取器分离共性/特异特征,引入动态自适应因子平衡边缘分布与条件分布差异,实验显示预测误差(RMSE)平均降低21.05%,为智能教育系统提供跨学科泛化能力更强的解决方案。
随着信息技术与人工智能的深度融合,计算机辅助的智能教育系统在高等教育中得到广泛应用。其中,学生学业表现(SAP)预测作为核心任务,通过分析历史成绩、学习行为等数据预测未来学业成果,为个性化教学干预提供科学依据。然而,传统机器学习方法在处理跨域分布差异和数据不平衡问题时表现不佳,现有研究如Wang等提出的ProbSAP框架虽引入深度神经网络,但仍缺乏有效应对多源数据异质性的机制。
针对这一挑战,中国某高校的研究团队在《Engineering Applications of Artificial Intelligence》发表论文,提出多源域迁移学习回归框架(MTSAP)。该研究创新性地整合了交叉验证域选择、混合特征提取和动态联合分布适配技术:首先通过预设阈值筛选源域,随后采用混合特征提取器分离目标域与源域的共性特征及目标域特异特征,最后通过动态因子平衡边缘与条件分布差异。实验基于包含6个学院10012名学生的本科职业成就数据集(UCAD),结果显示该方法较基线模型平均提升预测精度21.05%,显著降低均方根误差(RMSE)。
关键技术包括:1) 基于UCAD多学科数据集构建跨学院迁移任务;2) 采用K折交叉验证筛选高相似性源域;3) 设计混合特征提取器分离共性/特异特征;4) 动态调整边缘分布与条件分布适配权重。
研究结果:
• 域选择与特征提取:通过最大均值差异(MMD)度量域间相似性,筛选出相关性>0.85的源域,混合特征提取使特征空间对齐精度提升18.7%。
• 动态分布适配:动态因子将边缘分布适配权重从初始0.6逐步调整至0.4,使条件分布在迭代后期主导迁移过程。
• 跨学科验证:在工程(C1)向文学(C4)的迁移任务中,RMSE降低23.8%,显著优于对比模型ProbSAP(16.2%)和XGBoost(9.5%)。
结论表明,MTSAP框架通过平衡多源域相似性与动态分布适配,有效解决了教育数据中的负迁移问题。其创新点在于:1) 建立可量化的源域筛选标准;2) 首创教育领域的动态联合分布适配机制;3) 验证框架在跨学科场景的鲁棒性。该研究为智能教育系统提供了可扩展的迁移学习范式,未来可拓展至MOOCs等在线教育平台。
生物通微信公众号
知名企业招聘