迁移学习提升多基因风险评分在药物反应预测中的精准医学价值
《npj Genomic Medicine》:Improving polygenic risk score based drug response prediction using transfer learning
【字体:
大
中
小
】
时间:2025年11月22日
来源:npj Genomic Medicine 4.8
编辑推荐:
本研究针对传统疾病多基因风险评分(PRS-Dis)在药物基因组学(PGx)预测中遗传力捕捉不足的瓶颈,创新性地提出PRS-PGx-TL迁移学习方法。该方法通过整合大规模疾病GWAS摘要统计与个体水平PGx数据,结合二维惩罚梯度下降算法优化预后与预测效应,显著提升了药物反应预测精度与患者分层效果。在IMPROVE-IT临床试验数据验证中,其预测R2提升3%-8%,交互作用p值优化达13倍,为个体化用药提供了高效工具。
在精准医学浪潮中,多基因风险评分(PRS)已成为疾病风险预测的明星工具,但其在药物反应预测领域的应用却步履维艰。传统方法直接套用疾病相关PRS(PRS-Dis),犹如试图用城市地图导航森林——虽有关联却难精准。究其根源,药物反应同时受预后效应(基因主效应)和预测效应(基因-治疗交互作用,GTI)调控,而疾病PRS仅能捕捉前者,导致遗传力解释度大打折扣。更棘手的是,PGx研究样本量通常有限,且缺乏独立验证数据集,使得直接构建PGx特异性PRS(PRS-PGx)如同在荒漠中寻找绿洲。
为破解这一难题,耶鲁大学与默克公司的研究团队在《npj Genomic Medicine》发表突破性成果,提出PRS-PGx-TL迁移学习框架。该方法巧妙借鉴图像识别中的“预训练-微调”思路,将疾病GWAS摘要统计作为知识基座,通过二维惩罚梯度下降算法在PGx数据上同步优化预后与预测效应权重。其创新性体现在三方面:首次实现从疾病表型到药物反应表型的跨领域知识迁移;开发针对GTI效应的动态优化策略;引入六种差异化微调路径(M1-M6)适配不同临床场景。
研究以IMPROVE-IT临床试验(NCT00202878)的5661名患者基因组数据为靶点队列,结合GLGC联盟的LDL-C疾病GWAS摘要统计。通过嵌套交叉验证架构,先利用Lassosum、PRS-CS等基线模型生成SNP初始权重,再采用二维梯度下降算法(含L2正则化与学习率动态调整)微调效应值。算法支持双参数同步更新(βG与βGT)或仅优化预测效应,以R2或条件R2为调参准则。
在模拟数据中,PRS-PGx-TL全系模型(M1-M6)均优于传统PRS-Dis。显示,M1/M2在整体R2提升方面表现突出(0.165→0.17),而M3-M6更擅长优化预测效应,其GTI交互作用p值降低达数量级。当遗传相关性(ρDT)从0.2升至0.8时,所有模型性能同步提升,证实疾病数据迁移的有效性。
在IMPROVE-IT数据集预测LDL-C对数折叠变化时,PRS-PGx-TL展现临床价值。对应结果表明,以PRS-CS为基线时,M5将预测p值从0.063优化至9.60×10-5,且患者分层曲线呈现显著梯度变化(图4)。值得注意的是,稀疏模型(Lassosum)在因果SNP比例较低时迁移效果更佳,而贝叶斯方法(PRS-CS)对多基因架构更稳健。
本研究开创性地将迁移学习引入PGx-PRS构建,解决了小样本场景下预测效应估计不准的痛点。其核心价值在于:通过疾病数据迁移提升预测效能,利用动态算法捕捉GTI效应,提供多策略适配临床需求(如M1适用于整体预测优化,M3利于患者分层)。未来工作需拓展至二分类终点、整合药物靶点网络,并探索L1正则化与多超参数优化。PRS-PGx-TL框架为个体化用药提供了可解释、可迁移的计算工具,有望加速精准医疗在临床试验与真实世界中的应用落地。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号