机器学习联合转录组全关联研究鉴定静脉血栓栓塞新型生物标志物

【字体: 时间:2025年09月16日 来源:British Journal of Haematology 3.8

编辑推荐:

  静脉血栓栓塞(VTE)的遗传风险评估长期依赖生物可解释性有限的SNPs。来自未知机构的研究人员创新性地整合转录组全关联研究(TWAS)、患者转录组数据和机器学习算法,通过LASSO和Boruta特征筛选从577个候选基因中锁定KLKB1等4个关键预测因子,构建的预测模型AUC高达0.913-0.970,为VTE风险预警提供了兼具高精度与生物学解释性的新工具。

  

静脉血栓栓塞(VTE)作为多因素疾病,其遗传风险评估长期受限于传统多基因风险评分(PRS)中单核苷酸多态性(SNP)的生物学解释性不足。这项研究开创性地将转录组全关联研究(TWAS)与机器学习联姻,通过对大规模全基因组关联研究(GWAS)数据的深度挖掘,从577个TWAS候选基因中筛选出与VTE密切相关的转录组特征。

研究团队巧妙运用最小绝对收缩选择算子(LASSO)和Boruta算法,结合107例VTE患者与148例健康对照的转录组数据,最终鉴定出KLKB1、ATG16L1、SELL和GLRX2四个核心预测基因。基于XGBoost、随机森林和逻辑回归构建的预测模型表现惊艳——训练队列受试者工作特征曲线下面积(AUC)达0.913-0.970,验证队列AUC保持在0.916-0.968的高水平。

通过沙普利加和解释(SHAP)和回归系数的双重验证,这些基因的预测贡献得到确证。该研究不仅为VTE风险预警提供了兼具高精度与生物学可解释性的新型分子标志物,更为复杂疾病的生物标志物发现提供了TWAS与机器学习协同分析的新范式。

相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号