
-
生物通官微
陪你抓住生命科技
跳动的脉搏
机器学习联合转录组全关联研究鉴定静脉血栓栓塞新型生物标志物
【字体: 大 中 小 】 时间:2025年09月16日 来源:British Journal of Haematology 3.8
编辑推荐:
静脉血栓栓塞(VTE)的遗传风险评估长期依赖生物可解释性有限的SNPs。来自未知机构的研究人员创新性地整合转录组全关联研究(TWAS)、患者转录组数据和机器学习算法,通过LASSO和Boruta特征筛选从577个候选基因中锁定KLKB1等4个关键预测因子,构建的预测模型AUC高达0.913-0.970,为VTE风险预警提供了兼具高精度与生物学解释性的新工具。
静脉血栓栓塞(VTE)作为多因素疾病,其遗传风险评估长期受限于传统多基因风险评分(PRS)中单核苷酸多态性(SNP)的生物学解释性不足。这项研究开创性地将转录组全关联研究(TWAS)与机器学习联姻,通过对大规模全基因组关联研究(GWAS)数据的深度挖掘,从577个TWAS候选基因中筛选出与VTE密切相关的转录组特征。
研究团队巧妙运用最小绝对收缩选择算子(LASSO)和Boruta算法,结合107例VTE患者与148例健康对照的转录组数据,最终鉴定出KLKB1、ATG16L1、SELL和GLRX2四个核心预测基因。基于XGBoost、随机森林和逻辑回归构建的预测模型表现惊艳——训练队列受试者工作特征曲线下面积(AUC)达0.913-0.970,验证队列AUC保持在0.916-0.968的高水平。
通过沙普利加和解释(SHAP)和回归系数的双重验证,这些基因的预测贡献得到确证。该研究不仅为VTE风险预警提供了兼具高精度与生物学可解释性的新型分子标志物,更为复杂疾病的生物标志物发现提供了TWAS与机器学习协同分析的新范式。
生物通微信公众号
知名企业招聘