机器学习加速揭秘神经发育障碍风险基因,为精准诊疗照亮前路
【字体:
大
中
小
】
时间:2025年02月27日
来源:AJHG 9.8
编辑推荐:
为解决众多神经发育障碍(NDD)风险基因待发现的问题,研究人员开展用机器学习识别风险基因的研究,构建模型预测能力强,成果可助力基因发现研究。
尽管在相关研究领域已取得重大进展,但仍有成千上万的神经发育障碍(Neurodevelopmental Disorder,NDD)风险基因有待发现。研究人员提出了一种利用机器学习加速识别 NDD 风险基因的计算方法。首先,研究显示,仅基于单细胞 RNA 测序(Single-Cell RNA Sequencing)数据训练的模型,就能稳健地预测与自闭症谱系障碍(Autism Spectrum Disorder,ASD)、发育性癫痫性脑病(Developmental and Epileptic Encephalopathy,DEE)和发育迟缓(Developmental Delay,DD)相关的基因。值得注意的是,研究人员发现,在人类发育中的大脑皮层里,具有单等位基因和双等位基因遗传模式的基因,其表达模式存在差异。随后,研究人员在半监督机器学习框架(mantis-ml)中,将基因表达数据与 300 种其他特征(包括不耐受性指标、蛋白质 - 蛋白质相互作用数据等)进行整合,针对这些疾病训练了特定遗传模式的模型。这些模型具有强大的预测能力(受试者工作特征曲线下面积AUCs:0.84 - 0.95)。与仅使用基因不耐受性指标相比,排名靠前的基因中,高可信度 NDD 风险基因在单等位基因模型中富集程度高达 2 倍,在双等位基因模型中更是达到 6 倍。此外,排名在前十分之一的基因,获得文献支持的可能性比排在后十分之一的基因高出 45 到 180 倍。总体而言,这项研究提供了可靠的 NDD 风险基因预测结果,能够为大规模的基因发现研究提供补充,同时也凸显了在基因风险预测中考虑遗传因素的重要性。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号