
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于非靶向代谢组学的遗传代谢病诊断算法开发与迭代优化
【字体: 大 中 小 】 时间:2025年07月28日 来源:Metabolomics 3.5
编辑推荐:
本研究针对遗传代谢病(IMD)诊断中样本稀缺、代谢通路知识不完整的难题,开发了一种基于非靶向代谢组学的迭代优化算法。研究团队通过稀疏层次聚类构建IMD特异性代谢特征(IMD signature),利用77例IMD患者和136例对照样本验证,实现42%的Top1诊断准确率。该算法支持持续纳入新数据优化模型,为罕见病诊断提供了灵活的数据驱动框架。
遗传代谢病(IMD)如同一座复杂的生化迷宫,全球已发现超过1,400种相关疾病。尽管许多IMD可通过早期干预改善预后,但传统诊断流程需要多步骤生化检测和基因验证,耗时且易漏诊。更棘手的是,这类疾病单个病种患者稀少,代谢通路知识零散,使得基于大数据的AI诊断模型难以施展拳脚。哥本哈根大学(University of Copenhagen)与哥本哈根大学医院( Copenhagen University Hospital Rigshospitalet)的跨学科团队在《Metabolomics》发表的研究,带来了一把破解迷宫的智能钥匙。
研究人员采用液相色谱-质谱联用(LC-MS)技术分析213份血浆样本(77例IMD/136例对照),开发了三阶段诊断算法:首先通过稀疏层次聚类筛选差异代谢物构建初始IMD特征谱;其次采用迭代策略整合新样本优化特征谱;最终通过代谢谱相似性评分实现诊断。关键技术包括:双训练集设计(IMD-对照/IMD-其他IMD对比)、Z-score标准化、交叉验证策略(100次随机子采样)以及动态权重调整机制。
4.1 案例研究1
对35种IMD的分析显示,经过3轮迭代后诊断准确率提升至60%(Top3)。典型如枫糖尿症(MSUD)不仅检出支链氨基酸代谢标志物(亮氨酸、酮亮氨酸),还发现羟基苯乳酸等潜在新标志物。但治疗中样本可能干扰特征选择,如MSUD样本因饮食干预出现酪氨酸代谢物异常。
4.2 案例研究2
在文献数据集验证中,算法对11种IMD的Top1诊断准确率达73.5%,其中MSUD和甲基丙二酸血症(MMA)分别实现90%和80%的识别率。值得注意的是,甲基丙二酸血症伴高胱氨酸尿症(CblC型)与普通MMA共享5个代谢特征,需通过二次诊断区分。
该研究突破性地解决了小样本条件下IMD诊断的三大痛点:通过迭代机制实现"越用越准"的动态优化;采用无监督学习避免过拟合;允许专家介入调整特征权重。尽管存在治疗样本干扰、代谢物注释不全等局限,这种模块化算法为新生儿筛查、疑难病例会诊提供了新范式。正如作者强调,随着更多IMD特征谱的完善,该框架有望成为连接代谢组学与临床诊断的智能桥梁。
生物通微信公众号
知名企业招聘