基因组测序、靶向代谢组学与机器学习融合提升新生儿筛查精准度

《BMC Medical Genomics》:Improving newborn screening accuracy through genome sequencing, targeted metabolomics, and machine learning

【字体: 时间:2025年11月20日 来源:BMC Medical Genomics 2

编辑推荐:

  本研究针对新生儿筛查(NBS)中串联质谱(MS/MS)方法假阳性率高、需多次确认检测导致诊断延迟的问题,研究人员开展了整合基因组测序、靶向代谢组学和人工智能/机器学习(AI/ML)的主题研究。结果表明,代谢组学结合AI/ML能100%识别真阳性,基因组测序将假阳性降低98.8%,但单独使用灵敏度不足。该研究为通过多组学整合提高NBS准确性、实现罕见病早期诊断提供了新策略。

  
每个新生命的降临都承载着家庭的希望,而新生儿筛查就像一道守护健康的重要防线。目前,基于串联质谱(tandem mass spectrometry, MS/MS)的新生儿筛查能够检测推荐统一筛查面板(Recommended Uniform Screening Panel, RUSP)上的40多种遗传代谢病(inborn metabolic disorders, IMD),为早期干预提供了宝贵机会。然而,这道防线存在一个棘手问题:MS/MS方法虽然敏感,但特异性不足,导致假阳性率偏高。这意味着许多健康新生儿会被误判为疑似患者,不得不接受重复检测和不必要的预防性治疗,不仅增加了家庭的焦虑和医疗负担,更可能导致真正的确诊延迟。
为了解决这一临床痛点,Xie等人在《BMC Medical Genomics》上发表了一项创新研究,探索如何通过整合基因组测序、靶向代谢组学和人工智能/机器学习(artificial intelligence/machine learning, AI/ML)来提升新生儿筛查的准确性。研究人员提出一个关键问题:能否通过多组学数据融合,在保证不漏诊的前提下大幅减少假阳性?这不仅关乎筛查效率,更关系到每个新生儿的健康权益。
为了回答这个问题,研究团队设计了一个严谨的实验方案。他们收集了119例经加州新生儿筛查项目初筛为阳性的干血斑(dried blood spots, DBS)样本,涵盖四种代谢疾病:戊二酸血症Ⅰ型(glutaric acidemia type 1, GA-I)、丙酸血症/甲基丙二酸血症(propionic acidemia/methylmalonic acidemia, PA/MMA)、鸟氨酸氨甲酰基转移酶缺乏症(ornithine transcarbamylase deficiency, OTCD)和极长链酰基辅酶A脱氢酶缺乏症(very long-chain acyl-CoA dehydrogenase deficiency, VLCADD)。这些样本包括35例最终确诊的真阳性病例和84例假阳性病例。
研究采用了几项关键技术方法:从干血斑中提取DNA进行基因组测序,分析16个疾病相关基因的变异;使用靶向液相色谱-串联质谱(LC-MS/MS)方法检测121种代谢物;应用随机森林(Random Forest, RF)机器学习模型区分真阳性和假阳性。所有分析均与加州新生儿筛查项目的最终诊断结果进行比对。
基因组测序结果揭示了重要的遗传学发现。在35例真阳性病例中,88.6%(31/35)携带了两个可报告的变异组合,包括致病性/可能致病性(pathogenic/likely pathogenic, P/LP)变异或意义不明确的变异(variant of uncertain significance, VUS)。然而,测序未能检测到4例真阳性病例的致病变异,显示了其作为独立检测方法的局限性。
假阳性病例的分析发现了更有趣的现象:在84例假阳性中,62例(74%)未发现相关基因变异,但22例(26%)携带了单个P/LP变异或罕见VUS。特别值得注意的是,在29例VLCADD假阳性中,15例(51.7%)为ACADVL基因杂合携带者,统计学分析显示这种富集极具显著性(P=4.66×10-7)。
代谢物水平分析提供了重要的生物学见解。研究人员比较了VLCADD和PA/MMA的关键生物标志物水平在不同组别间的差异。对于VLCADD,C14:2、C14:1和C14:2-OH同量异位体等代谢物水平在患者中最高,假阳性ACADVL变异携带者居中,非携带者最低。这种梯度变化表明,单个ACADVL等位基因的缺陷足以引起代谢物水平的轻微升高,从而触发假阳性结果。
三种二级筛查方法的性能比较显示了各自的优势和局限性。AI/ML辅助的代谢组学分析实现了100%的灵敏度,正确识别了所有35例真阳性,但减少假阳性的能力因疾病而异:对GA-I和OTCD效果最佳(分别减少80%和100%假阳性),对PA/MMA和VLCADD相对较弱(分别减少77.4%和41.4%假阳性)。基因组测序在减少假阳性方面表现卓越,消除了GA-I、PA/MMA和OTCD的所有假阳性,并将VLCADD假阳性减少96.6%,但其灵敏度(88.6%)不足以作为独立检测方法。
整合三种方法的效果最为显著。通过以100%灵敏度检测真阳性为目标,整合策略将假阳性总体减少了98.8%,展示了多组学方法在提升新生儿筛查精准度方面的巨大潜力。
研究的讨论部分深入分析了这些发现的临床意义。假阳性病例中杂合变异携带者的富集现象提示,新生儿筛查中的假阳性结果可能部分反映了真实的遗传状态,而非单纯的检测误差。这一发现将新生儿筛查与产前携带者筛查联系起来,建议将父母携带者筛查信息整合入新生儿筛查解读中,可能进一步提高准确性。
然而,研究也指出了几个重要局限性。基因组测序在约11.4%的真阳性病例中未能识别致病变异,存在假阴性风险。靶向代谢组学数据来自储存时间较长的干血斑样本,某些代谢物可能因降解而未被可靠检测。此外,研究中缺乏确诊的PA病例,限制了该方法对PA/MMA异质性亚型的全面评估。
从更广阔的视角看,这项研究为新生儿筛查的未来发展指明了方向。代谢组学分析不仅能够改善传统遗传代谢病的筛查,还可能支持筛查范围的扩展至其他罕见病。研究表明,即使是非典型代谢疾病,也可能在氨基酸和酰基肉碱等基础代谢物上留下可检测的痕迹。例如,杜氏肌营养不良症(Duchenne Muscular Dystrophy, DMD)和囊性纤维化(cystic fibrosis, CF)等疾病中已发现特异性代谢特征,这为通过代谢组学扩展新生儿筛查提供了理论依据。
该研究的结论强调,没有任何单一方法能够提供全面的解决方案,但基因组测序、代谢组学分析和AI/ML的整合显著提高了新生儿筛查的准确性。代谢组学结合AI/ML能可靠识别真阳性,而基因组测序在减少假阳性方面发挥关键作用。致病变异携带者易出现假阳性结果的现象,突出了产前携带者筛查在优化新生儿筛查结果中的潜在价值。这种多组学整合策略不仅有望提升现有筛查项目的精准度,还可能推动新生儿筛查向更广泛的罕见病领域扩展,最终实现更早诊断、更及时干预,改善患儿的健康结局。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号