基于人工智能与脑库数据的进行性核上性麻痹早期亚型鉴定及疾病进展规律揭示
《Journal of Neurology》:Early subtypes and progressions of progressive supranuclear palsy: a data-driven brain bank study
【字体:
大
中
小
】
时间:2025年10月19日
来源:Journal of Neurology 4.6
编辑推荐:
本研究针对进行性核上性麻痹(PSP)临床异质性高、早期分型困难的问题,开发了集成ChatGPT的自动化流程分析588例尸检确诊PSP病例的临床资料,通过无监督聚类和决策树模型首次发现以早期姿势和额叶功能障碍为特征的PSP-PF亚型,其病程最短(6年)、tau蛋白负荷最高。该数据驱动模型为临床早期分型、预后预测及临床试验患者筛选提供了客观工具。
在神经退行性疾病领域,进行性核上性麻痹(Progressive Supranuclear Palsy, PSP)一直以其复杂的临床表现挑战着临床医生的诊断能力。传统上,PSP被等同于理查德森综合征(PSP-RS),典型表现为垂直性核上性凝视麻痹和早期跌倒。然而,随着认识的深入,人们发现PSP存在多种表型,包括姿势不稳型(PSP-PI)、帕金森综合征型(PSP-P)、言语/语言障碍型(PSP-SL)、额叶表现型(PSP-F)、眼动功能障碍型(PSP-OM)和皮质基底节综合征型(PSP-CBS)。这些亚型虽然被运动障碍协会(MDS)的诊断标准所收录,但现有的分类系统存在明显局限性——各亚型并非互斥,且随着病程进展,许多病例最终被重新归类为PSP-RS,这可能低估了PSP真正的表型多样性。
更棘手的是,早期准确区分PSP亚型对于预测疾病进展速度和预后至关重要,但这一直缺乏客观、可重复的工具。临床记录中症状出现时间的提取需要大量人工劳动,也成为大规模分析的瓶颈。虽然大型语言模型(LLM)已在临床数据抽取的简单任务中展现潜力,但尚未成功应用于需要同时判断症状存在及其出现时间的复杂任务。
面对这些挑战,研究人员在《Journal of Neurology》上发表了一项创新性研究,他们开发了一套融合人工智能的自动化流程,利用大型尸检确认的PSP脑库数据集,旨在客观定义PSP的早期临床亚型,并阐明其独特的疾病进展规律和病理基础。
为了高效处理海量临床数据,研究团队建立了三阶段自动化流水线:首先索引患者文档,然后确定症状存在,最后识别症状出现时间。该流水线在每个环节都使用了经过人工标注的文本片段对GPT-4o模型进行微调,从而能够从53,527页医疗记录中自动提取195项临床表现及其出现时间。研究纳入了588例尸检确诊且无显著神经退行性共病理的PSP病例,这些病例均有至少两个时间点(一个在发病三年内,一个在三年后)的12项关键症状记录。
通过基于12项早期症状的无监督聚类分析(UMAP),研究识别出六个明显不同的集群(S1-S6),它们在疾病持续时间上存在显著差异。随后,研究人员将复杂的聚类模型提炼为一个简化的决策树模型,该模型仅使用五个临床表现:额叶表现、姿势不稳、眼动功能障碍、言语/语言障碍和帕金森综合征,就能以高准确度(0.878±0.034)和AUC(0.979±0.014)对早期PSP亚型进行互斥性分类。最终模型定义了七种早期亚型:PSP-PF(姿势和额叶功能障碍)、PSP-RS、PSP-PI、PSP-P、PSP-SL、PSP-F和PSP-OM。
研究发现,不同亚型的症状出现顺序和疾病进展速度各异。新发现的PSP-PF亚型表现为极具侵袭性的病程,患者中位疾病持续时间最短,仅为6年。其特征是早期(发病后约0.3年)出现姿势不稳,并很快(约1.6年)出现额叶症状。相比之下,PSP-P亚型的病程最为缓慢,中位持续时间达10年,以震颤等帕金森症表现起病。PSP-F亚型患者则最早出现行为或执行功能异常(额叶表现),其疾病持续时间(9年)仅次于PSP-P。生存分析表明,与其他亚型相比,PSP-PF患者的死亡风险显著更高,将亚型信息纳入预测模型能显著提高预后判断的准确性(C指数增加0.100)。
尸检神经病理学评估显示,不同亚型的大脑tau蛋白病理负担分布存在差异。侵袭性强的PSP-PF亚型在皮质(如额上回)和皮质下区域(如丘脑束、红核、中脑顶盖等)均显示出较高的总tau评分。而PSP-SL亚型的tau病理更多地累积在额叶和颞叶皮质。此外,PSP-F亚型中杏仁核TDP-43病理的检出率显著高于PSP-PF亚型,提示TDP-43病理可能参与了PSP临床异质性的形成。
分析发现,具有皮质基底节综合征表现的患者大多同时伴有其他核心症状(如眼动障碍或姿势不稳),因此未被决策树模型识别为一个独立的早期亚型。这支持了先前认为PSP-CBS通常是更广泛PSP病理的一部分的观点。
本研究通过数据驱动的方法,成功揭示了一种新的、具有侵袭性的PSP表型——PSP-PF,并提供了一个简洁、客观的决策树模型用于早期亚型鉴别。该模型不仅能帮助临床医生在床旁更准确地进行分型和预后判断,还有助于在疾病早期筛选同质化的患者群体进入临床试验,从而加速治疗方法的开发。研究所采用的自动化临床特征提取流程,也为未来其他神经退行性疾病的类似研究提供了可借鉴的强大工具。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号