
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于nTMS的皮质丘脑纤维研究在预测术后失语症中的关键作用:深度学习整合纤维追踪的创新探索
【字体: 大 中 小 】 时间:2025年09月13日 来源:Human Brain Mapping 3.3
编辑推荐:
本研究通过术前导航经颅磁刺激(nTMS)语言定位与弥散张量成像纤维追踪(DTI FT)技术,结合深度学习(DL)算法,系统分析语言网络整体特性与关键纤维束(尤其是皮质丘脑纤维,CtF)在预测左半球语言区病变患者术后失语症(POA)中的价值。研究揭示CtF的显影比率(VR)与FA敏感性特征可作为重要预测指标,所构建的DL模型展现出较高预测效能(AUC=0.82),为术前精准评估语言网络完整性及手术风险提供了新策略。
术后失语症(POA)是语言功能区病变手术后的常见并发症。本研究旨在通过整合术前导航经颅磁刺激(nTMS)语言定位、弥散张量成像纤维追踪(DTI FT)及深度学习(DL)算法,提升POA的预测准确性。研究回顾性纳入100例左半球病变患者(43例发生POA,57例未发生POA),在FA阈值(FAthres)0.10和0.15下分析语言网络整体参数(如纤维总体积Vfibertotal、平均各向异性分数FAwhole及显影纤维束数量nvis),并评估个体纤维束的显影比率(VR)和FA敏感性显影比例。结果显示,非失语组(NA)在多项参数上显著优于POA组,尤其皮质丘脑纤维(CtF)的VR在NA组中显著更高(86.0% vs. 58.1%, p=0.003),而POA组中CtF的FA敏感性显影比例更高(11.6% vs. 0.0%, p=0.013)。所开发的DL模型预测POA的敏感性达72.3%,特异性为85.3%,曲线下面积(AUC)为0.82。研究表明,基于nTMS的纤维追踪结合DL能有效预测POA,CtF在评估语言预后中具有突出潜力,但其在模型中的独立预测贡献仍有限。
脑病变手术的核心目标是在最大化切除病灶的同时保留神经功能。语言作为高级脑功能,尤其易受损,即便病变不在传统语言区亦可能受累。nTMS为术前无创评估语言功能提供了工具,结合DTI FT可实现皮质与皮下结构的联合可视化,为手术规划提供重要信息并减少术后功能缺损。尽管应用先进术前功能诊断技术,部分患者术后仍出现手术相关语言障碍,即POA。近年来,结构网络分析促进了对语言功能的理解,左半球病变患者中多个纤维束如IFOF、FAT、SLF和AF被证实与语言表现相关。然而,个体纤维束对语言网络的贡献是动态的,且受神经可塑性影响。除经典双流语言模型中的纤维束外,其他纤维如连合纤维(CF)、皮质核束(CNT)及皮质丘脑纤维(CtF)也可能参与语言功能。CtF连接丘脑与前颞叶及外侧额叶区域,被认为参与词汇与语义处理。既往研究多基于单一FA阈值分析语言相关纤维束的变化,缺乏不同阈值下的系统比较。随着FA阈值升高,显影纤维的体积和密度降低,可能导致某些纤维无法显影,提示其脆弱特性。这种显影变化也反映了确定性纤维追踪中特异性与敏感性的固有权衡:高FA阈值减少假阳性流线,但可能遗漏解剖学有效的纤维;低阈值提高敏感性却可能包含不合理的纤维。为此,本研究选取0.10和0.15两个代表性FA阈值,以在保持解剖有效性的同时检测临床相关变化。此外,尽管研究领域逐渐采用更先进的纤维重建方法如约束球形反卷积(CSD)模型,确定性DTI纤维追踪因其与临床平台的整合性、与nTMS映射的兼容性及稳健的可重复性,仍在神经外科规划中常规使用。本研究创新性地引入医师对个体纤维束的识别及多个纤维束相关参数训练神经网络模型,以最小化系统误差并提升模型性能。
本研究验证以下假设:(1)基于nTMS的纤维追踪所获语言网络特性在POA与非POA患者间存在差异;(2)不同语言相关纤维束的显影在两组间不同;(3)DL模型可辅助预测术后语言障碍。
研究经慕尼黑工业大学当地伦理委员会批准(注册号:222/14和192/18),所有研究遵循赫尔辛基宣言,患者均签署知情同意。
本研究事后分析接受术前nTMS语言映射及nTMS纤维追踪的患者。纳入标准为:德语母语、年龄超过18岁、诊断为左半球围侧裂沟病变累及语言相关皮质或皮下结构。排除标准包括其他神经或精神疾病、MRI或nTMS禁忌症(如心脏起搏器)。利手评估采用爱丁堡利手问卷。患者根据2018至2022年数据完整性回顾性筛选,包括完整nTMS数据、术前MRI及术后随访记录。为确保结果可靠性,仅纳入术后约1个月有语言评估记录的患者。该时间点用于区分POA与围术期短暂语言障碍。研究组包含43例术后失语持续超过1个月的患者(POA组),另从机构数据库中随机选取57例无术后失语患者(NA组),两组均符合同样纳入标准。最终100例患者的数据集基于本中心既往DL模型开发经验确定,以确保充分收敛与特征稳定性,同时保持合理的POA与NA比例以提升模型泛化能力。
术前采用Philips Ingenia 3T MRI采集数据,包括扩散加权成像(DWI)序列(32个优化梯度方向,TR/TE 5000/78 ms,体素大小2×2×2 mm3,b值1000 s/mm2)及对比剂增强T1加权图像(TR/TE 9/4 ms,各向同性体素大小1 mm3)。
术前使用Nexstim eXimia NBS系统(5.1.1版)进行nTMS语言映射。根据皮质分区系统(CPS),优势半球分为21个解剖与功能定义的语言相关区域,共46个预定义皮质刺激靶点。各靶点采用重复经颅磁刺激(rTMS)以110%个体静息运动阈值、5脉冲、1 Hz频率刺激。刺激期间进行物体命名(ON)任务,任务表现经音频视频记录并由NexSpeech Analyzer软件分析。命名错误分为四类:表现错误、语义错误、无反应及犹豫。任何错误类型的刺激点定义为语言阳性点,以DICOM格式导出(深度15、20、25 mm),作为后续纤维追踪的种子点。
纤维追踪在Brainlab Elements平台(3.1.0版)基于确定性追踪算法进行,使用术前DTI数据及nTMS语言映射。扩散MRI数据经Brainlab Elements畸变校正模块预处理(包括涡流及头动校正)。对比增强T1加权图像与扩散图像经Elements图像融合模块自动配准。nTMS语言阳性点经颅骨标志标定注册至解剖空间。所有语言阳性点扩展为5 mm半径区域作为种子区,采用最小纤维长度(FL)100 mm、FA阈值0.10和0.15进行确定性纤维追踪。个体语言相关纤维束(AF、CF、CNT、CtF、SLF、ILF、IFOF)由两名经验神经外科医师独立识别,分歧经共识解决。脑与肿瘤体积经Elements平台及SmartBrush工具分割,左脑体积计算排除肿瘤区域。分析各纤维束的显影比率(VR)及FA敏感性显影比例(RatioFAsens)。此外,分析总显影纤维束数(nvis)、纤维总体积(Vfibertotal)、整个网络的平均FA(FAwhole)、每纤维束平均体积(Vfiberavg)及纤维-脑比率(Vfibertotal/左脑体积)。仅在校低FA阈值(0.10)显影而未在较高阈值(0.15)显影的纤维束定义为FA敏感性纤维束,其比率为RatioFAsens。
组间比较采用Fisher精确检验、独立t检验、卡方检验及Mann-Whitney U检验(数据非正态分布时)。VR与RatioFAsens比较采用Fisher精确检验。
数据经Pandas库处理,特征选择基于与目标变量(POA)的相关性(绝对值>0.2)及Spearman检验(p<0.05)。数据按80:20随机分为训练集与测试集,标准化采用StandardScaler。构建深度神经网络(DNN)包含输入层、两个隐藏层(128和64神经元,ReLU激活)、输出层(Sigmoid激活),训练中使用丢弃层(比率0.2)及批量归一化(BN)以提升训练稳定性与泛化能力。模型编译采用Adam优化器及二元交叉熵损失函数,训练50轮次,批量大小100,性能指标经5次迭代平均。采用SHAP值分析特征贡献。
两组在性别、利手、年龄、病变位置及大小上无显著差异。病理诊断包括高级别胶质瘤(HGG)43例(NA组21例,POA组22例)、低级别胶质瘤(LGG)32例(NA组17例,POA组15例)及其他病变25例(NA组19例,POA组6例)。nTMS语言阳性点数量(NA组15.4±7.7,POA组17.3±10.7,p=0.484)及阳性皮质区数量(NA组11.2±3.7,POA组11.5±3.8,p=0.720)无组间差异。空间分布上,两组最常受累区域均为后额中回(pMFG)、中央前回中部(mPrG)及缘上回后部(pSMG),阳性率超65%。虽部分区域如中颞上回(mSTG)及岛盖部额下回(opIFG)在POA组数值更高,但差异未达显著性。
在FA阈值0.15下,NA组的nvis显著更高(5.6 vs. 4.8, p=0.004)。NA组的Vfibertotal在两种阈值下均显著更高(FAthres=0.10: 61.08 vs. 51.74 cm3, p=0.029;FAthres=0.15: 36.88 vs. 29.57 cm3, p=0.008)。NA组的FAwhole亦显著更高(FAthres=0.10: 0.38 vs. 0.35, p=0.006;FAthres=0.15: 0.42 vs. 0.39, p=0.006)。Vfiberavg仅在FA阈值0.15下有显著差异(7.30 vs. 5.77 cm3, p=0.024)。NA组的纤维-脑比率在两种阈值下均更高(FAthres=0.10: 6.69 vs. 5.58, p=0.013;FAthres=0.15: 4.02 vs. 3.17, p=0.004)。
仅CtF在FA阈值0.15下的VR在NA组显著更高(86.0% vs. 58.1%, p=0.003)。CtF的RatioFAsens在POA组显著更高(11.6% vs. 0.0%, p=0.013)。其他纤维束如AF、SLF虽在POA组VR有降低趋势,但未达显著性。
所开发DL模型敏感性72.3%,特异性85.3%,阳性预测值(PPV)82.8%,阴性预测值(NPV)75.2%,AUC 0.82。SHAP分析显示,FA阈值0.15下CtF的识别对预测准确性贡献最大(SHAP值0.05)。
POA患者语言网络的Vfibertotal、FAwhole及纤维-脑比率均显著降低,提示其术前语言网络已受损。这种损伤可能源于肿瘤相关水肿、浸润等对白质纤维完整性的破坏。nvis与Vfiberavg仅在较高FA阈值(0.15)下显差异,因低阈值易产生冗余纤维。FA降低是网络性能受损的指标,与既往研究一致。结果表明,无POA患者术前语言网络更稳健,而网络参数降低者POA风险更高。
仅CtF的VR与RatioFAsens在两组间差异显著,表明CtF在POA患者中更脆弱、对FA阈值变化更敏感。AF、SLF等虽呈类似趋势,但未达显著性。VR与RatioFAsens间接反映纤维完整性,避免单纯依赖原始FA值。CtF的显著差异提示其可作为术后语言功能的关键指标。
除经典语言模型纤维束外,CtF被证实参与语言处理网络。丘脑作为语言特定皮质活动的中央协调器,与基底节共同参与感知与产生语言操作。CtF参与基底节与皮质区间信息交换的时空门控,功能影像研究也显示丘脑与皮质区域协同参与命名及词汇决策任务。近期研究通过术中皮质下刺激、扩散MRI及纤维解剖识别出连接丘脑枕与颞叶区域的四个关键纤维组件,其功能相关性可能超越直接信息传递,涉及语言支持的高阶机制。尽管CtF在预测模型中的SHAP值相对较低,其在语言需求条件下的中介作用可能关键。当前手术策略虽优先保护双流模型中的主要深部白质纤维束,明确评估皮质丘脑通路在手术规划中同样重要。
传统统计方法难以全面分析多变量关系,DL模型的应用有助于通过复杂连接预测预后。本研究采用PyTorch构建DL模型,结合临床与网络特性预测POA风险。SHAP分析表明FA阈值0.15下CtF的识别对预测效能贡献最大。皮质映射特征(如阳性点数量、分布)在两组无差异,且未通过模型特征选择,提示皮下断开而非皮质损伤 alone 对长期语言结局更关键。为降低过拟合风险,训练中采用批量归一化、丢弃正则化及K折交叉验证。未来研究可考虑早停、权重衰减、数据扩增等策略提升泛化能力。推动临床转化需制定标准化工作流程,包括影像采集、预处理、特征定义及模型验证的统一标准。
本研究采用临床批准的确定性DTI纤维追踪,主要基于其与nTMS数据的兼容性、手术工作流程整合及可视化优势。DTI确定性追踪能清晰显示主要白质纤维,但无法解析复杂纤维走向(如交叉纤维),可能低估真实解剖连接。FA阈值的敏感性-特异性权衡也是固有局限。CSD等更先进方法能改善复杂区域解剖准确性,但需高质量多壳高角度分辨率扩散成像(HARDI)数据,采集时间长且处理复杂,临床推广仍受限。尽管CSD在优化成像条件下对某些语言纤维束追踪展现前景,其性能因结构与个体而异。本研究选择确定性DTI纤维追踪作为临床可行且可解释的方案,未来需优化采集协议及系统验证CSD方法以提升临床效用。
研究主要局限在于使用商业软件,可能降低方法透明度及与开源工具研究的可比性。此外,术前未进行详细标准化语言评估;纤维追踪非针对个体纤维束;DL模型未明确纳入肿瘤组织病理特征(如胶质瘤级别、水肿范围);nTMS映射与纤维追踪仅针对患侧左半球,未考虑双侧映射及利手差异;未包含术后纤维追踪数据;POA仅分为二元结局,未区分类型与严重程度;尽管CtF对模型输出贡献显著,其SHAP值较低,提示语言网络过于复杂,仅靠单一因素或有限网络参数难以预测。未来研究应整合个体纤维束分析、标准化行为评估、肿瘤特征分层及结构与组织病理变量,以提升模型稳健性与临床可解释性。
本研究显示POA患者nTMS纤维追踪语言网络整体特性较差,提示术前语言网络已受损。CtF在POA组中更不稳定且易损,凸显其在术后语言缺损患者中的脆弱性。结合网络特性与人工智能允许更深入洞察,DL模型将CtF特性识别为预测语言功能区病变患者术后语言缺损风险的关键指标。
生物通微信公众号
知名企业招聘