液体白盒模型:一种用于手术可解释人工智能的创新框架

【字体: 时间:2025年06月21日 来源:npj Digital Medicine 12.4

编辑推荐:

  本研究针对手术AI模型的可解释性挑战,开发了基于液体时间常数网络(LS4)的任务/技能分类系统。通过分析SmartForceps系统采集的器械-组织作用力数据,实现了手术任务分类83%和技能分类75%的准确率,并创新性地采用信号注意力可视化、反应矩阵等方法揭示模型决策机制,为智能手术系统提供了透明化AI解决方案。

  

在神经外科手术中,器械与组织间微妙的作用力变化蕴含着丰富的手术质量信息,但传统方法难以实时解析这些数据。随着智能手术器械如SmartForceps系统的出现,虽然能记录双极电凝镊的左右作用力(FL/FR),但现有AI模型存在两大痛点:LSTM等传统时序模型需要复杂特征工程,且决策过程如同"黑箱",不符合医疗AI的监管要求。这正是加拿大OrbSurgical团队在《npj Digital Medicine》发表研究的突破口。

研究团队创新性地引入液体时间常数网络(LTC),构建了LS4模型架构。该研究采集了50台神经外科手术的器械作用力数据,标注了凝血/分离/牵拉等5类任务和专家/新手2级技能标签。通过对比LSTM/GRU/Transformer等9类模型,发现LS4在任务分类(83% vs LSTM 82%)和技能分类(75% vs 71%)上均刷新纪录。更关键的是,其"液体"特性使模型能像生物神经元般动态调整时间常数,从而生成可解释的决策轨迹。

关键技术方法
研究采用统一架构:时间序列单元(TSU)模块化替换不同模型,后接决策层和输出层。通过集成梯度(Integrated Gradients)算法量化信号片段重要性,开发信号消融算法提取关键模式簇,并首创"模型决策流"可视化技术,通过神经元传导度(Condyi)追踪信息在网络的流动路径。数据来自SmartForceps系统记录的标准化力信号,按80/20划分训练测试集。

研究结果

模型架构


双通道力信号输入TSU模块,LS4通过液体微分方程动态处理时序特征,决策层输出任务/技能联合预测。这种设计使参数量减少20%的同时提升推理速度。

模型结果
LS4在任务分类的F1-score(0.770)显著优于Transformer(0.694),其技能分类精度(75.59%)比次优的TCN高9%。但噪声测试显示LS4在振幅>0.01噪声下性能骤降,反观Transformer表现出更强鲁棒性。

信号注意力可视化


凝血任务关注信号高熵区(图3a),而技能分类依赖起始/结束片段。反应矩阵(图3b)显示左右力特征重要性相当(r=0.82),决策流图(图3c)捕捉到LS4中"脉冲编码神经元"对锐变信号的响应。

模型信号聚类


专家施力呈现先缓后急的非线性特征(图4a),而新手多为匀速施力(图4d)。凝血任务对应杂乱力波动(图4c),非凝血任务则显示清晰脉冲模式(图4b)。

结论与意义
该研究确立了LTC网络在医疗AI中的优势:LS4通过动态微分方程实现优于固定时间步长的建模能力,其"白盒"特性满足FDA对AI可解释性的要求。发现专家 surgeons的力调制模式为手术培训提供了量化标准。研究团队创建的开源框架为智能手术系统树立了新范式——将器械传感器数据转化为实时决策支持,这既是数字外科的重要突破,也为AI在FDA等严格监管场景的应用提供了模板。未来融合量子计算等新技术,或可实现更高维度的术野理解。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号