
-
生物通官微
陪你抓住生命科技
跳动的脉搏
液体白盒模型:一种用于手术可解释人工智能的创新框架
【字体: 大 中 小 】 时间:2025年06月21日 来源:npj Digital Medicine 12.4
编辑推荐:
本研究针对手术AI模型的可解释性挑战,开发了基于液体时间常数网络(LS4)的任务/技能分类系统。通过分析SmartForceps系统采集的器械-组织作用力数据,实现了手术任务分类83%和技能分类75%的准确率,并创新性地采用信号注意力可视化、反应矩阵等方法揭示模型决策机制,为智能手术系统提供了透明化AI解决方案。
在神经外科手术中,器械与组织间微妙的作用力变化蕴含着丰富的手术质量信息,但传统方法难以实时解析这些数据。随着智能手术器械如SmartForceps系统的出现,虽然能记录双极电凝镊的左右作用力(FL/FR),但现有AI模型存在两大痛点:LSTM等传统时序模型需要复杂特征工程,且决策过程如同"黑箱",不符合医疗AI的监管要求。这正是加拿大OrbSurgical团队在《npj Digital Medicine》发表研究的突破口。
研究团队创新性地引入液体时间常数网络(LTC),构建了LS4模型架构。该研究采集了50台神经外科手术的器械作用力数据,标注了凝血/分离/牵拉等5类任务和专家/新手2级技能标签。通过对比LSTM/GRU/Transformer等9类模型,发现LS4在任务分类(83% vs LSTM 82%)和技能分类(75% vs 71%)上均刷新纪录。更关键的是,其"液体"特性使模型能像生物神经元般动态调整时间常数,从而生成可解释的决策轨迹。
关键技术方法
研究采用统一架构:时间序列单元(TSU)模块化替换不同模型,后接决策层和输出层。通过集成梯度(Integrated Gradients)算法量化信号片段重要性,开发信号消融算法提取关键模式簇,并首创"模型决策流"可视化技术,通过神经元传导度(Condyi)追踪信息在网络的流动路径。数据来自SmartForceps系统记录的标准化力信号,按80/20划分训练测试集。
研究结果
模型架构

模型结果
LS4在任务分类的F1-score(0.770)显著优于Transformer(0.694),其技能分类精度(75.59%)比次优的TCN高9%。但噪声测试显示LS4在振幅>0.01噪声下性能骤降,反观Transformer表现出更强鲁棒性。
信号注意力可视化

模型信号聚类

结论与意义
该研究确立了LTC网络在医疗AI中的优势:LS4通过动态微分方程实现优于固定时间步长的建模能力,其"白盒"特性满足FDA对AI可解释性的要求。发现专家 surgeons的力调制模式为手术培训提供了量化标准。研究团队创建的开源框架为智能手术系统树立了新范式——将器械传感器数据转化为实时决策支持,这既是数字外科的重要突破,也为AI在FDA等严格监管场景的应用提供了模板。未来融合量子计算等新技术,或可实现更高维度的术野理解。
生物通微信公众号
知名企业招聘