
-
生物通官微
陪你抓住生命科技
跳动的脉搏
多模态数字孪生技术在自主微钻孔颅窗创建中的创新应用研究
【字体: 大 中 小 】 时间:2025年06月27日 来源:International Journal of Computer Assisted Radiology and Surgery 2.3
编辑推荐:
为解决小鼠颅窗创建中微钻孔精度不足和训练数据匮乏问题,研究人员开发了集成AMBF模拟器、Isaac Sim渲染和DAG音频生成器的多模态数字孪生(DT)系统。实验证明其合成图像检测mAP达70.2,音频FAD/FID优于传统方法,钻孔误差仅0.22±0.03mm,为AI训练提供了高保真多模态数据。
在神经外科和神经科学研究中,微钻孔技术是颅窗创建的关键步骤,用于实现脑部可视化或肿瘤切除。然而,传统方法面临小鼠颅骨解剖变异大、热损伤风险高、操作培训周期长等挑战。虽然已有Pak等开发的阻抗检测机器人、Ghanbari团队的Craniobot等辅助系统,但完全自主化仍受限于缺乏高质量多模态训练数据。东京大学的研究团队创新性地提出多模态数字孪生(DT)解决方案,通过融合视觉、听觉和力反馈模拟,为AI模型训练构建高保真虚拟环境。
研究采用AMBF模拟器实现体素级钻孔力学仿真,结合Isaac Sim的光线追踪渲染生成逼真图像。独创的深度音频生成器(DAG)采用CWGAN-GP架构生成条件性钻孔音频,辅以HiFi-GAN声码器转换。通过鸡蛋模型验证,系统合成图像训练的CNN在真实图像检测中达到70.2 mAP,音频FID最低35.19,空间误差控制在亚毫米级(0.22±0.03mm)。
Volumetric drilling simulator
基于512层体素网格(分辨率0.088mm)模拟2mm钻头切削过程,通过Marching Cubes算法实时更新USD格式三维模型。实验显示系统可80FPS实时渲染钻孔动态,包括蛋壳厚度渐变效果。
Deep audio generator
相比传统音高调制方法,DAG在弱/中/强三种钻压力下的FAD分别降低24%(4.45)、78%(11.75)和78%(35.17),生成延迟仅6.4ms,支持12种角度-压力组合的条件生成。
Synthetic images for training CNN
通过深度图差分算法生成钻孔区域语义标签,12,572张增强图像训练的ResNet-50模型实现81.3 mAP(合成数据)和70.2 mAP(真实数据)的跨域检测性能。
Real egg drilling experiment
基于Lin等开发的显微立体视觉系统(精度0.10±0.02mm)验证,DT与实体钻孔轨迹的配准误差达0.22±0.03mm,证实仿真系统具备亚毫米级空间一致性。
该研究首次实现融合视觉-听觉-力觉的多模态DT系统,突破传统VR模拟器单一感官反馈的局限。通过CWGAN-GP和HiFi-GAN的级联架构,解决钻孔音频非线性特征的建模难题;Isaac Sim与AMBF的协同优化,则实现物理仿真与光子级渲染的实时同步。虽然当前模型尚未整合小鼠颅骨多层结构特征,但其在鸡蛋模型验证中展现的技术框架,为后续活体实验奠定基础。该系统有望显著减少实验动物使用,推动神经科学研究向"3R原则"(替代、减少、优化)发展,并为远程手术培训提供新范式。
生物通微信公众号
知名企业招聘