从精准到强度:计算机视觉用于缝合质量评估的离体先导研究
《Surgical Endoscopy》:From precision to strength: computer vision for suture quality assessment—an ex vivo pilot study
【字体:
大
中
小
】
时间:2025年12月06日
来源:Surgical Endoscopy 2.4
编辑推荐:
本研究针对微创手术中缝合质量评估主观性强、缺乏标准化的问题,开展了一项基于计算机视觉的定量缝合评估(QSA)研究。研究人员通过离体实验,比较了不同手术平台(传统腹腔镜、dVRK、Flex)和不同经验水平操作者的缝合性能,并分析了缝合间距空间指标与爆破压力(burst pressure)之间的相关性。结果表明,缝合间距的不规则性与机械阻力呈负相关,但空间指标本身不足以独立预测缝合质量。该研究为开发能够提供实时反馈的智能术中系统奠定了基础,对手术教育和质量保证具有重要意义。
在外科手术的广阔天地中,缝合技术犹如一座沉默的基石,其质量直接关系到组织的愈合与术后并发症的发生。然而,尽管外科技术日新月异,对缝合好坏的评判却长期徘徊在“凭经验、靠感觉”的主观层面,缺乏可量化的客观标准。尤其是在微创手术(Minimally Invasive Surgery, MIS)日益普及的今天,由于视野受限、器械操作空间狭小、缺乏触觉反馈等挑战,对缝合精准度的要求更高,也使得建立一套客观、可重复的评估体系变得尤为迫切。术后吻合口漏、裂开等并发症,不仅给患者带来痛苦,也显著增加了医疗负担。因此,探索如何将缝合的“形态”与其最终的“功能”——即机械强度——联系起来,成为了一个极具临床价值的研究方向。
正是在这样的背景下,一篇发表在《Surgical Endoscopy》上的研究论文《From precision to strength: computer vision for suture quality assessment-an ex vivo pilot study》应运而生。这项研究进行了一项开创性的探索,旨在利用计算机视觉技术,量化评估缝合质量,并探究其与缝合线机械性能的内在联系。
为了回答上述问题,研究人员设计了一项严谨的离体实验。他们招募了15名参与者,并根据其微创手术经验分为大师(Masters)、进阶(Advanced)和初学者(Beginners)三组。每位参与者需要在三种不同的手术平台上——传统腹腔镜(Laparoscopy)、达芬奇研究套件(daVinci Research Kit, dVRK)和Flex机器人内窥镜系统——在猪直肠标本上完成标准化的连续缝合任务。研究团队随后采用了一套综合的评估方法:首先,通过高分辨率图像分析,提取了18项关于缝合针距、边距及其变异度的空间指标,即定量缝合评估(Quantitative Suture Assessment, QSA);其次,通过一个精密的充气回路测量缝合处的爆破压力(burst pressure),以客观评估其机械阻力;此外,还记录了手术时间,并让参与者填写了NASA任务负荷指数(NASA-TLX)和系统可用性量表(System Usability Scale, SUS)问卷,以评估主观工作负荷和平台易用性。数据分析则采用了相关性分析、机器学习模型(XGBoost)等多种统计方法,以期揭示空间指标与爆破压力之间的复杂关系。
研究结果显示,在不同手术平台之间,传统腹腔镜测得的平均爆破压力最高(17.38 ± 6.54 mmHg),其次是dVRK(15.99 ± 7.69 mmHg),Flex系统最低(13.60 ± 10.08 mmHg)。在排除异常值后,腹腔镜的爆破压力显著高于Flex系统。在不同经验水平的操作者中,大师组、进阶组和初学者组的平均爆破压力分别为17.95 ± 9.43 mmHg, 13.89 ± 7.41 mmHg 和 15.13 ± 7.64 mmHg,但组间差异未达到统计学显著性。一个有趣的发现是,在初学者中,使用dVRK平台获得的爆破压力显著高于使用Flex平台。在手术时间方面,Flex系统的任务完成时间显著长于腹腔镜和dVRK,而大师级操作者在所有平台上完成速度都快于其他组。主观评估表明,Flex系统在可用性评分上较低,且使用者报告了更高的精神需求和挫败感。
相关性分析是本研究的核心发现之一。在评估的18项空间指标中,有8项与爆破压力呈现出显著的负相关关系(p < 0.05)。这意味着缝合针距和边距越不规则(例如,点与点之间距离的标准差(PP std)越大,点与边缘距离的平均误差(PM mean error)越大),缝合所能承受的内部压力就越低。这表明缝合的几何精度确实与其机械强度有关联。然而,当研究人员尝试使用这些显著相关的空间指标来构建预测模型(XGBoost回归)时,模型的预测性能却很不理想(R2= -0.42),表明仅靠这些空间指标难以可靠地预测单个缝合的爆破压力。进一步分析发现,这些空间指标之间存在高度的多重共线性,这可能是模型表现不佳的原因之一。
研究者对结果进行了深入剖析。他们指出,参与者的经验分层主要基于其腹腔镜手术经验,这可能导致了对不同平台的熟悉度存在差异(最熟悉腹腔镜,次之为dVRK,对Flex最陌生),这或许部分解释了为何Flex平台在多项指标上表现相对逊色。同时,所有参与者可能都因参与研究而产生了“卷入效应”,努力表现最佳,这可能削弱了不同经验组之间的差异。关于预测模型表现不佳,研究者认为除了样本量较小的限制外,空间指标间的多重共线性以及爆破压力测试本身“最薄弱环节”的特性(即破裂始于最脆弱点,而非反映整体平均质量)也是重要因素。后者反而增强了研究结果的临床相关性,因为真实的吻合口漏也往往源于局部缺陷。
这项先导研究系统地评估了在不同微创手术平台和不同经验水平操作者下的缝合性能。其主要结论是:缝合间距的空间不规则性与缝合的机械阻力(爆破压力)之间存在负相关关系,证实了计算机视觉用于定量评估缝合质量的潜在价值。然而,空间指标本身尚不足以作为预测缝合质量的独立、可靠指标。研究还发现,传统腹腔镜在机械阻力方面表现优于Flex系统,而dVRK对初学者更友好。专家操作者速度更快,Flex系统则被认为可用性较低且工作负荷较高。这些发现强调了在评估缝合质量时,需要综合考虑空间精度、机械性能和操作者主观感受等多方面因素。
这项研究的意义在于它迈出了将计算机视觉技术应用于缝合质量客观评估的关键一步。它首次尝试在离体环境中建立缝合的“形态学”(空间几何特征)与“功能学”(机械强度)之间的定量联系。尽管目前的空间指标预测能力有限,但这项研究为未来开发智能术中反馈系统铺平了道路。想象一下,在未来手术中,系统能够实时分析缝合的针距、边距,并给出质量评分或预警,这将极大助力外科培训,并有望在高风险手术中提升操作一致性,最终改善患者预后。当然,要实现这一愿景,还需要更大样本的研究,并整合更多的评估维度,如缝合时的力学数据、组织创伤等,以构建更全面、精准的缝合质量评估模型。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号