人工智能干预对腹腔镜胃切除术中解剖标志识别意识的影响：一项探索性研究

《Surgical Endoscopy》：Impact of artificial intelligence intervention on awareness of anatomical landmarks in laparoscopic gastrectomy: An exploratory study

【字体：大中小】 时间：2026年07月03日 来源：Surgical Endoscopy 2.4

编辑推荐：

　　背景：研究人员开发了一种胃癌/胃切除人工智能（gastric cancer/gastrectomy artificial intelligence, gAI）系统，该系统利用资深外科医生的隐性知识可视化包括胰腺和凹陷线（dimpling lines, DLs）

背景：研究人员开发了一种胃癌/胃切除人工智能（gastric cancer/gastrectomy artificial intelligence, gAI）系统，该系统利用资深外科医生的隐性知识可视化包括胰腺和凹陷线（dimpling lines, DLs）在内的解剖标志，以帮助预防腹腔镜胃癌切除术中的术后胰瘘（postoperative pancreatic fistula, POPF）。然而，gAI是否有助于提高外科医生的识别意识仍不清楚。因此，本研究旨在评估gAI干预如何影响反映外科医生对这些标志认知的解剖标志识别，以及其效果如何因手术专业技能而异。方法：一个外部评估委员会建立了共识参考标准并验证了gAI。来自四个机构的12名外科医生按专业技能分为初级受训者、高级受训者和培训师组。每位外科医生观看了幽门下区和胰上区的无gAI和有gAI的手术视频，并对每个场景的图像进行标注。评估了不同专业技能水平的主观识别变化率和与参考标准相比的解剖标志识别评分差异。结果：在幽门下区，初级受训者、高级受训者和培训师的主观识别变化率分别为52%、38%和9%，培训师的识别变化率显著低于两个受训组（两者均p < 0.001）。在胰上区，相应的变化率分别为38%、17%和4%；培训师的识别变化率显著低于初级受训者（p < 0.001），但与高级受训者相比无显著差异（p = 0.054）。在仅限于测量到评分变化的观察的探索性分析中，胃系膜与胰腺之间的DL（dimpling line between the mesogastrium and pancreas, DMP）的识别评分在胰上区的初级受训者（p < 0.01）和幽门下区的高级受训者（p = 0.03）中显著增加。结论：这项探索性研究表明，gAI干预可以支持腹腔镜胃切除术中的解剖标志识别意识，且在不同专业技能水平上产生差异化影响，尤其是对 novice 外科医生。

研究背景与意义

腹腔镜胃切除术（laparoscopic gastrectomy, LG）目前已成为早期和进展期胃癌的标准治疗手段。然而，术后并发症尤其是术后胰瘘（postoperative pancreatic fistula, POPF）仍是临床面临的严峻挑战。POPF的发生不仅与患者因素相关，更深受外科医生技术熟练度的影响。尽管拥有内窥镜手术技能资格认证（Endoscopic Surgical Skill Qualification System, ESSQS）的外科医生能显著降低并发症发生率，但如何将专家级的解剖认知转化为可传承的教学资源，一直是外科培训中的难点。现有的人工智能（artificial intelligence, AI）技术在微创手术中多用于器械追踪或场景分类，鲜少有研究关注AI对外科医生术中解剖标志识别意识的提升作用。为此，研究人员开展了一项探索性研究，旨在通过引入基于深度学习开发的胃癌/胃切除人工智能（gAI）系统，评估其在辅助外科医生识别关键解剖标志方面的效能，并探讨这种辅助效应如何随医生经验水平的变化而呈现出差异性。该研究成果发表在国际权威期刊《Surgical Endoscopy》上，为AI辅助外科手术教学与安全控制提供了新的循证医学证据。

关键技术方法

本研究采用多机构横断面观察设计，核心技术流程如下：首先，研究人员构建了由资深专家组成的外部评估委员会（external evaluation committee, EEC），负责建立解剖标志识别的共识参考标准并验证gAI性能。其次，招募了来自日本四家教育机构的12名外科医生作为研究对象，依据资质将其严格分为初级受训者（junior trainee, JT）、高级受训者（senior trainee, ST）和培训师（trainer, T）三个层级。研究选取了涵盖不同临床分期（cStage）和身体质量指数（body mass index, BMI）的12例手术视频，提取了代表关键解剖决策点的静态图像。核心实验设计为“前后对照”：所有参与者在无gAI辅助下观看动态视频并完成图像标注后，再次观看带有gAI实时叠加可视化效果（包括胰腺及三种凹陷线DLs）的相同视频并进行二次标注。最后，研究人员利用Dice系数和Likert量表分别量化胰腺分割的空间准确性与凹陷线（特别是胃系膜与胰腺之间的凹陷线，DMP）的识别质量，并通过主观变化率与客观评分差异进行统计学分析。

研究结果

参考标准注释与gAI可用性

定量分析显示，gAI输出的胰腺分割结果与EEC建立的参考标准之间的Dice系数为0.71至0.88，表明空间定位具有良好的一致性。外部评估团成员对gAI实用性的中位数评分均大于等于3分（满分5分），其中胰腺和DMP的评分达到4分，证实了gAI系统在后续外科医生评估中的可行性。

gAI干预前的解剖标志识别

在gAI介入前，三组医生在胰腺识别准确率（Dice系数）上无显著差异，但在DMP这一复杂边界标志的识别上存在明显的经验依赖性。具体而言，在幽门下区，JT组中位评分为2分，ST组为3分，T组为3分，JT组显著低于T组（p = 0.009）；在胰上区，JT组为3分，ST组为4分，T组为5分，JT组与T组、ST组与T组之间均存在显著差异（p < 0.001, p = 0.01）。这证明了解剖隐性知识的掌握程度随手术经验积累而显著提升。

gAI干预后的解剖标志识别变化

主观识别变化率是本研究的主要终点。结果显示，gAI干预对不同经验层级的医生产生了显著的差异化影响。在幽门下区，JT、ST和T组的变化率分别为52%、38%和9%，培训师组的改变率远低于两个受训组（均p < 0.001）。在胰上区，相应变化率为38%、17%和4%，培训师组仍显著低于初级受训者（p < 0.001），但与高级受训者的差异未达到统计学显著性（p = 0.054）。这表明gAI主要起到了“提示盲区”的作用，新手医生从中获益最大。

解剖标志识别评分差异

在探索性分析中，针对发生评分变化的配对样本，DMP识别评分在特定组别中出现了显著提升。在胰上区，JT组的评分从1分（IQR 1-2）显著上升至3分（IQR 3-5）（p < 0.01）；在幽门下区，ST组的评分从3分（IQR 1-3）显著上升至4分（IQR 3-5）（p = 0.03）。虽然初级受训者在幽门下区的评分提升未达显著水平，但也呈现出上升趋势。这说明gAI不仅能引起主观认知的改变，还能实质性地修正低年资医生的客观判断偏差，使其向专家共识标准靠拢。

讨论与结论总结

讨论部分指出，本研究首次在多机构环境下评估了AI干预对不同经验层级外科医生解剖意识的影响。通过将专家的隐性知识转化为显性的视觉引导，gAI有效地帮助受训者重新校准了对关键解剖标志（如DMP）的认知。对于资深培训师而言，gAI更多起到确认既有认知的作用，这也解释了为何其主观变化率较低。此外，研究通过分层抽样和广泛的数据集来源，克服了既往单中心研究的局限性，增强了结果的外部效度。尽管存在样本量较小、未评估长期记忆留存及缺乏术中实时环境验证等局限，但这项探索性研究证实了gAI作为一种标准化视觉引导工具的潜力，能够弥补传统师徒制教学中隐性知识传递的不足，为构建数字化、标准化的外科培训体系奠定了基础。未来研究应致力于扩大样本规模，开展随机对照试验，并进一步验证其在机器人手术等其他平台上的跨平台适用性。

热点排行