计算机辅助肿瘤细胞分数评估工具TCFCAD在病理学教育中的应用:提升观察者间一致性但需警惕自动化偏倚风险

【字体: 时间:2025年07月05日 来源:Virchows Archiv 3.4

编辑推荐:

  本研究针对病理诊断中肿瘤细胞分数(TCF)评估存在观察者间差异的问题,开发了计算机辅助诊断(TCF)工具TCFCAD。通过比较医学生、住院医师和病理医师使用工具前后的评估结果,发现TCFCAD显著提高了各经验水平组别的观察者间一致性(SD降低1.6-1.9倍),但同时也揭示了医学生群体更容易受到工具错误输出的影响(自动化偏倚达7%)。这项发表在《Virchows Archiv》的研究为数字病理教育工具的开发提供了重要实证依据。

  

在数字病理学快速发展的今天,人工智能(AI)辅助诊断工具正在重塑医学教育与实践的格局。然而,一个令人担忧的现象逐渐浮现:当医学生和年轻医师面对计算机生成的诊断建议时,他们是否会不假思索地全盘接受?伯尔尼大学的研究团队在《Virchows Archiv》发表的最新研究,为我们揭开了这个"黑箱"的一角。

传统病理诊断中,肿瘤细胞分数(TCF)评估是决定治疗方案的关键指标,但不同经验水平的医师评估结果往往存在显著差异。就像研究中展示的ROI5区域,当肿瘤组织被大量炎症细胞浸润时,即使是资深病理医师也难以准确判断。这种"肉眼观察"的局限性,促使研究团队开发了TCFCAD这一计算机辅助诊断工具,它能通过AI算法自动标记肿瘤细胞(红色)和非肿瘤细胞(黄色),为评估者提供直观参考。

研究设计了严谨的三层次对照实验:18名三年级医学生、23名欧洲分子病理学硕士(EMMP)学员,以及63名执业病理医师(按20年经验分组)。所有参与者都需要对10个结直肠癌区域(ROI)进行两次TCF评估——首次独立判断,第二次参考TCFCAD的输出结果。为确保数据可靠性,研究团队采用QuPath软件进行细胞级标注,通过StarDist算法完成细胞分割,再结合U-Net模型实现组织分割,最终获得每个ROI的精确肿瘤细胞占比(GT)。

研究结果呈现出有趣的"双刃剑"效应。一方面,TCFCAD确实显著提高了各组的评估一致性:医学生的评估标准差(SD)从9.09%降至4.95%,EMMP学员从9.93%降至5.55%,而病理医师组也显示出类似改善。特别是在炎症浸润严重的ROI5区域,所有组别都从工具辅助中获益最大。但另一方面,在ROI2这个典型案例中,当TCFCAD给出错误预测(39%)时,医学生们竟将自己的准确评估值(49.4%)大幅下调至37.39%,展现出明显的"自动化偏倚"倾向。这种盲目信任AI输出的现象,在EMMP学员中也有所体现,只是程度较轻。

技术方法上,研究采用全切片数字化扫描(40倍放大),通过深度学习模型实现细胞分类计数。样本来源于临床结直肠癌病例,特别选择了包含不同细胞密度、炎症程度和基质比例的10个代表性区域。评估过程采用双盲设计,通过SurveyMonkey平台收集数据,避免回顾性修改。

研究结果部分的小标题和主要发现包括:
"医学生表现"显示该群体对TCFCAD依赖度最高,在ROI9案例中,学生原始评估(20.83%)本已接近GT值(22%),却因工具输出(18%)而集体下调评分;
"EMMP参与者表现"表明该群体评估准确性更高,但仍有6.17%的案例出现自动化偏倚;
"专业经验分层分析"揭示20年经验以上的病理医师受工具影响最小(评分仅调整3.25%),展现出更强的专业判断力。

讨论部分强调了这项研究的双重意义:TCFCAD作为教学工具,能有效缩短初学者与专家的评估差距;但同时也警示医学教育必须包含"AI素养"培养,教会学生批判性评估算法输出。正如ROI2案例所示,工具将腺腔内碎片错误分类为非肿瘤细胞的问题,需要使用者具备足够的病理知识才能识别。研究建议未来工具开发应增加"坏死/碎片"第三分类,并通过展示典型错误案例来训练使用者的质疑能力。

这项研究为数字病理教育提供了重要路线图:AI辅助工具不是要替代医师判断,而是需要与专业培训形成"共生关系"。正如作者在文末强调的,只有将技术优势与人类专业知识有机结合,才能真正提升病理诊断的准确性与可靠性。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号