撒哈拉以南非洲实施开源数字病理学(open-source digital pathology)的挑战与机遇:在喀麦隆部署QuPath进行乳腺癌生物标志物评估的经验教训
《Journal of Pathology Informatics》:Challenges and opportunities of implementing open-source digital pathology in sub-Saharan Africa: Lessons learned from deploying QuPath for breast cancer biomarker assessment in Cameroon
编辑推荐:
背景:数字病理学(digital pathology)与人工智能(artificial intelligence, AI)正在变革全球癌症诊断,但其在撒哈拉以南非洲的实施鲜有记载。该地区病理医师严重短缺且癌症负担日益加重,使AI辅助诊断尤为相关,然而资源受限环
背景:数字病理学(digital pathology)与人工智能(artificial intelligence, AI)正在变革全球癌症诊断,但其在撒哈拉以南非洲的实施鲜有记载。该地区病理医师严重短缺且癌症负担日益加重,使AI辅助诊断尤为相关,然而资源受限环境下的实际部署面临与高收入国家截然不同的技术、后勤及教育挑战。目的:系统记录喀麦隆雅温得参考病理实验室实施开源数字病理学平台QuPath进行乳腺癌免疫组化(immunohistochemistry, IHC)雌激素受体(estrogen receptor, ER)、孕激素受体(progesterone receptor, PR)、Ki67及人表皮生长因子受体2(human epidermal growth factor receptor 2, HER2)生物标志物评估过程中遇到的技术、后勤及实践难题,并为类似资源受限环境提出可行方案。方法:研究人员在喀麦隆雅温得巴斯德中心(Centre Pasteur du Cameroun)开展前瞻性实施研究,纳入39例浸润性乳腺癌病例,行ER、PR、Ki67及HER2的IHC染色。研究人员记录了数字病理学全流程各阶段:分析前玻片制备、玻片数字化(于比利时布鲁塞尔Erasme大学医院远程完成)、图像传输与存储、QuPath算法训练及在消费级笔记本电脑(4 GB RAM,500 GB存储)上的自动化分析。挑战被归纳为四大领域:硬件与基础设施限制、分析前与扫描问题、软件培训与优化、以及含学习曲线的人文因素。结果:130张IHC玻片中18张(13.8%)因检测失败或图像模糊需重新扫描,尽管已做扫描前质控。无本地扫描仪导致玻片需国际运送,增加8–12周延迟及物流复杂性。4 GB RAM消费级笔记本处理每例平均耗时20 min(范围5–60 min),大组织切片时常遇应用程序无响应。每张×40放大图像平均1.5 GB,迅速耗尽500 GB本地存储。QuPath随机树分类器(random tree classifier)需对全部39例HE染色标本手动标注代表性肿瘤、间质及淋巴样区域后方可应用于IHC玻片,耗时约15–20 h病理医师时间。探索性一致性分析显示所评估四个生物标志物中三个与专家病理医师评分有临床意义的一致性,详细分析验证另文报告。结论:在撒哈拉以南非洲实施开源数字病理学可行,但需围绕基础设施、后勤及培训进行战略规划。研究人员提出涵盖最低硬件要求、适应热带环境的质控规程及病理医师结构化培训的实用框架。经验表明,尽管存在显著限制,AI辅助生物标志物评估可在资源受限环境中成功部署,为最需要诊断标准化的地区提供改善途径。
论文解读:撒哈拉以南非洲实施开源数字病理学进行乳腺癌生物标志物评估的挑战与机遇——基于QuPath在喀麦隆的部署研究
研究背景与意义
撒哈拉以南非洲承受着不成比例的乳腺癌负担,发病率与死亡率上升,且常伴晚期就诊及诊断基础设施匮乏。乳腺癌治疗中雌激素受体(ER)、孕激素受体(PR)、Ki67增殖指数及人表皮生长因子受体2(HER2)的准确免疫组化(immunohistochemistry, IHC)评估至关重要,但该地区多数国家病理医师不足百万分之一人口。数字病理学(digital pathology)——即将玻璃玻片数字化为全切片图像(whole slide image, WSI)并用计算算法分析——可弥补人力不足并提升诊断重现性,人工智能(artificial intelligence, AI)工具能辅助量化生物标志物表达、减少观察者间差异。QuPath系开源数字图像分析平台,免除许可费用,对资源受限环境尤为适合。然而既有数字病理学实施研究多源于基础设施完善的高收入国,撒哈拉以南非洲特有的无本地扫描仪、热带气候影响玻片质量、极低计算资源等挑战几无文献记载。本研究由Odole Léa Zobo、Clément Parfait Ndengue、Laurine Verset、Lemaire Bodo、Myriam Remmelink、George Bediang及Joseph Mendimi Nkodo合作完成,发表于《Journal of Pathology Informatics》,旨在首次系统记录于喀麦隆参考实验室用QuPath行乳腺癌IHC生物标志物评估时遇及的技术、后勤与实践障碍,并提出适用于同类地区的实施框架。
主要关键技术方法
研究人员于2021年7月至2024年8月在喀麦隆雅温得巴斯德中心(Centre Pasteur du Cameroun)开展前瞻性实施研究。样本队列为39例2021年确诊的原发性浸润性乳腺癌存档蜡块,每例行HE染色及ER、PR、Ki67、HER2四项IHC染色(合计约195张玻片),排除诊断不一致、组织缺失、IHC染色差及重扫仍无法读片者。玻片于喀麦隆行Ventana BenchMark XT自动IHC染色及结构化质控后,国际运送至比利时Erasme大学医院用NanoZoomer S360扫描仪以×40(0.25 μm/像素)数字化存为NDPI格式,再经外置硬盘传回喀麦隆。本地分析采用消费级Acer笔记本(4 GB RAM,500 GB HDD)安装QuPath v0.4,无网络依赖。算法流程含内置细胞检测(cell detection)命令分割核,以及用"object classifier"训练单随机树分类器(random tree classifier)区分肿瘤、间质及淋巴聚集三类组织(需对所有39例HE切片手动标注代表性区域),训练后直接套用于IHC图像生成定量评分。全程前瞻性记录各阶段故障、耗时及应对方案,并将自动化评分与三位病理医师人工评分做探索性一致性比对。
研究结果
Overview of the implementation timeline(实施时间线概述)
完整实施自初选病例至最终分析跨度约36个月。各阶段中:病例筛选与IHC制备耗3个月,5例因组织耗尽排除;玻片运至布鲁塞尔8–12周;数字化与质控2周,130张中18张(13.8%)需重扫;图像传回喀麦隆4–6周(因无云传输靠物理硬盘);QuPath训练与标注3–4周,病理医师标注耗时15–20 h;自动化分析3–4周,平均每例20 min(5–60 min),受限于4 GB RAM常遇程序冻结。
Hardware and infrastructure constraints(硬件与基础设施限制)
喀麦隆无全切片扫描仪系最关键障碍,迫使国际协作送扫。4 GB RAM消费笔记本远低于推荐最低16 GB,致加载大WSI(>2 GB)频繁无响应、无法并行分析、高倍率渲染极慢及偶发崩溃丢注。处理时间与组织面积正相关,平均20 min/例,较推荐硬件慢3–4倍。每张×40下平均1.5 GB,130张占约195 GB(39%容量),存储迅速告急须定期外置归档。
Pre-analytical and scanning challenges(分析前与扫描挑战)
尽管扫描前质控,18/130张(13.8%)因组织区未识别、对焦错致模糊或条码读取失败需重扫,最终数据集无切片缺陷或数字化质量问题,上游质控有效。雅温得雨季相对湿度70%–90%可致封片冷凝与真菌污染,虽本研究玻片存档期短(2021诊断–2024扫描)未明显受影响,但对建数字档案系隐患;国际运输须硅胶干燥剂与硬盒防护。
Software training and optimization challenges(软件培训与优化挑战)
随机树分类器训练需病理医师花15–20 h手动标注HE切片肿瘤、间质及淋巴区域并迭代重训。细胞检测算法对核标记(ER、PR、Ki67)有效,对膜型HER2表现差——默认胞质环形扩展不能准确捕捉膜染色,阈值优化耗时;StarDist深度学习扩展因4 GB RAM无GPU加速无法部署。随机树分类器仍偶将炎性单核细胞及反应性间质细胞误判为肿瘤细胞(PR切片尤甚),需手动框选感兴趣区(region of interest, ROI)缓解但降低效率。
Human factors and the learning curve(人文因素与学习曲线)
主要操作者(无计算背景的病理住院医师)需约4周自学QuPath基础操作(图像导航、标注、细胞检测参数调节、分类器训练),仅靠官网教程论坛无本地导师。理解检测参数–分割质量关系、判读分类器表现、区分需重训或标注错误、制定高效标注策略均为非直观必备技能,当地无数字病理学实践社群致排障完全依赖线上资源。
Exploratory concordance with expert pathologists(与专家病理医师的探索性一致性)
作为二级分析,QuPath自动评分与三位独立病理医师人工评分比对待,四个生物标志物中三个(Ki67、HER2、ER)具临床意义一致性,PR一致性有限,提示即便硬件受限QuPath分析性能对多数标志物体具稳健性,详细验证另文报道。
讨论与结论总结
本研究系迄今首篇全面记录撒哈拉以南非洲用开源数字病理学行乳腺癌生物标志物评估实践挑战的文献,指出资源受限环境下后勤与基建障碍较算法性能更决定成败。无本地扫描仪最严峻,中低本扫描方案(如智能手机显微适配或MoticEasyScan)及区域扫描中心(regional scanning hub)、远程病理网络值得探索。证实QuPath可在4 GB RAM消费本完成流程并产生可用输出,虽速度受损,建议序贯处理、关无关程序、用×20降数据量及优先升级RAM。13.8%重扫率高于高收入国典型5%–8%,与手工封片差异、IHC残留及异地制备扫描有关,强调标准化预扫质控之必要。分类器标注耗时15–20 h系隐形成本,预训练模型、迁移学习及QuPath社区共享分类器可减少此负担。HER2等需进阶工具(如StarDist)因硬件门槛无法使用暴露"技术鸿沟"。基于经验研究人员提出三级分层框架:Tier 1(最低可行)需8–16 GB RAM笔记本+SSD、区域扫描接入及受训病理医师,适用科研与质控;Tier 2(功能性临床支持)加32 GB RAM带GPU工作站、本地/共享扫描及网络附加存储(network-attached storage, NAS),可整合入诊断流程;Tier 3(全数字病理)含机构自有扫描仪、云存储、深度学习工具及正规计算病理学培训,支持原发数字诊断。另指出镜下载物台相机或手机适配摄片比专扫更廉宜可及,可作低资源常规部署路径,待后续对照研究。
结论(Conclusion)译文:
在撒哈拉以南非洲实施开源数字病理学可行,但需针对基础设施局限、后勤及培训做周密规划。即使在极度资源受限硬件上QuPath流程亦可完成部署,虽处理效率大幅折损且各生物标志物分析表现不一(详见验证文稿)。本实施中首要障碍非算法层面而是后勤层面:扫描设备获取、计算资源、存储容量及受训人员。通过区域扫描网络、分层硬件建议、共享预训练分类器及结构化培训计划应对上述挑战,有望加速AI辅助病理学于非洲大陆的采纳,从而改善最需之处诊断标准化及患者照护。