全切片图像中肿瘤细胞百分比的自动化测定:分子病理学检测的核分类研究

【字体: 时间:2025年07月26日 来源:Journal of Pathology Informatics CS6.3

编辑推荐:

  为解决病理学家估算肿瘤细胞百分比时存在的主观性和观察者间变异问题,研究人员开发了一种基于随机森林算法的自动化模型,用于高级别浆液性癌H&E染色全切片图像(WSIs)的肿瘤细胞定量分析。该模型通过核检测(StarDist)和分类技术,在测试集上达到11%的平均绝对误差(MAE),为分子病理学检测提供了更客观的预分析工具。

  

在分子靶向治疗时代,肿瘤细胞百分比测定是分子病理检测的关键预分析步骤,但传统病理学家目测估算方法存在显著局限性——文献报道不同观察者对同一样本的评估差异可达10%-95%,这种主观性可能导致假阴性结果,直接影响患者治疗方案选择。尤其对于高级别浆液性癌(卵巢/输卵管/腹膜来源及子宫内膜浆液性癌)这类常需分子检测的妇科恶性肿瘤,精确量化肿瘤细胞比例更具临床紧迫性。

Ac?badem大学医疗保健机构医学研究伦理委员会的研究团队在《Journal of Pathology Informatics》发表了一项创新研究,通过开发基于随机森林(Random Forest)算法的自动化核分类系统,首次实现H&E染色全切片图像(WSIs)中肿瘤细胞的客观定量。该研究以p53/PAX8免疫组化(IHC)的弥漫阳性作为金标准,在20例测试样本中验证模型性能,为数字病理领域提供了可推广的技术框架。

研究团队采用多阶段技术路线:首先从100例患者WSIs中构建训练集(n=40)、验证集(n=40)和测试集(n=20),通过QuPath平台提取300×300像素图像块并拼接成数字微阵列;使用StarDist扩展进行核检测与分割,手动标注11,454个核(分为肿瘤、上皮、间质、白细胞四类后归并为肿瘤/非肿瘤二元分类);提取78项核特征(形态学、光密度、纹理等)后,通过超参数调优构建近百个预模型,最终选择交叉验证F1分数最接近的模型应用于测试集。

核参数比较显示肿瘤核在面积(41.5 vs 19.7 μm2)、周长(24 vs 16.7 μm)等尺寸参数上显著大于非肿瘤核(P<0.001),但光密度均值(0.51 vs 0.6)更低,其中白细胞表现出最高光密度和最高圆形度(88.2%),这些差异为分类提供了形态计量学基础。

模型验证显示二元分类性能指标:精确度84%、召回率68%、特异性95%、准确率87%、F1分数0.75。在WSIs测试中,模型预测与IHC金标准的比较呈现以下关键结果:中位绝对误差7.9%,平均绝对误差(MAE)11%,均方根误差14%;65%案例绝对误差<10%,但存在极端低估(WSI13误差35%)和高估(WSI5偏差175%)案例,后者与训练集未充分涵盖的卵巢间质形态相关。

讨论部分强调了三大创新点:首次采用IHC弥漫阳性作为WSIs分类的客观标准;揭示了不同处理实验室间的技术差异对模型性能的影响(外部机构处理的WSI13误差最大);通过热图可视化证明算法在典型区域的可靠性。研究也指出当前局限:二元分类简化了上皮/间质/白细胞的异质性;数字伪影会影响光密度相关特征;需进一步研究特征选择对高维数据的优化作用。

该研究的临床意义在于:为分子检测阈值判断提供标准化工具,减少人工评估变异;建立的p53/PAX8 IHC验证方法为后续研究提供范式;78维核特征数据集有助于探索肿瘤核的生物物理特性。未来通过纳入多中心样本、开发抗伪影算法,有望使该模型成为实验室间可推广的质控标准。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号