编辑推荐:
研究人员为解决贫血恢复监测难题,开展 RBCMatch 方法研究,该方法分类准确,助力贫血评估。
贫血,这个看似熟悉却又暗藏玄机的健康 “杀手”,正悄然影响着全球约四分之一人口的健康。它不仅在老年人中高发,还与多种疾病的不良预后紧密相连,比如中风、心力衰竭和手术患者,其危害不容小觑。在医学领域,监测贫血恢复对于临床干预和评估预后至关重要,就像精准导航对于船只航行的意义一样。虽然常规血液检测中的血红蛋白水平和红细胞计数能初步反映贫血情况,但红细胞形态变化的检测却愈发重要,它能为医生提供更多关于贫血恢复的 “隐藏线索”。
然而,目前用于检测红细胞形态变化的外周血涂片(PBS)检测却存在诸多问题。这一检测过程繁琐又耗时,如同手工绘制一幅复杂的拼图,极度依赖人工分析,而且不同专家的解读结果差异较大,就像不同人对同一幅画的理解不同一样,这严重影响了检测的准确性和可靠性。
为了攻克这些难题,清华大学和中国医学科学院基础医学研究所的研究人员展开了一项意义非凡的研究。他们提出了一种名为 RBCMatch 的深度半监督学习方法,用于对贫血恢复过程中的红细胞进行分类和评估。这一研究成果发表在《Annals of Hematology》杂志上,为贫血的研究和治疗带来了新的曙光。
研究人员在开展这项研究时,运用了多种关键技术方法。首先,他们构建了急性溶血性贫血小鼠模型,通过对 12 只小鼠在贫血恢复不同阶段采集外周血,制备 PBS 涂片并进行图像采集。接着,利用基于 CellTracker 软件的图像处理算法对 PBS 图像中的红细胞进行分割,获得 10,091 张单细胞图像。然后,采用 ResNet50 网络作为分类模型骨干,并结合 Fixmatch 半监督学习策略进行模型训练。训练过程中使用了迁移学习,利用 ImageNet 预训练参数初始化网络,并对部分参数进行微调。最后,通过主成分分析(PCA)对训练后的模型输出进行分析,以探究红细胞形态变化与贫血恢复的关系。
在研究结果方面,RBCMatch 在红细胞分类任务中表现出色。研究人员通过五折交叉验证,将 499 张标记图像分为 5 组,依次用每组作为验证集,其余作为训练集,同时使用未标记样本作为训练集,并用 2171 张标记图像进行测试。结果显示,RBCMatch 在验证集上的平均准确率达到 91.2%,在测试集上也有 87.5% 的准确率,远超基于特征的支持向量机(SVM)和基于 ResNet50 的监督学习方法,且标准偏差最低,这表明 RBCMatch 具有高度的稳健性。此外,Grad - CAM 生成的显著性图显示,该模型能有效聚焦于各类样本的独特特征,如红细胞中央苍白区与周围区域的边界、变形细胞的不规则轮廓以及微核红细胞中的微核等。
RBCMatch 受标记样本稀缺的影响极小。研究人员在 Doan 等人的数据集上进行实验,从加拿大数据集中随机选取不同比例的数据作为标记样本,瑞士数据集用于验证,在训练过程中选择验证准确率最高的模型在测试集上进行测试。结果发现,RBCMatch 的测试准确率随标记数据减少下降极为缓慢,即使使用仅 1% 的标记样本(样本量 = 310),其结果仍接近使用全部标记样本的情况,而监督学习方法在使用少于一半标记数据时性能就开始显著下降。
红细胞亚型分布在贫血恢复过程中呈现出明显的恢复趋势。研究人员使用 RBCMatch 对未标记样本进行分类,计算不同时间点每只小鼠红细胞图像中各亚型的比例。结果显示,贫血发生后,正常红细胞比例急剧下降,锯齿状红细胞(Crenated RBCs)比例在第 4 天大幅上升并达到峰值,随后多染性红细胞(Polychromatic RBCs)数量逐渐增加,在第 6 天达到最大值,到第 8 天,锯齿状红细胞和多染性红细胞数量均减少,红细胞形态分布逐渐恢复正常。
RBCMatch 还能通过红细胞嵌入(RBC embeddings)揭示贫血恢复的方向。研究人员对训练后网络最后一个池化层的输出进行 PCA 分析,将红细胞嵌入二维潜在空间。结果发现,不同亚型的红细胞在潜在空间中分布不同,且不同时间点的红细胞嵌入似乎分布在一维流形上,沿着流形方向,溶血性贫血逐渐缓解直至恢复正常。进一步分析发现,第二主成分(PC)与血常规检测中的红细胞计数和血红蛋白浓度密切相关,这表明该模型能够准确描绘贫血恢复过程中红细胞的形态变化,并且可以将贫血恢复过程量化为二维空间中的坐标,使监测更加直观和精确。
在研究结论与讨论部分,RBCMatch 为红细胞分类和贫血恢复评估提供了一种有效工具。它通过半监督学习策略,充分利用未标记数据的信息,在标记样本有限的情况下,仍能实现高精度的红细胞分类,其性能优于基于特征和基于卷积神经网络(CNN)的监督学习方法。该模型不仅能清晰展示红细胞比例的动态变化,反映贫血恢复趋势,还通过 PCA 分析揭示了红细胞形态变化与血常规检测数据的关联。这一成果对于深入理解贫血恢复机制、辅助临床决策和预后分析具有重要意义。
不过,目前的研究也存在一些局限性。例如,研究仅在小鼠模型上进行,尚未在人体研究中验证;实验选取的时间点有限,且未充分考虑不同小鼠之间的异质性。未来的研究可以进一步拓展样本类型和时间点选择,深入探究 RBCMatch 在人类贫血研究中的应用,同时结合其他技术方法,如自我监督学习或辅助任务,进一步提升模型性能,为贫血的临床诊疗提供更有力的支持。相信在科研人员的不断努力下,RBCMatch 将在未来的临床实践中发挥更大的作用,为贫血患者带来更多的希望。