
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于多域平衡混合与特征对齐的白细胞分类域自适应方法研究
【字体: 大 中 小 】 时间:2025年06月11日 来源:Array 2.7
编辑推荐:
为解决白细胞(WBC)图像分类中跨域泛化能力不足及数据不平衡问题,研究人员提出DaNet框架,创新性地结合平衡多域混合(BMDM)数据增强与数据分布对齐(DDA)技术。实验表明该方法在Matek-19等三个公开数据集上显著提升分类性能,F1-micro最高达97.74%,为临床血液病诊断提供了更可靠的自动化分析工具。
在临床血液诊断领域,白细胞分类是疾病监测的重要环节,但现有深度学习模型面临两大挑战:不同医疗机构间染色协议、显微镜参数差异导致的"域偏移"问题,以及白细胞亚型间形态相似性高、样本量不均衡带来的分类困难。传统方法依赖独立同分布假设,当测试数据与训练数据分布不一致时性能显著下降,这严重制约了自动化分析系统在真实医疗场景中的应用价值。
针对这一难题,深圳技术大学的研究团队在《Array》发表了创新性研究成果。该研究提出名为DaNet的域自适应网络,通过平衡多域混合(BMDM)和数据分布对齐(DDA)两大核心技术,显著提升了模型在未见过的医疗域数据上的泛化能力。研究采用三个公开白细胞数据集(Matek-19、Acevedo-20和Bodzas-23)进行验证,通过留一域交叉验证策略,证明该方法在跨域场景下的优越性能。
关键技术方法包括:1) BMDM通过混合多源域样本生成平衡的合成数据,采用Beta(α,1)分布控制混合比例;2) DDA基于改进的BoDA算法设计损失函数,利用欧氏距离度量特征相似性;3) 采用ResNet-50作为特征提取器,结合周期性均值更新机制(每120步)。实验设计包含与6种前沿方法的对比,以及消融实验验证各模块贡献。
研究结果显示:在"3.3 平衡多域混合"部分,BMDM通过实例采样与类采样的策略组合,有效缓解了Matek-19数据集中中性粒细胞占比过高(85.93%)的问题。"3.4 数据分布对齐"章节表明,改进的损失函数使同类样本特征距离缩小29%,异类样本特征分离度提高41%。可视化分析("4.7 数据分布对齐有效性")显示,DaNet使嗜碱性粒细胞等少数类形成更紧密的聚类。
"4.4 实验结果"数据显示,DaNet在Acevedo-20测试集上取得93.47%的F1-micro值,较次优方法BoDA提升1.1个百分点。特别值得注意的是,在数据严重不平衡的Matek-19测试场景下,DaNet*
(采用反转采样策略)的类平均准确率达84.48%,证明其对数据偏斜的鲁棒性。
结论部分指出,该研究首次将平衡采样策略与多域特征对齐相结合,解决了白细胞分类中"小类样本特征被淹没"的难题。方法学创新体现在:1) BMDM构建连续潜在空间,使混合样本保留判别性特征;2) DDA损失函数中的校准参数λj,c
j',c'
=(Nj',c'
/Nj,c
)ν
有效平衡不同域-类对的贡献。未来工作将聚焦于改进特征提取模块,以捕获更精细的细胞形态学特征。这项研究为医学影像的域泛化问题提供了新思路,其技术框架可扩展至其他存在数据分布偏移的医疗AI应用场景。
生物通微信公众号
知名企业招聘