综述:医学影像信息学中人工智能和数据科学方法在白细胞图像自动检测中的应用

【字体: 时间:2025年05月17日 来源:Journal of Imaging Informatics in Medicine

编辑推荐:

  本综述聚焦人工智能(AI)与数据科学(DS)在生物医学诊断,尤其是白细胞(WBCs)自动检测、分类及计数中的应用。通过分析 SCOPUS 文献,探讨机器学习、深度学习等算法的效能,指出其可提升诊断效率与准确性,未来可关注生成式 AI 在血细胞诊断中的应用。

  

白细胞的生物学特性与功能


白细胞(WBCs)作为人体免疫系统的防御力量,可分为粒细胞和无粒细胞两大类。粒细胞包含中性粒细胞、嗜酸性粒细胞和嗜碱性粒细胞,在免疫防御中承担即时防御病原体的作用。中性粒细胞占白细胞的 50-80%,具有强大的吞噬能力,能吞噬并破坏细菌、真菌等病原体,其在血液中循环寿命较短,约 7-10 小时,在组织中为 1-2 天。嗜酸性粒细胞占 1-4%,主要参与寄生虫感染和过敏反应,可释放毒性颗粒杀死寄生虫,并调节炎症和过敏反应,在血液中循环 1 天,在组织中存活 8-12 天。嗜碱性粒细胞占 0-1%,参与过敏反应和免疫调节,释放组胺等物质。无粒细胞包括淋巴细胞和单核细胞,淋巴细胞占 20-40%,提供适应性免疫反应,分为 B 细胞、T 细胞和自然杀伤细胞;单核细胞占 2-10%,是最大的外周血细胞,可分化为巨噬细胞等,参与吞噬、抗原呈递等。白细胞的数量和形态变化与多种疾病相关,如白细胞减少(<4000 WBC/ml)、白细胞增多(>11,000 WBC/ml),其检测对感染、炎症、白血病等疾病的诊断至关重要。

人工智能与数据科学在生物医学诊断中的应用


人工智能旨在创建能执行需人类智能任务的系统,涵盖规则 - based 系统、机器学习(ML)等技术。数据科学是利用数学、统计和计算机科学方法从数据中提取见解的多学科领域,包含机器学习、深度学习(DL)、数据挖掘等方法。机器学习是人工智能的分支,使计算机无需显式编程即可从数据中学习,传统机器学习方法包括支持向量机(SVM)、随机森林等。深度学习是机器学习的子集,利用深度神经网络处理复杂数据,如卷积神经网络(CNN)适用于图像分析,可自动提取白细胞图像的空间特征。人工智能和数据科学在医疗领域可提升疾病诊断、患者护理和病历管理的效率与准确性。

研究方法与数据收集


本研究数据来自 SCOPUS 数据库,采用文献调查和科学映射方法。搜索关键词包括 “数据科学”“深度学习”“人工智能”“白细胞” 等,共检索到 329 篇文献,经 PRISMA 流程筛选,最终纳入 247 篇符合标准的文献。利用 R-Studio 中的 Bibliometrix 和 VOSviewer 进行科学映射和分析,以评估人工智能和数据科学方法在白细胞检测中的研究趋势、热点和效能。

研究结果与讨论


科学文献生产力趋势


1990 年代关于人工智能和数据科学方法用于白细胞检测的文献较少,2000-2009 年缓慢增长,2011-2019 年随着技术在生物医学诊断领域的关注增加,文献数量呈上升趋势。2020 年新冠疫情爆发后,人工智能和数据科学在医疗领域的应用显著增长,该领域文献数量激增,2022 年达到峰值 43 篇。回归分析显示,时间是文献数量变化的良好预测因子,指数模型更能准确反映文献数量的加速增长趋势。

重要来源与影响


分析发现,164 个来源发表了 247 篇文献,其中前十来源发表了 46 篇(19%)。《Lecture Notes in Computer Science(Includes Subseries Lecture Notes in AI and Bioinformatics)》发表文献最多(8 篇),且 H 指数最高(470)。文献类型中,63% 为期刊文章,27% 为会议论文,10% 为书籍章节,主要涉及计算机科学和生物医学领域。

文献被引情况与研究热点


被引最多的文献探讨了利用图像分割算法自动分割聚集细胞核,其次是使用决策支持系统构建白细胞最佳自动分类模型。研究热点通过关键词分析呈现,高频关键词包括 “深度学习”“分类”“白细胞” 等。关键词聚类显示,研究主题随时间演变,早期关注白血病诊断,近年聚焦深度学习、生成对抗网络等技术应用。

人工智能与数据科学方法的应用案例


多种人工智能和数据科学技术被应用于白细胞检测、分割和分类。卷积神经网络(CNN)用于急性淋巴细胞白血病(ALL)细胞的自动分类;随机森林用于区分白血病和非白血病细胞;迁移学习用于改进基于有限数据的 ALL 分类;深度学习模型用于急性髓系白血病(AML)细胞分类;K - 近邻(KNN)用于检测 AML 的白细胞纹理特征;支持向量机(SVM)用于慢性淋巴细胞白血病(CLL)分类等。此外,这些技术还应用于感染、自身免疫性疾病、骨髓疾病等的诊断。

方法的有效性与局限性


人工智能和数据科学方法在白细胞检测中表现出较高的准确性,如深度学习模型准确率常超 90%,但存在可解释性差的问题。尽管数据增强等技术可提高模型鲁棒性,但图像质量变异、数据集偏差(如类别不平衡、缺乏多样性)等限制了模型的泛化能力。此外,还存在数据隐私、伦理等问题,需建立透明、公平的伦理框架。

结论与未来研究方向


本研究表明,人工智能和数据科学方法在白细胞检测、分割和分类中具有显著效能,可提高诊断的准确性和效率,但需解决模型可解释性、泛化能力和伦理问题。未来研究可聚焦生成式 AI 在白细胞检测中的应用,开发多模态深度学习模型,整合基因组数据等多源数据,提升模型的鲁棒性和诊断能力,同时加强数据多样性和标准化,促进技术在临床实践中的应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号