综述:医学研究中的自动化机器学习:一项系统性的文献映射研究
《Artificial Intelligence in Medicine》:Automated Machine Learning in medical research: A systematic literature mapping study
【字体:
大
中
小
】
时间:2025年11月16日
来源:Artificial Intelligence in Medicine 6.2
编辑推荐:
医疗领域自动机器学习应用现状与挑战:系统文献映射分析发现,2016-2025年间244项研究主要应用于疾病诊断(52.8%)和预后预测(31.9%),采用表格数据(43.4%)和图像数据(31.5%),分类任务占81.1%。尽管XAI应用仅占30.7%,但2024年显著增长。主要挑战包括模型选择(25.3%)和数据预处理(13.7%),黑箱特性仍是临床信任障碍。
随着人工智能技术的迅速发展,机器学习(Machine Learning, ML)在医疗健康领域的应用日益广泛。从疾病诊断到治疗方案制定,再到患者预后预测,ML技术已经成为提升医疗效率和精准度的重要工具。然而,尽管其潜力巨大,ML模型的构建和优化仍然面临诸多挑战,尤其是在数据处理、模型选择以及临床适用性等方面。为了克服这些障碍,自动化机器学习(Automated Machine Learning, AutoML)逐渐成为研究的热点,旨在简化ML模型的开发流程,提高其可访问性和实用性,使非专业人员也能高效地利用ML技术。AutoML通过自动化数据预处理、特征选择、模型选择和超参数调优等关键步骤,降低了ML在医疗领域的实施门槛,加快了模型在临床环境中的部署。
然而,尽管AutoML在医疗健康领域展现出巨大的应用前景,其在实际应用中仍存在一定的局限性。其中一个显著的问题是AutoML模型的“黑箱”特性,这使得医疗专业人士在解读模型结果时面临困难。为了增强模型的可解释性,可解释人工智能(Explainable AI, XAI)技术被越来越多地引入到AutoML框架中。XAI旨在提高模型的透明度和可理解性,使医疗决策过程更加可信。然而,目前XAI在AutoML中的应用仍然处于初级阶段,缺乏系统的分析和研究。
本研究通过系统文献映射(Systematic Literature Mapping, SLM)的方法,对2016年至2025年间发表的244篇关于AutoML在医疗健康领域应用的文献进行了全面分析。这些文献来自171个不同的研究机构和学术来源,涵盖了AutoML在医疗中的多个应用方向。研究发现,大多数文献关注的是诊断预测(52.8%)和预后预测(31.9%),主要使用的是表格数据(43.4%)和图像数据(31.5%)。分类任务在这些研究中占主导地位(81.1%),其次是回归任务(9.4%)。研究还指出,在不使用管理型AutoML工具的情况下,模型选择是研究中最主要的挑战(25.3%),而在使用管理型服务的情况下,数据预处理仍然是关键问题(13.7%)。尽管XAI技术在研究中的应用比例仅为30.7%,但其采用率在2024年出现了显著增长,表明XAI在医疗领域的潜力正在逐步显现。
本研究的目的是系统地了解AutoML在医疗健康领域的应用现状,并通过六个具体的研究问题,分析其在不同方面的表现。首先,研究探讨了AutoML在哪些医学领域得到了应用,包括疾病诊断、治疗推荐、患者预后预测等。其次,研究分析了AutoML在医疗应用中所使用的数据类型,如结构化数据、非结构化数据等。第三,研究关注了AutoML在不同学习方法中的应用,如监督学习、无监督学习、半监督学习等。第四,研究探讨了AutoML在机器学习流程中的应用阶段,如数据预处理、特征工程、模型选择等。第五,研究分析了XAI技术在AutoML中的应用方式,包括如何提高模型的透明度和可解释性。最后,研究总结了在医疗领域应用AutoML所面临的主要挑战,如数据质量、模型可解释性、临床整合等。
从研究结果来看,AutoML在医疗健康领域的应用正在逐步扩大,尤其是在诊断预测和预后预测方面。这些任务通常需要处理大量的医疗数据,包括患者的病历、影像资料、实验室结果等。表格数据因其结构化和易于处理的特性,成为AutoML在医疗领域应用的主要数据来源,而图像数据则在医学影像分析中占据重要地位。分类任务的高占比反映了医疗领域对模型预测准确性的高度重视,而回归任务的应用则相对较少,这可能与医疗决策中对数值预测的需求较低有关。
在AutoML的实施过程中,数据预处理仍然是一个关键步骤。由于医疗数据通常具有高度的复杂性和多样性,数据清洗、标准化和特征选择等任务对模型的性能具有重要影响。研究发现,即使在使用管理型AutoML工具的情况下,数据预处理仍然是一个不可忽视的问题。这表明,尽管AutoML能够自动化许多模型构建的环节,但在数据处理方面仍然需要更多的研究和优化。
模型选择是AutoML实施过程中面临的另一个主要挑战。由于医疗领域的任务具有高度的多样性和复杂性,如何选择合适的模型成为研究的重点。研究发现,在不使用管理型AutoML工具的情况下,模型选择是最大的挑战,而在使用管理型服务的情况下,这一问题仍然存在。这表明,无论是否使用管理型工具,模型选择仍然是一个需要重点关注的问题。
XAI技术的引入为解决AutoML的“黑箱”问题提供了新的思路。XAI旨在提高模型的透明度和可解释性,使医疗专业人士能够更好地理解和信任AI模型的预测结果。然而,目前XAI在AutoML中的应用比例较低,仅占30.7%。这可能与XAI技术的复杂性、实施成本以及医疗领域对模型可解释性的需求有关。研究还指出,XAI技术的采用率在2024年出现了显著增长,表明其在医疗领域的应用正在逐步扩大。
从研究的局限性来看,本研究在文献检索过程中面临了一些挑战。其中,最主要的限制是无法获取完整文献的全文内容,这导致大约100篇可能相关的研究被排除在外。这一问题主要是由于机构访问权限的限制,可能会影响研究结果的全面性和多样性。此外,研究还发现,部分文献未能涵盖重要的研究方面,如特征类型、数据类型、模型构建阶段等,这可能会影响对AutoML在医疗领域应用的全面理解。
综上所述,AutoML在医疗健康领域的应用正在逐步扩大,尤其是在诊断预测和预后预测方面。然而,其在实际应用中仍然面临诸多挑战,包括数据预处理、模型选择以及模型的可解释性问题。XAI技术的引入为解决这些问题提供了新的可能性,但其应用仍然处于初步阶段。未来的研究需要进一步探索XAI与AutoML的结合方式,评估其在临床环境中的实际效果,并提高对AutoML驱动决策支持系统的信任度。此外,还需要加强对医疗数据处理和模型构建的系统研究,以推动AutoML在医疗领域的更广泛应用和深入发展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号