
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于混合元启发式方法的数字乳腺X光片乳腺癌检测特征选择:一种放射组学与深度学习的可行性初步研究
《BMC Medical Imaging》:Hybrid metaheuristic feature selection for breast cancer detection in digital mammography: a radiomics and deep learning pilot feasibility study
【字体: 大 中 小 】 时间:2026年06月14日 来源:BMC Medical Imaging 3.2
编辑推荐:
摘要背景人工智能技术能够提升乳腺X光检查中乳腺癌的检测精度,但高维特征空间以及特征选择的不稳定性仍是个难题。本研究开发了一种混合元启发式特征选择框架,该框架结合了放射组学特征与深度学习特征,并在小型真实乳腺X光数据集以及为测试易崩溃条件下的性能而设计的可控合成数据集上,对该方法的
人工智能技术能够提升乳腺X光检查中乳腺癌的检测精度,但高维特征空间以及特征选择的不稳定性仍是个难题。本研究开发了一种混合元启发式特征选择框架,该框架结合了放射组学特征与深度学习特征,并在小型真实乳腺X光数据集以及为测试易崩溃条件下的性能而设计的可控合成数据集上,对该方法的可行性进行了评估。
利用公开的CBIS-DDSM数据集,从预训练且未经过微调的EfficientNet-B5模型中提取了2,051个符合图像生物标志物标准化计划要求的放射组学特征,以及每个目标病变区域对应的2,048维深度学习特征。研究采用了混合型的Grasshopper优化算法与Crow搜索算法(GOA-CSA),并结合所设计的多约束适应度函数,为多层感知器分类器选择最优的特征子集。性能评估在较小的CBIS-DDSM数据子集(n?=?22,采用5折分层交叉验证)以及一个合成数据集(N?=?16,D?=?1114)上进行,旨在在易崩溃条件下比较所提出的适应度函数与传统适应度函数的性能。
在CBIS-DDSM数据集上的测试中,混合GOA-CSA模型平均选择了486个特征,其交叉验证后的接收者操作特征曲线下面积为0.750?±?0.433,灵敏度为0.433?±?0.435;而使用所有特征的基线模型的AUC为0.900?±?0.224,灵敏度为0.667?±?0.471。在合成数据集的对比中,所提出的适应度函数对应的AUC为0.810?±?0.115,灵敏度为0.571?±?0.198;而传统适应度函数对应的数值分别为0.476?±?0.210和0.286?±?0.241。虽然研究中设置了防止模型性能崩溃的惩罚机制,但由于两种模型的灵敏度均保持正值,因此在该测试中并未实际触发该机制。
这项可行性研究表明,混合GOA-CSA框架能够成功筛选出结合了放射组学特征与深度学习特征的简洁特征子集。目前的研究结果尚处于探索阶段,主要用于提出新的假设,而由于真实数据样本量较小,无法对模型性能进行确切评估。合成实验虽证明了多约束适应度设计的概念价值,但防止性能崩溃的惩罚机制在真实乳腺X光数据上仍需进一步验证。未来需要在如VinDr-Mammo这样的独立数据集上开展外部验证,这是后续研究的重要任务。
人工智能技术能够提升乳腺X光检查中乳腺癌的检测精度,但高维特征空间以及特征选择的不稳定性仍是个难题。本研究开发了一种混合元启发式特征选择框架,该框架结合了放射组学特征与深度学习特征,并在小型真实乳腺X光数据集以及为测试易崩溃条件下的性能而设计的可控合成数据集上,对该方法的可行性进行了评估。
利用公开的CBIS-DDSM数据集,从预训练且未经过微调的EfficientNet-B5模型中提取了2,051个符合图像生物标志物标准化计划要求的放射组学特征,以及每个目标病变区域对应的2,048维深度学习特征。研究采用了混合型的Grasshopper优化算法与Crow搜索算法(GOA-CSA),并结合所设计的多约束适应度函数,为多层感知器分类器选择最优的特征子集。性能评估在较小的CBIS-DDSM数据子集(n?=?22,采用5折分层交叉验证)以及一个合成数据集(N?=?16,D?=?1114)上进行,旨在在易崩溃条件下比较所提出的适应度函数与传统适应度函数的性能。
在CBIS-DDSM数据集上的测试中,混合GOA-CSA模型平均选择了486个特征,其交叉验证后的接收者操作特征曲线下面积为0.750?±?0.433,灵敏度为0.433?±?0.435;而使用所有特征的基线模型的AUC为0.900?±?0.224,灵敏度为0.667?±?0.471。在合成数据集的对比中,所提出的适应度函数对应的AUC为0.810?±?0.115,灵敏度为0.571?±?0.198;而传统适应度函数对应的数值分别为0.476?±?0.210和0.286?±?0.241。虽然研究中设置了防止模型性能崩溃的惩罚机制,但由于两种模型的灵敏度均保持正值,因此在该测试中并未实际触发该机制。
这项可行性研究表明,混合GOA-CSA框架能够成功筛选出结合了放射组学特征与深度学习特征的简洁特征子集。目前的研究结果尚处于探索阶段,主要用于提出新的假设,而由于真实数据样本量较小,无法对模型性能进行确切评估。合成实验虽证明了多约束适应度设计的概念价值,但防止性能崩溃的惩罚机制在真实乳腺X光数据上仍需进一步验证。未来需要在如VinDr-Mammo这样的独立数据集上开展外部验证,这是后续研究的重要任务。