编辑推荐:
这篇综述聚焦影像组学(Radiomics)与人工智能(AI)在医学影像领域的应用。详细介绍其研究流程,包括数据集定义、图像采集等步骤,探讨面临的挑战与局限,为初涉该领域的研究者提供实用指导,助力深入探索相关研究。
影像组学概述
近年来,影像组学在学术领域备受关注,2017 - 2023 年相关科学成果年增长率达 200%,45.8% 的出版物集中于医学领域,尤其是肿瘤学相关的放射学研究。影像组学通过对医学图像进行定量分析,提取高维数据,为疾病诊断和预后判断带来新视角。其背后的原理是生物医学图像蕴含着疾病相关的复杂细节,这些细节难以通过传统的视觉检查发现,而影像组学借助数学算法分析信号强度和像素关系,测量纹理特征。与传统基于生物学假设开发生物标志物不同,影像组学的生物标志物(纹理特征)开发是数据驱动的。如今,影像组学与人工智能的融合为医学诊断和研究开辟了新途径。
影像组学研究流程
- 数据集定义:可靠的影像组学研究始于明确的目标和定义清晰的患者群体。定义数据集需遵循三个原则:确保足够的样本量,一般认为样本量至少应为预测类别的 50 倍和 / 或所选特征数量的 10 倍;实现患者群体的平衡代表性,当分析不同患者群体时,应尽量使各群体样本量可比,可采用欠采样或过采样的方法,但两种方法各有优缺点;保证数据质量,需在标准化条件下,使用相同设备和一致的协议进行数据采集。
- 图像采集:影像组学信息可从通过二维或体积采集技术获得的生物图像中提取,如 X 射线、MRI、核医学、超声或放射治疗计划中的剂量图等。为有效开展影像组学研究,图像应满足三个基本条件:来自相同的成像模态,最好是同一台扫描仪;采集协议应一致且标准化;尽量减少或保持所有可能影响采集的其他变量和外部条件一致。由于影像组学特征对成像模态、协议和重建参数的变化高度敏感,北美放射学会和美国国家生物医学成像与生物工程研究所推出了相关倡议,以规范定量成像生物标志物的测量准确性。
- 图像预处理:数据质量与影像组学特征的可重复性和再现性密切相关,“垃圾进,垃圾出”,图像采集过程中的多种因素,如扫描仪设备、采集技术等,都会影响影像组学特征。图像预处理主要包括重采样、bin 宽度设置和归一化三个步骤。重采样通过改变图像的空间分辨率,减少因采集设备或协议差异导致的潜在差异,建立统一网格,便于后续分析,但不同研究根据目的和成像技术会采用不同的重采样策略;bin 宽度设置决定了像素强度值分组的间隔,合适的 bin 宽度选择至关重要,需综合考虑数据特征、分析目标和对强度变化的敏感性等因素;归一化用于标准化放射学图像的像素强度值,建立统一尺度,提高后续定量分析的可比性和可解释性,对于来自不同机器和采集协议的异质性数据,归一化尤为必要。
- 图像分割:图像分割是影像组学研究的关键步骤,但常被低估且易出错。在进行图像分割时,需要确定两个主要方面:采用自动、半自动还是手动分割方式;分割感兴趣区域(ROIs)还是感兴趣体积(VOIs)。手动分割耗时且易受观察者主观因素影响,通常需要至少两名经验丰富的操作者达成共识来减少误差;半自动方法如区域生长或阈值分割,虽能加快分割过程,但仍需医生进行最终细化检查;自动分割可解决可重复性问题,但自动分割算法的泛化性存在挑战,在不同数据集上的表现差异较大。选择 ROIs 还是 VOIs 取决于图像类型和质量、研究目标以及分割技术等因素,两者各有优劣,在肿瘤学应用中,需根据临床和研究目的进行选择。
- 特征提取:图像分割后,影像组学特征提取用于量化 ROIs 或 VOIs 内的灰度特征。在这一阶段,需要确保建立放射组学特征提取的参考标准,明确要提取的放射组学特征类别,并考虑是否从原始图像和 / 或后处理图像中提取特征。放射组学特征计算方法多样,建议参考权威指南或标准,如 IBSI 和 PyRadiomics。放射组学特征可分为不同类别,如一阶特征(基于图像强度直方图计算的统计量)、形状特征(描述 ROI 的形状和大小)、灰度共生矩阵(GLCM)特征(从像素强度的空间排列导出的纹理特征)等。复杂类别的特征通常更具信息性,但可重复性较差,在研究中需根据具体目标和临床应用,仔细权衡特征复杂性(信息内容)和可重复性(稳健性)之间的关系。此外,还需决定是提取所有可能的特征还是仅选择特定类别的特征,前者可获取最大信息量,但计算成本高,后者可降低计算成本,且可能不影响信息获取。放射组学特征不仅可从原始预处理图像中提取,还可从应用滤波器后的图像中提取,如小波、LoG(高斯拉普拉斯)等滤波器,这些滤波器可突出图像的某些方面,提供更具信息性的特征,但同时也可能引入冗余或无关信息。
- 特征选择:从放射学图像中可提取大量的影像组学特征,若全部用于训练机器学习(ML)模型,容易导致过拟合。过拟合是指模型过于复杂,与训练数据过度匹配,在新数据上表现不佳。因此,需要选择特定的特征来创建 ML 模型。特征选择方法主要分为三类:过滤法,基于统计属性评估特征,在模型训练前过滤掉无关或冗余特征;包装法,通过迭代特征选择过程,测试不同特征组合,以确定优化模型性能的子集;嵌入法,将特征选择作为模型优化的一部分,在训练模型时选择最相关的特征。特征选择是正确进行影像组学研究的必要步骤,可减少过拟合和数据复杂性,提高模型的可解释性和性能,并优化计算资源。
- AI 模型:影像组学研究的最后一步是基于所选影像组学特征开发预测性 ML 模型。在这一过程中,需要考虑选择最合适的 ML 算法、如何训练和测试模型、如何优化算法参数以及如何评估模型。首先要决定采用监督学习还是无监督学习。无监督学习中,数据无标签,模型旨在发现数据集中的模式,将数据分离成一个或多个簇,更适合探索和理解数据结构,但在医疗保健研究中不太常用;监督学习则专注于开发能够解释数据以预测医生定义的目标的模型,因此在影像组学医学研究中通常更受青睐。常见的监督学习模型包括逻辑回归(用于二元分类任务的线性模型)、支持向量机(通过识别最优超平面分离数据)、随机森林(构建多个决策树并聚合预测结果,具有较高准确性和抗过拟合能力)和深度神经网络(由多层相互连接的神经元组成,能够学习复杂模式)等。模型的选择取决于数据集大小和问题的复杂性,深度神经网络通常需要大量数据集以避免过拟合,而简单模型更适合较小的数据集。在训练和测试模型之前,需要将数据集划分为训练子集和测试子集,以确保测试数据未在训练过程中被模型见过。常见的划分方法有分层训练 / 测试分割(保持不同类别的比例不变)、随机训练 / 测试分割、K 折交叉验证(将数据集划分为多个子集,在不同子集组合上训练和测试模型)和留一法(K 折交叉验证的特殊情况,每个数据点都作为一次验证集)等。选定算法后,还需要对其参数进行微调,可采用调整超参数(如手动调整学习率、批量大小等)、网格搜索或随机搜索(系统探索不同超参数组合)以及正则化技术(添加惩罚项以防止过拟合)等方法。模型训练和测试完成后,可通过多种指标评估模型质量,如准确率(模型正确预测的百分比)、召回率(真阳性率,即实际阳性实例被正确识别的百分比)、精确率(实际阳性实例被正确识别的百分比与被模型识别为阳性的实例百分比之比)、F1 分数(精确率和召回率的调和均值)、混淆矩阵(展示模型在分类问题中正确和错误预测的数量)、受试者工作特征曲线(ROC)和曲线下面积(AUC,用于评估二元分类模型在真阳性率和假阳性率之间的权衡)以及平均绝对误差(MAE,用于回归问题,衡量模型预测值与观测值之间的平均绝对差异)和均方误差(MSE,衡量模型预测值与观测值之间的平均平方差异)等。然而,这些指标良好并不保证模型的泛化性,模型的泛化能力与训练和测试数据集的多样性和代表性等多种因素有关。
结论
影像组学是分析医学图像的有力定量工具,能够揭示传统视觉检查难以察觉的特征。本综述全面概述了影像组学的研究流程,强调了各个关键步骤,同时探讨了关键实践和潜在陷阱,旨在为初学者提供指导。目前,影像组学研究在方法学上逐渐趋于统一,但仍存在一些依赖具体情境的选择。标准化框架的开发正在进行中,有望进一步减少潜在的不一致性。随着人工智能和影像组学在临床实践中的应用日益广泛,未来的放射科医生和研究人员需要深入理解影像组学的基本原理,以更好地推动该领域的发展。