
-
生物通官微
陪你抓住生命科技
跳动的脉搏
卷积神经网络中数值变量信息保存的集成概率量化编码新方法
【字体: 大 中 小 】 时间:2025年02月12日 来源:Scientific Reports 3.8
编辑推荐:
本研究针对传统one-hot编码在CNN分类任务中丢失数值变量定量信息的问题,提出集成概率量化编码(EPQ)新方法。研究人员通过眼底图像预测年龄和血红蛋白水平的对比实验证明,EPQ通过概率密度函数分配类别概率,在保留定量信息的同时显著提升模型性能,尤其在小类别数据集上表现优异,为医学影像分析提供了更稳健的编码方案。
在人工智能医疗应用蓬勃发展的今天,卷积神经网络(CNN)已成为分析医学影像的利器。眼底照片因其标准化程度高、可重复性强,被广泛用于预测年龄、血红蛋白水平等生理指标。然而一个长期困扰研究者的难题在于:当需要将连续型数值变量(如年龄)转换为分类变量时,传统的one-hot编码会丢失关键的定量信息——比如将50岁误判为30岁与误判为70岁会被视为同等错误,这显然不符合临床认知逻辑。
韩国忠南大学医院(Chungnam National University Hospital)眼科团队在《Scientific Reports》发表的研究中,创新性地提出了集成概率量化编码(Ensemble Probabilistic Quantization, EPQ)方法。该方法通过概率密度函数(PDF)将数值分布到各个类别,使每个类别成为具有特定期望值的"量子",通过交叉熵损失函数实现类别间的协同学习。研究采用21万张眼底图像大数据集,系统比较了EPQ与传统one-hot编码、标签平滑(LS)及回归方法的性能差异。
关键技术包括:1) 构建包含210,838张眼底照片的年龄预测数据集和105,189张照片的血红蛋白数据集;2) 设计四种不同间隔的分类编码方案(从6类到104类);3) 采用EfficientNet B3、ResNet50和DenseNet169模型进行对比训练;4) 通过期望值重建和argmax两种方法还原预测值。
基线特征
研究纳入2007-2023年间107,214患者的258,674眼眼底照片,经严格筛选后保留210,838张年龄预测图像和105,189张血红蛋白预测图像。预处理包括统一调整为300×300像素、归一化至[0,1]范围,并按8:1:1划分训练/验证/测试集。
年龄预测结果
EPQ在所有编码间隔下均保持线性分布,R2值稳定在0.8左右,性能接近回归方法。当类别数从104减至6时,EPQ仍保持优异表现,而one-hot编码则出现明显性能下降。模型训练曲线显示EPQ的MSE最低(约22),且过拟合程度显著低于其他方法。

血红蛋白预测结果
在存在更多测量误差的血红蛋白数据中,EPQ表现尤为突出:当采用0.1 g/dL精细间隔时,其MSE甚至略优于回归方法(7.3 vs 7.5),验证了该方法对异常值的鲁棒性。
多模型验证
在ResNet50和DenseNet169上的重复实验证实了EPQ的普适性。特别在类别受限(delta=10)情况下,EPQ显著优于其他编码方法,而随着类别数增加(delta=1),各方法差异缩小。
这项研究揭示了定量信息保存对CNN性能的关键影响:EPQ通过三个机制突破传统局限——1) 采用钟形PDF保持数值关系;2) 通过期望值重建减少信息损失;3) 多类别协同降低过拟合。该方法为医学影像分析提供了新思路,特别适用于存在测量误差的生理参数预测。研究者也指出EPQ在极端值处理和数据偏态分布场景下的局限性,建议根据数据类型选择最佳编码策略。这项工作不仅改进了CNN在医疗领域的应用效能,也为其他需要处理连续变量的分类任务提供了普适性解决方案。
生物通微信公众号
知名企业招聘