《重新评估医学图像全参考图像质量评估势在必行》

【字体: 时间:2025年03月25日 来源:Journal of Imaging Informatics in Medicine

编辑推荐:

  为解决常用全参考图像质量评估(FR-IQA)指标不适用于医学图像评估的问题,研究人员开展相关研究,发现 PSNR、SSIM 等指标存在缺陷,为后续研究提供方向。

  在医学领域,医学成像技术的发展日新月异,从新型扫描仪的硬件创新,到图像重建的数学工具进步,再到机器学习技术的应用,这些技术的进步旨在改善患者的医疗护理。然而,在确保新型成像技术的临床可接受质量方面,定量图像质量评估(IQA)至关重要。
目前,定量 IQA 主要分为全参考(FR)、无参考(NR)和减少参考(RR)三类。其中,FR-IQA 在评估新型成像方法时应用广泛,但其常用指标如峰值信噪比(PSNR)和结构相似性指数(SSIM)是针对自然图像开发的,并不适用于医学图像。一方面,医学图像与自然图像性质差异巨大,PSNR 和 SSIM 在医学图像上未经过充分测试;另一方面,开发阶段研究人员可能未考虑医学成像数据的特殊性,导致一些不适用于临床任务的方法被推广。而且,由于缺乏公开可用的医学图像 FR 评级数据库,难以评估这些质量指标的性能。

为了解决这些问题,来自英国、德国、奥地利等多个国家的研究人员组成国际合作团队开展了相关研究。该研究成果发表在《Journal of Imaging Informatics in Medicine》上。

研究人员主要采用了以下关键技术方法:使用不同医学成像模态(如 CT、MRI、X 射线、OCT 等)的真实图像数据,针对不同的医学成像任务(如重建、后处理、可视化等问题),计算 PSNR、SSIM 和 LPIPS(基于深度学习的感知相似性指标)等 FR-IQA 指标,并与专家的视觉评估进行对比。

研究结果如下:

  • PSNR 和 SSIM 等指标在医学图像评估中的失效案例:在合成图像降解实验中,PSNR 对不同降解情况给出相同值,SSIM 和 LPIPS 无法识别局部信息丢失和错误判断噪声与伪影。在 CT 重建任务中,评估 Krylov 子空间算法和数据驱动方法时,PSNR、SSIM 和 LPIPS 无法准确反映图像质量,与视觉感知矛盾。在 MRI 扫描加速和扩散加权 MRI(dMRI)研究中,这些指标也无法正确评估图像质量,存在信息丢失和误判情况。在 X 射线成像的后处理、OCT 重建、数字病理学的可视化以及光声成像的逆问题中,PSNR 和 SSIM 同样表现不佳,无法准确评估图像质量。
  • 现有 FR-IQA 指标存在的问题:这些指标存在诸多问题,包括惩罚与任务无关的感知信息、误判导致信息丢失的广泛伪影、无法检测局部错误和结构细节,以及 PSNR/SSIM 对小空间变化和几何偏差过于敏感等。

研究结论和讨论部分指出,PSNR、SSIM 和 LPIPS 等常用 FR-IQA 指标在医学成像任务中存在明显缺陷,不能简单用于医学图像的评估。因此,需要对标准 FR-IQA 指标及其在医学成像任务中的适用性进行全面讨论。未来应开展更多研究,包括对现有 FR-IQA 指标在医学数据上的应用研究、建立公开的医学图像手动专家评级数据集、开发针对特定医学成像任务的新型 FR-IQA 指标、识别特定医学成像任务所需的感知质量属性,以及开发标准框架平台来注释和测试医学环境中的 FR-IQA 指标。同时,研究人员还提出了 FR-IQA 指标选择、描述和应用的指南,强调应综合使用经过充分测试的任务特定 FR 和 NR-IQA 指标,并结合专家的视觉质量评估,避免将 IQA 指标同时用作损失函数和评估指标,以确保评估的准确性和可靠性。

这项研究意义重大,为医学图像质量评估领域提供了重要参考,有助于推动医学成像技术的发展和临床应用,促进跨学科研究,鼓励更多研究人员参与到评估方法及其约束的研究中,为新的跨学科研究方向开辟了道路。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号