医学影像研究新标杆:SIER原则引领创新与可重复性发展

《IEEE Transactions on Medical Imaging》:Editorial Criteria for TMI Papers—Significance, Innovation, Evaluation, and Reproducibility

【字体: 时间:2025年11月24日 来源:IEEE Transactions on Medical Imaging 9.8

编辑推荐:

  本刊编辑推荐:为解决医学影像研究中存在的验证不足、可解释性差及数据局限等问题,研究人员系统阐述了TMI期刊的论文评审标准SIER框架(Significance, Innovation, Evaluation, Reproducibility)。该研究明确了高水平研究需具备临床意义与方法创新性,并强调通过多中心验证、AI可解释性技术(如Shapley additive explanations)确保结果可靠性,同时倡导代码数据共享以促进可重复研究,对提升医学影像领域科研质量具有重要指导意义。

  
随着人工智能技术的飞速发展,医学影像领域正经历着前所未有的变革。从CT、MRI到PET、超声等多种成像 modality(模态),从传统的图像重建算法到新兴的深度学习技术,医学影像的研究范围日益扩大。然而,这种快速发展也带来了新的挑战:许多研究存在验证不足的问题,模型的可解释性差,数据集规模有限且质量参差不齐,甚至出现了大量缺乏创新性的论文涌入顶级期刊投稿系统的现象。正是在这样的背景下,IEEE Transactions on Medical Imaging(TMI)作为医学影像领域的权威期刊(2024年影响因子9.8,在生物医学工程类期刊中排名第10),迫切需要建立一套明确的论文评审标准,以引导该领域研究的健康发展。
为了解决这些问题,复旦大学脑科学研究院的单洪明(Hongming Shan)、伦斯勒理工学院的Uwe Kruger和Ge Wang等研究人员在TMI期刊上发表了这篇具有指导意义的编辑部文章。他们基于多次编辑部会议的讨论积累,并参考多项已发布的指南,提出了SIER框架——即 Significance(意义)、Innovation(创新)、Evaluation(评估)和Reproducibility(可重复性)四个核心维度。这一框架为非学习型、学习型及混合型医学影像研究方法建立了统一的评价基础,旨在推动该领域产生更具影响力、更可信赖的研究成果。
研究人员在文中详细阐述了SIER框架的具体要求。在 Significance 方面,强调论文必须明确阐述具有临床意义和重要性的技术问题,避免泛泛而谈的问题陈述,而应聚焦于未满足的临床需求、文献中的空白或现有技术的局限性。在 Innovation 维度,要求方法学必须具有原创性和深度,超越简单的增量改进,包括新颖的设计、算法、模型或其他方法论,针对特定医学影像任务的创新 formulation(表述),AI开发和应用中创新的损失函数或训练策略,以及物理、生物学或解剖学先验的非平凡提取或整合等。
在技术方法方面,研究人员重点强调了评估流程的严谨性。他们要求作者详细描述所使用的数据集特征,包括成像 modality、采集协议、患者 demographics(人口统计学特征)、标注方法和样本量。对于AI模型评估,必须明确描述数据划分方法(如k-fold交叉验证),并在适当的层级进行划分以避免数据泄漏。此外,还提倡使用多个互补的性能指标,进行系统的统计分析,并包含失败案例分析和定性分析。在可重复性方面,鼓励通过GitHub或IEEE DataPort等平台共享代码、数据和训练模型。
研究结果表明,一个优秀的TMI论文需要在这四个维度上都达到较高标准。在 Significance 方面,研究应该解决临床实践中真正存在的问题,而不仅仅是技术上的微小改进。即使是性能提升幅度不大的研究,如果具有强烈的方法学新颖性或其他优点,也可能被认为具有足够的意义。在 Innovation 评估中,作者必须清晰准确地描述其新颖性,明确说明与现有技术的区别。
在 Evaluation 部分,研究人员特别关注了AI特有的问题。泛化能力仍然是一个关键问题,TMI鼓励在来自更多机构或扫描仪的独立数据集上进行外部验证,特别是在声称具有临床就绪度时。亚组分析(按性别、年龄、扫描仪类型、疾病亚型)越来越被采用以识别隐藏的偏差。解决领域偏移的技术,如 harmonization(协调),得到积极认可。可解释性不应是事后考虑,而应是模型/网络设计的关键要素。
关于 Reproducibility,研究发现这是科学进步的基石,需要作者尽可能发布代码或分析脚本,使用公共数据集或提供内部数据,并清晰报告硬件和软件规范以及实验协议、统计分析和运行时细节。高质量的研究应该包含重现关键实验的说明,对于基于AI的研究,这可能进一步涉及共享训练模型、预训练权重和记录模型依赖性。
该研究的讨论部分强调了SIER框架对医学影像领域发展的重要指导意义。通过明确论文评审标准,不仅有助于作者更好地准备投稿材料,也为评审专家提供了清晰的评估依据。特别是在人工智能技术快速发展的背景下,这一框架为确保医学影像研究的质量和可靠性提供了重要保障。
值得注意的是,研究人员还特别指出了几个相关问题的处理原则。对于"意义"的界定,不能简单地套用统一的数值阈值,而需要结合具体情境来理解。即使是微小的性能提升(如0.1%),如果伴随强烈的方法学新颖性或其他优点,也可能被认为是重要的。相反,超过100%的改进通常是重要的,但百分比增益必须结合临床意义来权衡。
此外,文章明确提醒作者避免重复投稿。根据TMI网站的作者指南,一旦论文被拒绝(无论是通过桌面评审还是同行评审),都不能以修订形式重新投稿到TMI。试图这样做会在IEEE作者门户系统中触发警告标志,重复违规可能导致投稿禁令。
这项研究的重要意义在于为医学影像领域建立了一套系统、全面的论文质量评价体系。通过SIER框架的实施,不仅能够提升TMI发表论文的学术质量,还将推动整个医学影像研究社区向更加规范、严谨的方向发展。特别是在人工智能技术日益渗透到医学影像各个环节的今天,这一框架为确保技术发展的健康性和可持续性提供了重要保障。
最终,这项发表在IEEE Transactions on Medical Imaging的研究为医学影像领域的研究人员、评审专家和期刊编辑提供了明确的工作指南,通过推动符合SIER原则的高质量研究,必将促进医学影像科学的实质性进步,为临床实践提供更可靠的技术支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号