
-
生物通官微
陪你抓住生命科技
跳动的脉搏
人工智能能否像放射科医生一样解读脑部磁共振成像(MRI)?通过真实患者图像对ChatGPT和Gemini进行多模态评估
《Bratislava Medical Journal》:Can AI Read Brain MRIs Like Radiologists? A Multimodal Evaluation of ChatGPT and Gemini Using Real Patient Images
【字体: 大 中 小 】 时间:2026年04月05日 来源:Bratislava Medical Journal 1.1
编辑推荐:
人工智能在脑 lesion 诊断中的辅助价值研究,比较了两位放射科专家与 ChatGPT-4.0/4.5/Gemini 2.5 Pro 在 102 例手术证实病例的 8 种 MRI 序列分析中 lesion 检测、定位等指标,发现 AI 在基础识别准确(如 MRI 序列匹配达 98%),但鉴别诊断(准确率 82% vs 95%)和确定最可能诊断(准确率 75% vs 93%)显著落后,提示 AI 作为临床辅助工具的潜力及局限。
人工智能(AI)模型在临床诊断中的潜在作用一直备受研究。
本研究的目的是在受控评估条件下,使用标准化的磁共振成像数据集,比较经验丰富的放射科医生与现代人工智能模型在病理确诊的脑部病变患者诊断方面的表现。
这项回顾性研究分析了2024年1月至2025年6月期间接受手术治疗的102名病理确诊脑部病变患者。每位患者的8个MRI序列由两位经验丰富的放射科医生和人工智能模型(AIMs)独立评估。评估内容包括病变检测、定位、水肿、恶性程度、分级以及鉴别诊断。
两位经验丰富的放射科医生和三个人工智能模型(ChatGPT-4.0、ChatGPT-4.5和Gemini 2.5 Pro)使用所有MRI序列的完整JPEG图像集以及临床信息,对102名病理确诊脑部病变患者的影像数据进行了评估。尽管AI模型能够准确识别基本的MRI序列和基本的放射学发现,但在鉴别诊断和确定最可能的诊断方面,其表现明显不如放射科医生。两位放射科医生与参考标准的一致性很高,而AI模型的一致性仅处于中等水平。
在富含病变的队列中,AI模型在识别MRI序列和病变方面表现出近乎完美的性能。AI可以作为临床实践中的辅助工具,但不能替代专家的评估。
人工智能(AI)模型在临床诊断中的潜在作用一直备受研究。
本研究的目的是在受控评估条件下,使用标准化的磁共振成像数据集,比较经验丰富的放射科医生与现代人工智能模型在病理确诊的脑部病变患者诊断方面的表现。
这项回顾性研究分析了2024年1月至2025年6月期间接受手术治疗的102名病理确诊脑部病变患者。每位患者的8个MRI序列由两位经验丰富的放射科医生和人工智能模型(AIMs)独立评估。评估内容包括病变检测、定位、水肿、恶性程度、分级以及鉴别诊断。
两位经验丰富的放射科医生和三个人工智能模型(ChatGPT-4.0、ChatGPT-4.5和Gemini 2.5 Pro)使用所有MRI序列的完整JPEG图像集以及临床信息,对102名病理确诊脑部病变患者的影像数据进行了评估。尽管AI模型能够准确识别基本的MRI序列和基本的放射学发现,但在鉴别诊断和确定最可能的诊断方面,其表现明显不如放射科医生。两位放射科医生与参考标准的一致性很高,而AI模型的一致性仅处于中等水平。
在富含病变的队列中,AI模型在识别MRI序列和病变方面表现出近乎完美的性能。AI可以作为临床实践中的辅助工具,但不能替代专家的评估。