
-
生物通官微
陪你抓住生命科技
跳动的脉搏
GPT-4辅助多参数磁共振成像在前列腺活检决策中的多中心临床验证研究
【字体: 大 中 小 】 时间:2025年07月08日 来源:Military Medical Research 16.7
编辑推荐:
本研究针对中危PI-RADS评分(3-4分)患者前列腺活检决策的临床困境,通过多中心2299例样本验证了GPT-4在避免不必要活检方面的应用价值。结果显示GPT-4可使20.8%中危患者避免侵入性操作,尤其在PI-RADS 3分组表现更优(28.8%),其生成的报告综合评分达4.5/5分,为AI辅助临床决策提供了新范式。
前列腺癌(PCa)作为男性高发恶性肿瘤,2020年全球新发病例达140万例。虽然多参数磁共振成像(mpMRI)和前列腺影像报告和数据系统(PI-RADS)的应用显著提升了诊断水平,但中危评分组(PI-RADS 3-4分)患者的活检决策仍面临重大挑战——约47.5%的活检最终证实为良性病变,造成医疗资源浪费和患者负担。这一临床困境呼唤更精准的决策工具。
北京友谊医院联合北京朝阳医院等机构的研究团队开展了这项开创性研究。他们收集了2018-2023年间三所医疗中心的2299例接受前列腺活检患者的完整数据,聚焦912例中危评分患者(占39.7%),首次系统评估了GPT-4在活检决策中的表现。研究团队创新性地将临床参数、mpMRI描述性报告与人工判定因子整合为提示词,通过链式思维(CoT)方法解析AI的决策逻辑,并开发了临床辅助平台ProstAIGuide。
关键技术方法包括:1)多中心回顾性队列设计(北京三家医院2299例样本);2)GPT-4结构化报告生成系统;3)混淆矩阵和AUC等量化评估指标;4)六维度专家评分体系(准确性、全面性等);5)链式思维(CoT)决策可视化技术;6)在线诊断平台开发。
基线特征分析
研究人群的中位年龄69岁,tPSA为11.17 ng/ml。PI-RADS 2-5分组对应的临床显著性前列腺癌(csPCa)检出率分别为9.4%、27.3%、49.2%和80.1%,证实中危组(PI-RADS 3-4)存在最大诊断不确定性。值得注意的是,不同活检方式(经会阴vs经直肠)和靶向活检的应用比例存在中心间差异。
GPT-4表现评估
在912例中危患者中,GPT-4成功识别出20.8%(190例)可避免活检的病例,其中PI-RADS 3分组表现尤为突出(28.8%避免率)。虽然敏感性达0.84,但特异性仅0.44(AUC=0.65),显示存在过度推荐倾向。与临床常用风险计算器PLUM(AUC=0.81)和SPCC(AUC=0.80)相比,GPT-4在敏感性(0.90 vs 0.69-0.77)方面占优,但特异性较低。
决策逻辑解析
通过链式思维(CoT)方法,研究团队将GPT-4的决策过程解构为四个关键步骤:信息提取→PI-RADS评分→癌症风险评估→活检建议。这种可视化方法不仅提高了AI决策的透明度,还发现整合CoT可使推荐准确率从64.9%提升至71.9%(P<0.001)。
临床应用验证
专家盲评显示GPT-4生成报告在全面性(4.5/5)、可理解性(4.5/5)等方面表现优异,但准确性评分相对较低(4.14/5),主要源于PI-RADS分组与预测诊断的不一致性。针对复杂临床场景的测试表明,GPT-4展现出处理高维度数据的独特优势。
这项研究标志着AI在泌尿肿瘤领域应用的重要突破。通过最大规模的中国人群验证,证实GPT-4可有效减少约20%不必要活检,特别是在诊断最困难的PI-RADS 3分组效果更佳。研究开发的ProstAIGuide平台为临床决策提供了便捷工具,其采用的CoT方法为医疗AI的可解释性设立了新标准。尽管存在特异性不足等局限,但这项工作为下一代整合多模态数据(如基因组学、放射组学)的AI系统开发奠定了基础,推动前列腺癌诊疗向精准化、个性化方向迈进。
生物通微信公众号
知名企业招聘