ChatGPT-4o?在儿童泌尿系结石信息提供中的可靠性、质量与可读性评估：机遇与挑战

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Urolithiasis》：Evaluation of ChatGPT-4o? responses on pediatric urolithiasis: Is it useful?

【字体：大中小】 时间：2025年10月24日 来源：Urolithiasis 2.2

编辑推荐：

　　本研究针对ChatGPT-4o在儿童泌尿系结石健康信息传播中的实用性展开评估。来自某研究团队通过两次提问40个常见问题，采用mDISCERN量表和GQS量表进行测评。结果显示：mDISCERN中位数得分5分，GQS中位数得分5分，表明信息可靠性和质量较高；但可读性指标FRE(27.98±13.65)、FKGL(11.46±1.88)等显示60%内容需专业阅读水平。研究提示需优化可读性以提升患者教育公平性。

研究人员开展了一项针对ChatGPT-4o（ChatGPT-4o?）在儿科泌尿系结石（pediatric urolithiasis）领域回答质量的评估研究。通过间隔一周两次向模型提出相同40个高频问题，采用改良版DISCERN量表（mDISCERN）评估回答可靠性，全球质量量表（GQS）评价综合质量，并运用Flesch阅读难易度（FRE）、Flesch-Kincaid年级水平（FKGL）等五项指标分析文本可读性。

结果显示：mDISCERN得分中位数为5分（范围4-5），GQS得分中位数达5分（范围3-5），证明模型提供的信息具有高度可靠性和优质内容。但可读性数据呈现显著挑战——FRE得分27.98±13.65（分数越低越难），FKGL对应11.46±1.88年级水平，SMOG指数14.96±1.64，Gunning雾化指数（GFI）高达17.27±2.37，Coleman-Liau指数（CLI）为15.60±1.95。进一步分析发现，仅2.5%的回答适合10-12岁阅读水平，37.5%需大学程度理解，而60%内容要求专业级阅读能力。

相关性分析显示mDISCERN与GQS评分呈中等相关（r=0.42, p=0.007），但二者与可读性指标无显著关联。研究表明，尽管ChatGPT-4o能提供专业准确的儿科结石知识，但其回答的学术化表达方式形成了认知门槛。这意味着需要针对患者教育场景进行语言降维处理，才能真正实现健康科普的普惠价值。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号