ChatGPT-4o?在儿童泌尿系结石信息提供中的可靠性、质量与可读性评估:机遇与挑战
《Urolithiasis》:Evaluation of ChatGPT-4o? responses on pediatric urolithiasis: Is it useful?
【字体:
大
中
小
】
时间:2025年10月24日
来源:Urolithiasis 2.2
编辑推荐:
本研究针对ChatGPT-4o在儿童泌尿系结石健康信息传播中的实用性展开评估。来自某研究团队通过两次提问40个常见问题,采用mDISCERN量表和GQS量表进行测评。结果显示:mDISCERN中位数得分5分,GQS中位数得分5分,表明信息可靠性和质量较高;但可读性指标FRE(27.98±13.65)、FKGL(11.46±1.88)等显示60%内容需专业阅读水平。研究提示需优化可读性以提升患者教育公平性。
研究人员开展了一项针对ChatGPT-4o(ChatGPT-4o?)在儿科泌尿系结石(pediatric urolithiasis)领域回答质量的评估研究。通过间隔一周两次向模型提出相同40个高频问题,采用改良版DISCERN量表(mDISCERN)评估回答可靠性,全球质量量表(GQS)评价综合质量,并运用Flesch阅读难易度(FRE)、Flesch-Kincaid年级水平(FKGL)等五项指标分析文本可读性。
结果显示:mDISCERN得分中位数为5分(范围4-5),GQS得分中位数达5分(范围3-5),证明模型提供的信息具有高度可靠性和优质内容。但可读性数据呈现显著挑战——FRE得分27.98±13.65(分数越低越难),FKGL对应11.46±1.88年级水平,SMOG指数14.96±1.64,Gunning雾化指数(GFI)高达17.27±2.37,Coleman-Liau指数(CLI)为15.60±1.95。进一步分析发现,仅2.5%的回答适合10-12岁阅读水平,37.5%需大学程度理解,而60%内容要求专业级阅读能力。
相关性分析显示mDISCERN与GQS评分呈中等相关(r=0.42, p=0.007),但二者与可读性指标无显著关联。研究表明,尽管ChatGPT-4o能提供专业准确的儿科结石知识,但其回答的学术化表达方式形成了认知门槛。这意味着需要针对患者教育场景进行语言降维处理,才能真正实现健康科普的普惠价值。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号