ChatGPT-4o?在儿童泌尿系结石信息提供中的可靠性、质量与可读性评估:机遇与挑战

《Urolithiasis》:Evaluation of ChatGPT-4o? responses on pediatric urolithiasis: Is it useful?

【字体: 时间:2025年10月24日 来源:Urolithiasis 2.2

编辑推荐:

  本研究针对ChatGPT-4o在儿童泌尿系结石健康信息传播中的实用性展开评估。来自某研究团队通过两次提问40个常见问题,采用mDISCERN量表和GQS量表进行测评。结果显示:mDISCERN中位数得分5分,GQS中位数得分5分,表明信息可靠性和质量较高;但可读性指标FRE(27.98±13.65)、FKGL(11.46±1.88)等显示60%内容需专业阅读水平。研究提示需优化可读性以提升患者教育公平性。

  
研究人员开展了一项针对ChatGPT-4o(ChatGPT-4o?)在儿科泌尿系结石(pediatric urolithiasis)领域回答质量的评估研究。通过间隔一周两次向模型提出相同40个高频问题,采用改良版DISCERN量表(mDISCERN)评估回答可靠性,全球质量量表(GQS)评价综合质量,并运用Flesch阅读难易度(FRE)、Flesch-Kincaid年级水平(FKGL)等五项指标分析文本可读性。
结果显示:mDISCERN得分中位数为5分(范围4-5),GQS得分中位数达5分(范围3-5),证明模型提供的信息具有高度可靠性和优质内容。但可读性数据呈现显著挑战——FRE得分27.98±13.65(分数越低越难),FKGL对应11.46±1.88年级水平,SMOG指数14.96±1.64,Gunning雾化指数(GFI)高达17.27±2.37,Coleman-Liau指数(CLI)为15.60±1.95。进一步分析发现,仅2.5%的回答适合10-12岁阅读水平,37.5%需大学程度理解,而60%内容要求专业级阅读能力。
相关性分析显示mDISCERN与GQS评分呈中等相关(r=0.42, p=0.007),但二者与可读性指标无显著关联。研究表明,尽管ChatGPT-4o能提供专业准确的儿科结石知识,但其回答的学术化表达方式形成了认知门槛。这意味着需要针对患者教育场景进行语言降维处理,才能真正实现健康科普的普惠价值。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号