人工智能平台在HIV防治信息中的表现评估:安全性、副作用与疗效的主题分析

【字体: 时间:2025年06月08日 来源:AIDS and Behavior 2.7

编辑推荐:

  这篇综述系统评估了四种AI平台(ChatGPT 3.5/4.0、Google Bard和HIV.gov Chatbot)提供的HIV防治药物信息质量,揭示了其核心主题包括医疗专业咨询建议、药物副作用(如器官/骨骼影响)和疗效肯定性,其中ChatGPT 4.0响应最全面,但普遍缺乏参考文献支持,凸显AI在医疗信息传播中的潜力与局限。

  

引言
随着ChatGPT等大型语言模型(LLM)的普及,AI平台成为公众获取HIV防治信息的重要渠道。然而,这些平台提供的药物安全性、副作用及疗效信息是否可靠仍待验证。本研究通过输入38个HIV相关药物问题,对比分析四种AI平台(ChatGPT 3.5/4.0、Google Bard和HIV.gov Chatbot)的608条响应,揭示了AI在医疗信息传播中的表现与局限。

方法
研究采用纵向设计,连续四周向各平台输入相同问题,记录响应内容。通过定性内容分析法,编码核心主题(如医疗咨询建议、药物副作用描述),并评估响应全面性。重点关注替诺福韦类抗逆转录病毒药物(如Biktarvy?
、Descovy?
)的信息准确性。

结果
核心主题

  1. 医疗咨询建议:所有平台均高频建议“咨询医疗专业人士”,占比最高(如“需个性化医疗建议”)。
  2. 副作用描述:器官/骨骼副作用(如肾损伤、骨密度下降)提及最多,其次为胃肠道症状(恶心、腹泻)。ChatGPT 4.0详细描述症状机制,而HIV.gov Chatbot仅简略提及。
  3. 药物分类错误:部分平台误将Biktarvy?
    等治疗药物归类为PrEP(暴露前预防)用药,存在“AI幻觉”现象。

平台差异

  • 全面性:Google Bard响应最详尽(1783条编码),但内容波动大;ChatGPT 4.0次之(1552条),稳定性较高;HIV.gov Chatbot最简略(350条)。
  • 参考文献:仅HIV.gov Chatbot(72%响应含链接)和Google Bard(22%)提供来源,ChatGPT全无引用。

讨论
AI平台在HIV药物基础信息(如疗效肯定、常见副作用)上表现可靠,与FDA/WHO指南一致。但局限性显著:

  1. 信息溯源缺失:多数响应未标注来源,用户难验证真实性。
  2. 内容偏差:依赖英语西方文献,可能忽视地域多样性需求。
  3. 动态更新挑战:平台迭代快速(如Bard更名Gemini),需持续监测。

结论
AI已成为HIV防治信息的重要补充,但需优化引用透明度与内容准确性。未来研究应关注LLM在非英语语境下的适用性,并探索AI与专业医疗服务的协同模式。

(注:全文基于原文数据,未添加主观结论;专业术语如PrEP、LLM等均按原文格式标注。)

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号