人工智能平台在HIV防治信息中的表现评估：安全性、副作用与疗效的主题分析

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年06月08日 来源：AIDS and Behavior 2.7

编辑推荐：

　　这篇综述系统评估了四种AI平台（ChatGPT 3.5/4.0、Google Bard和HIV.gov Chatbot）提供的HIV防治药物信息质量，揭示了其核心主题包括医疗专业咨询建议、药物副作用（如器官/骨骼影响）和疗效肯定性，其中ChatGPT 4.0响应最全面，但普遍缺乏参考文献支持，凸显AI在医疗信息传播中的潜力与局限。

引言
随着ChatGPT等大型语言模型（LLM）的普及，AI平台成为公众获取HIV防治信息的重要渠道。然而，这些平台提供的药物安全性、副作用及疗效信息是否可靠仍待验证。本研究通过输入38个HIV相关药物问题，对比分析四种AI平台（ChatGPT 3.5/4.0、Google Bard和HIV.gov Chatbot）的608条响应，揭示了AI在医疗信息传播中的表现与局限。

方法
研究采用纵向设计，连续四周向各平台输入相同问题，记录响应内容。通过定性内容分析法，编码核心主题（如医疗咨询建议、药物副作用描述），并评估响应全面性。重点关注替诺福韦类抗逆转录病毒药物（如Biktarvy^?
、Descovy^?
）的信息准确性。

结果
核心主题

医疗咨询建议：所有平台均高频建议“咨询医疗专业人士”，占比最高（如“需个性化医疗建议”）。
副作用描述：器官/骨骼副作用（如肾损伤、骨密度下降）提及最多，其次为胃肠道症状（恶心、腹泻）。ChatGPT 4.0详细描述症状机制，而HIV.gov Chatbot仅简略提及。
药物分类错误：部分平台误将Biktarvy^?
等治疗药物归类为PrEP（暴露前预防）用药，存在“AI幻觉”现象。

平台差异

全面性：Google Bard响应最详尽（1783条编码），但内容波动大；ChatGPT 4.0次之（1552条），稳定性较高；HIV.gov Chatbot最简略（350条）。
参考文献：仅HIV.gov Chatbot（72%响应含链接）和Google Bard（22%）提供来源，ChatGPT全无引用。

讨论
AI平台在HIV药物基础信息（如疗效肯定、常见副作用）上表现可靠，与FDA/WHO指南一致。但局限性显著：

信息溯源缺失：多数响应未标注来源，用户难验证真实性。
内容偏差：依赖英语西方文献，可能忽视地域多样性需求。
动态更新挑战：平台迭代快速（如Bard更名Gemini），需持续监测。

结论
AI已成为HIV防治信息的重要补充，但需优化引用透明度与内容准确性。未来研究应关注LLM在非英语语境下的适用性，并探索AI与专业医疗服务的协同模式。

（注：全文基于原文数据，未添加主观结论；专业术语如PrEP、LLM等均按原文格式标注。）

热点排行

新闻专题

联系信箱：

粤ICP备09063491号