编辑推荐:
这篇综述探讨了大语言模型(LLMs)在甲状腺疾病诊疗中的应用。它分析了 LLMs 在患者教育、诊疗流程优化等方面的潜力,也指出了隐私、信息更新等挑战,对了解 LLMs 在甲状腺疾病领域的应用意义重大。
引言
甲状腺疾病患病率持续攀升,给公共健康带来沉重负担。像甲状腺结节影响近 70% 的全球人口,全球三分之一人口处于碘缺乏地区,甲状腺癌新发病例也不断增加,且会造成经济损失和心理负担 。
传统临床实践在甲状腺疾病诊疗上困难重重。患者对疾病认知不足,健康素养有限,影响医患沟通和治疗效果。甲状腺疾病综合管理需多学科协作,但医疗资源分配不均,存在资源浪费现象。术前诊断的金标准 —— 细针穿刺(FNA)细胞学检查,观察者间差异大,急需更精准高效的辅助诊断工具。
数字健康技术的发展,尤其是大语言模型(LLMs),为解决这些问题带来希望。LLMs 是基于大量文本数据训练的生成式人工智能,能处理多模态输入,生成文本、图像和视频等。它有望改善甲状腺疾病诊疗现状,开启数字甲状腺医疗的新领域。
潜在的患者层面应用
甲状腺疾病作为慢性病,患者需长期自我管理。教育对患者了解疾病、监测和控制风险因素至关重要。研究发现,LLMs 在患者教育方面表现出色。例如,ChatGPT 4.0 在解答孕期甲状腺功能减退相关问题时,多数回答质量高,且平均准确率高于医生。LLMs 还能在就诊前后发挥作用,帮助患者准备问题、理解检查结果和专业术语,但也存在提供错误信息的风险,未来需进一步评估。
甲状腺疾病的综合管理涉及多个学科,患者就医流程复杂、等待时间长。LLMs 可用于疾病严重程度的初步评估、远程分诊和转诊指导,尤其在医疗资源有限地区作用显著。通过与电子健康记录(EHR)系统集成,利用自然语言处理(NLP)技术,LLMs 能根据患者症状和临床信息给出初步分诊建议,但目前其在减少过度诊断和治疗方面的效果缺乏实证支持。
甲状腺疾病与情感障碍密切相关,而心理辅导专业人员短缺。LLMs 可提供情感支持和心理评估,因其非人类身份,患者交流时更放松。研究显示,基于 NLP 技术的 LLMs 在情感评估方面优于现有模型,有助于提升甲状腺疾病的整体护理水平。
潜在的医疗专业人员层面应用
医生日常工作中常花费大量时间在繁琐任务上,影响患者护理。LLMs 能快速总结和改写信息,减少医护人员重复性工作时间。它可辅助分诊、安排预约、记录病历、协助撰写医疗文档、发送随访提醒等,还能制作手术或治疗相关的易懂资料,促进医患沟通,提高治疗效率。
甲状腺疾病的精确诊断和决策面临诸多挑战,如超声检查和 FNA 细胞学检查结果的解读存在差异。研究表明,LLMs 在甲状腺结节诊断方面表现出色。例如,ChatGPT 4.0 在评估甲状腺结节超声图像时,准确率和灵敏度较高,甚至超过传统卷积神经网络(CNNs)。将 LLMs 整合到临床决策支持系统中,有望优化甲状腺疾病的诊疗效率。
LLMs 在医学教育和学术研究领域也发挥着重要作用。它能帮助研究人员快速总结文献、模拟临床场景、生成考试题,还能辅助学术研究,如解决方法学问题、翻译、编辑和校对论文等。在甲状腺疾病研究中,LLMs 可从大量临床数据中提取关键信息,推动学术研究进展。
挑战与可能的解决方案
将 LLMs 应用于甲状腺疾病诊疗,隐私和伦理问题突出。患者敏感数据如 FNA 结果、癌症分期信息等存在泄露风险。医疗机构应采取严格的数据匿名化措施,去除可识别信息,考虑本地部署 LLMs,加强数据控制,同时明确患者同意流程,保障患者知情权。
部分 LLMs 数据库信息陈旧,如 ChatGPT 3.5 的数据截至 2022 年,无法提供最新治疗建议,难以替代专业医疗团队的决策。因此,需持续更新 LLMs 数据库,整合实时医学文献或定期更新训练数据,以跟上医学发展步伐。
一些 LLMs 生成的内容可读性欠佳,对患者健康素养要求较高。例如,ChatGPT 生成的患者教育材料阅读难度较大。未来应改进 LLMs 开发,如设计定制化用户界面或采用语言简化技术,提高信息的可及性。
目前缺乏标准化工具和基准来评估 LLMs 在甲状腺疾病管理中的效果,难以客观比较不同研究结果。为此,应制定专门针对甲状腺相关任务的评估框架,关注问答相关性、分诊决策一致性、结节特征描述准确性等关键指标,并制定初步评分标准,使用真实患者数据进行严格测试。
结论
将 LLMs 整合到甲状腺疾病的管理和诊断中前景广阔,有望改善患者预后、优化医疗流程。但要实现临床应用,还需应对隐私伦理、信息更新、可读性和评估标准等挑战,这需要持续研究和多学科协作。
可先在受控环境中开展可行性和安全性评估,如对甲状腺癌门诊患者进行试点研究,评估 LLMs 对分诊效率、诊断支持和患者教育的影响。同时,人工智能开发者、内分泌学家和伦理学家应共同合作,完善 LLMs,确保其符合临床需求和伦理标准,推动 LLMs 在甲状腺健康管理中的广泛应用。