面向中东地区的双语传染病监测大模型InfectA-Chat:基于AceGPT-7B的优化与性能分析

【字体: 时间:2025年06月06日 来源:JMIR Medical Informatics 3.1

编辑推荐:

  研究人员针对中东地区传染病监测中存在的语言壁垒问题,开发了阿拉伯语-英语双语大语言模型InfectA-Chat。该研究通过指令微调AceGPT-7B模型,结合55,400条领域特异性指令数据,采用低秩自适应(LoRA)和检索增强生成(RAG)技术,使模型在传染病问答任务中超越AceGPT-13B-Chat等阿拉伯语模型48.61%,并与GPT-4性能接近。成果发表于《JMIR Medical Informatics》,为中东地区公共卫生监测提供了实时、精准的多语言解决方案。

  

在全球公共卫生领域,传染病监测一直面临语言壁垒的严峻挑战。世界卫生组织(WHO)等机构发布的监测数据多以英语为主,而中东地区作为中东呼吸综合征冠状病毒(MERS-CoV)等疾病的高发区,阿拉伯语人群获取实时信息的渠道受限。2020年新冠疫情爆发期间,全球新增787,813例霍乱病例,其中中东和北非(MENA)地区受影响尤为严重。这种语言与信息的断层,使得非英语地区的公共卫生响应效率大打折扣。

为解决这一痛点,来自韩国科学技术信息研究院的研究团队开发了InfectA-Chat——首个专注于阿拉伯语传染病监测的大语言模型(LLM)。这项发表于《JMIR Medical Informatics》的研究,基于AceGPT-7B架构进行深度优化,通过创新的技术路线实现了阿拉伯语-英语双语传染病信息的精准交互。研究团队从美国传染病研究与政策中心(CIDRAP)爬取2770篇英文文献,经GPT-3.5-Turbo和Gensim双重摘要处理后,生成包含55,400条问答对的指令数据集。采用低秩自适应(LoRA)技术对AceGPT-7B进行参数高效微调,显著降低了计算成本。最终模型通过检索增强生成(RAG)管道实现数据实时更新,无需重复训练即可整合最新疫情信息。

关键技术方法包括:1) 基于CIDRAP平台构建阿拉伯语-英语双语指令数据集;2) 采用LoRA对AceGPT-7B的注意力机制模块进行参数高效微调;3) 设计GPT-4驱动的多阶段评估体系;4) 部署RAG管道实现动态数据更新。

性能比较分析显示,InfectA-Chat在传染病领域的表现远超同类阿拉伯语模型。与AceGPT-7B-Chat相比性能提升43.52%,对AceGPT-13B-Chat和Jais-13B-Chat的优势分别达48.61%和23.78%。在STEM和人文领域的跨域测试中,其准确率保持在45.71%,验证了模型的泛化能力。

RAG管道验证实验证实,该技术可有效解决模型数据滞后问题。使用2024年3-6月的新数据测试时,InfectA-Chat准确率达90.08%,远超GPT-3.5(0.8%)和GPT-4(0.16%)。调整top-k参数至5时,信息检索准确率提升至80.05%,证明扩大检索范围能显著增强事实准确性。

这项研究的突破性在于:首次实现阿拉伯语传染病监测的实时交互,通过LoRA技术将训练成本降低至4块NVIDIA A100显卡即可完成;创新的RAG管道设计打破传统微调模式,使模型能动态整合WHO等机构的最新疫情通报;在MMLU基准测试中,模型展现出超越LLaMA-13B等通用模型的领域适应性。

尽管存在计算资源受限和少量幻觉现象,InfectA-Chat仍为中东地区公共卫生监测树立了新标准。未来通过扩大训练数据和优化RAG管道,该模型有望成为全球传染病防控的多语言智能中枢。这项技术不仅适用于MERS-CoV等地域性传染病,其方法论对解决其他非英语地区的医疗信息不平等问题具有重要借鉴意义。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号