综述:人工智能与定性或混合方法在传染病研究中的交叉应用:一项范围综述

【字体: 时间:2025年09月21日 来源:Public Health 3.2

编辑推荐:

  本综述系统探讨了人工智能(AI)与定性或混合方法(MM)在传染病研究中的融合应用,涵盖AI辅助分析(如自然语言处理NLP、主题建模LDA)、人类-AI协同研究及工具开发验证三大方向。研究强调AI提升大数据处理效率的优势,同时指出人类监督对确保伦理公平、上下文准确性的不可替代性,并为全球多样化研究场景(尤其是中低收入国家)提供方法学建议。

  

引言

21世纪新发传染病的出现受多种因素驱动,包括森林砍伐、城市化、气候变异及社会动荡。全球合作者正积极投资创新策略以应对传染病威胁,其中人工智能(AI)和机器学习(ML)技术因其在诊断、风险评估、疫情预测和健康政策规划中的突破性应用而备受关注。然而,这些技术的伦理规范、数据隐私保护及技术可及性仍是待解决的关键问题。与此同时,社会科学研究通过定性或混合方法(MM)深入解析人类行为与健康相关的复杂动态,为传染病防控提供关键见解。尽管AI在健康领域的投资显著,但其与定性/MM方法的交叉应用仍缺乏系统探索。本研究通过范围综述,旨在描述AI/ML与定性/MM在传染病研究中的整合现状与方法学趋势。

方法

本研究遵循系统综述与Meta分析扩展范围综述(PRISMA-ScR)指南,检索PubMed、Scopus、Web of Science和Embase平台截至2024年2月12日的文献。纳入标准基于McCarthy(2007)的AI定义,即“使用计算机进行自动化决策以执行通常需要人类智能的任务”,并排除仅使用自动转录作为AI应用的研究。定性方法采纳Hancock等(2007)的定义,聚焦叙事、现象学、扎根理论、民族志等系统性研究;混合方法则参考Creswell和Clark(2017)的定义,强调定性定量数据的整合与解释。检索策略采用MeSH术语,涵盖AI相关词(如“机器学习”“自然语言处理”“神经网络”)及传染病相关词(如“疫情”“传染病”“全球健康安全”)。数据管理使用EndNote X9去重,并通过Excel图表分析出版年份、健康主题、地域、方法学等要素。

结果

初检获得1342条记录,去重后筛选1173篇,最终29篇符合纳入标准。其中86%(25篇)发表于2021年及之后,21篇聚焦COVID-19疫情,其余涉及HIV、mpox、Zika、登革热等疾病。地域分布上,52%(15篇)为多国研究,主要源于社交媒体数据的全球性特征;13篇限定单一国家,包括美国(4篇)、中国(2篇)及孟加拉国、匈牙利等国。

定性方法与混合方法

34%(10篇)研究符合混合方法定义,其余66%(19篇)为定性研究(以主题分析为主)。59%(17篇)研究分析社交媒体数据,其中Twitter(10篇)和Reddit(4篇)为主平台;17%(5篇)为实施科学研究(干预试点或工具开发);其余涵盖医患通信、网站用户数据、文献综述等。

人工智能与机器学习方法

AI/ML技术分为五类:

  1. 1.

    传统机器学习与统计方法(如逻辑回归、支持向量机、随机森林),用于分类与预测任务;

  2. 2.

    强化学习(RL),动态优化干预策略;

  3. 3.

    概率模型与贝叶斯网络,整合专家知识与观测数据进行推理;

  4. 4.

    自然语言处理(NLP)技术,包括潜在狄利克雷分配(LDA)主题建模、情感分析、命名实体识别等,处理社交媒体等非结构化文本;

  5. 5.

    深度学习与大语言模型(LLMs),如卷积神经网络(CNN)分析音频数据,Doc2Vec提升文本上下文理解。

方法学交叉与应用

AI与定性/MM的整合分为三类:

  1. 1.

    互补分析:人类与AI结果比较整合(如Xue等2020年使用LDA与主题分析深度挖掘Twitter数据);

  2. 2.

    AI辅助主导研究:ML处理大规模数据后人类深化解读(如Al-Ahdal等2022年对比COVID-19与mpox discourse中的“自我化”与“他者化”叙事);

  3. 3.

    实施科学:开发AI工具后通过定性/MM验证(如Hightow-Weidman等2022年测试AI辅助HIV自我披露干预的实用性)。

核心发现

研究普遍强调AI提升数据处理效率与规模的优势,例如Towler等(2023)证实机器辅助主题分析(MATA)大幅节省时间且与人类分析结果高度一致。同时,人类监督被反复强调为确保语境准确性、伦理公平性的必要环节,如Barna等(2021)依赖人类注释者解读反犹主义阴谋论的 nuanced 内容。局限性包括平台偏差(如仅限英语社交媒体)、算法泛化能力不足及文化语境缺失问题。

讨论

AI与定性/MM的整合为传染病研究开辟了新路径,尤其在公共卫生紧急事件中实现大规模数据实时分析。然而,当前研究多停留在方法并行而非真正整合(定义为“迭代性双向反馈融合”)。未来趋势将聚焦生成式AI(GenAI)的应用,如CovLab项目使用LLM管道分析700万条COVID-19推文,提前7.63天预测病例,凸显其在实时监测中的潜力。

整合框架如质量源于设计(QbD)可结合AI预测模型与定性数据,加速疫苗研发;案例包括加州大学戴维斯分校与CEPI合作的VISTA病毒风险评估项目,整合专家洞察与AI数据挖掘支持公共卫生决策。

伦理与公平性挑战尤为突出:仅3项研究聚焦中低收入国家,且AI工具存在文化偏见(如LLM反映英语国家价值观)。建议未来研究强化本地数据所有权、基础设施公平性及算法透明度,并通过社区参与验证工具适用性。

结论

AI与定性/MM的协同显著拓展了传染病研究的广度与深度,但需框架确保方法整合的伦理性与可及性。人类 oversight 不可替代,尤其在捕捉细微社会动态方面。未来工作应注重跨文化验证、偏见 mitigation 及全球多样性包容,以推动这一融合范式在健康研究中的负责任应用。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号