综述:通过数据科学加速药物发现以应对非洲传染病问题
《Communications Medicine》:Addressing infectious diseases in Africa by accelerating drug discovery through data science
【字体:
大
中
小
】
时间:2025年11月26日
来源:Communications Medicine 6.3
编辑推荐:
本综述深入探讨了数据科学(DS)与人工智能(AI/ML)如何为非洲传染病药物发现带来革命性机遇。文章系统分析了非洲沉重的传染病负担(如疟疾、结核病、HIV及被忽视热带病NTDs)所带来的独特挑战,包括基础设施薄弱、人才流失(“brain drain”)及研发资金不足。核心论点在于,数据科学工具(如AI驱动的靶点识别、虚拟筛选、药物重定向drug repurposing)能够以相对较低的资源成本,赋能非洲本土科学家主导针对本地需求的药物研发。综述重点介绍了非洲本土的成功案例,如开普敦大学H3D中心发现的抗疟候选药物MMV390048,以及正在兴起的开放式科学(open-source)合作模式,论证了在可靠电力、数字基础设施和数据(“the three main ingredients”)支持下,数据科学有望帮助非洲实现技术“跨越式发展”(“leapfrogging”),缩小全球健康差距。
尽管非洲拥有丰富的自然资源和科学人才,但其传染病负担依然沉重得不成比例。世界卫生组织(WHO)非洲区域是唯一一个传染病致死人数超过非传染病的大陆。五大主要传染病“杀手”——急性呼吸道感染、腹泻、艾滋病毒/艾滋病、疟疾和结核病——共同构成了非洲传染病总负担的60%以上,每年导致超过240万人死亡。气候变化预计将使非洲大陆的气温在本世纪上升3°C至4°C,这可能通过扩大动物疾病媒介的宜居范围或增加病原体存活时间,增加未来大流行的可能性。
因此,减轻非洲的传染病负担需要采取多管齐下的策略。然而,许多疾病,如足菌肿、利什曼病或由耐药克雷伯菌引起的肺炎,仍然缺乏有效或可及的治疗方案。即使有治疗方案,药物分配和初级医疗保健仍面临巨大挑战,抗菌素耐药性(AMR)的出现更是雪上加霜。此外,非洲大陆丰富的遗传多样性常导致对药物的反应各异,而临床研究主要基于欧洲血统的队列,缺乏以非洲为中心的临床前筛选模型,因此将非洲数据纳入药物发现与开发至关重要。
非洲主导的药物发现研究主要关注具有本地相关性但缺乏充分或优化治疗方案的传染病。这些疾病由多种病原体引起,可分为被忽视的热带病(NTDs)和新发疾病。此外,疟疾、结核病和艾滋病毒等虽不严格属于上述类别,但仍是非洲主要的健康问题。
寄生虫病在非洲尤为普遍,治疗挑战巨大。疟疾、利什曼病和血吸虫病是三个相关例子。非洲每年承担全球超过2亿疟疾病例中的94%,相关的医疗成本每年超过120亿美元。利什曼病和血吸虫病的研发资源则严重受限。
细菌性疾病是另一个重要的研发领域,因为对现有抗菌药物的耐药性日益普遍,迫切需要新的化合物和治疗方案。结核病(TB)是由结核分枝杆菌(Mtb)引起的头号传染病杀手,是耐药菌株的一个令人担忧的例子。现有的治疗方案周期长,药物敏感性结核病长达6-9个月,耐药结核病则长达18-24个月,且常伴有难以忍受的副作用。沙门氏菌病是另一种毁灭性的人畜共患感染,每年在非洲导致近5万人死亡。ESKAPE病原体则是一组高传染性和多重耐药细菌,已被世卫组织列为需要紧急开发新型治疗药物的优先目标。
药物发现本身是一项高风险、高成本、耗时长的事业,从I期临床试验到获得监管批准的成功率仅约10%,平均总成本估计高达16亿美元。在非洲,这一挑战更为严峻:大学实验室设备简陋、运输服务有限、电力供应不稳定、互联网连接不可靠。薄弱的基础设施和支持导致高技能人才流失(“brain drain”)。非洲的科学产出占全球份额不足1%,其研发投入仅占国内生产总值(GDP)的0.5%,远低于世界平均水平(1.8%)。因此,药物发现努力严重依赖国际资助机构,影响了本地的主导权。
近年来,在人工智能(AI)飞速发展的推动下,数据科学已成为生物医学研究的重要组成部分。可以说,非洲可能是从这些进步中受益最多的地区,为其公民提供了通过技术“跨越”缩小与全球北方富裕国家差距的可能性。
数据科学方法,特别是AI/ML,有望在多个方面加速药物发现流程:识别和验证新药靶点、小分子设计与优化、以及评估治疗药物的安全性。在非洲背景下,这种潜力尤为显著:(i)对于(被忽视的)病原体,已知的治疗靶点严重缺乏;(ii)设计新药所需的密集实验和高通量在当地难以实现;(iii)非洲人群在临床试验中的代表性不足,增加了治疗风险。
非洲药物发现最显著的成就之一来自南非开普敦大学的整体药物发现与开发(H3D)中心。该中心与疟疾药品事业会(MMV)合作,领导了一项国际研究努力,产生了首个完全在非洲内部发现并推进至临床开发阶段的小分子候选药物MMV390048。该候选药物是首个进入临床试验的疟原虫激酶抑制剂。
2018年,非洲科学院通过其“重大挑战”计划与H3D中心、MMV和盖茨基金会发起合作,旨在加强整个非洲大陆的药物发现基础,由此产生了“重大挑战非洲药物发现”计划。2023年,盖茨基金会和LifeArc共同投资720万美元,用于支持新成立的“重大挑战非洲药物发现加速器(GC ADDA)”网络中的选定项目。加纳大学与诺古奇医学研究所合作在西非启动了一个药物发现中心,其初始优先重点是疟疾药物发现。喀麦隆的布埃亚大学药物发现中心正在研究从天然产物来源中寻找抗HIV和SARS-CoV-2的潜在抗病毒化合物。
传统药物发现始于通过表型或基于靶点的高通量筛选数千甚至数百万种化合物来识别“苗头”化合物。AI和数据科学有望加速这一传统流程。一个代表性的例子是H3D中心与Ersilia合作在南非实施的第一个端到端AI/ML虚拟筛选级联,用于疟疾和结核病。
然而,AI在非洲的采用可能具有挑战性且速度缓慢。通常,现场缺乏计算技能来支持需要高级技术专业知识的AI工具的实施。此外,AI工具严重依赖足够数量和高质量的数据集,而这些数据集通常未向更广泛的科学界开放,用户友好的专有AI实现往往需要昂贵的许可证。
将AI/ML方法有效应用于药物发现高度依赖于充足且高质量的数据。大多数非洲实验室没有资金和基础设施进行高通量实验分析,必须依赖公共可用数据(如ChEMBL、PubChem)作为AI/ML模型训练的起点。这带来了数据整理和模型解释的挑战。然而,迁移学习(transfer learning)、少样本学习(few-shot learning)等先进AI/ML技术,以及大型语言模型(LLMs,如GPT),有望利用稀缺数据加速低资源环境下的研究。
对于大多数NTDs的病原体生物学,其研究很大程度上尚未探索,靶点识别仍然是一个挑战。AI驱动的蛋白质结构预测工具,如AlphaFold和ESMFold,使得对缺乏晶体学数据的蛋白质进行分子对接实验成为可能,这有助于识别新的治疗靶点。
在非洲建立生物医学研究数据科学中心面临挑战,许多国家仍面临不可靠的电力和互联网供应。然而,本地AI代理(local AI agents)的兴起和云计算服务的增长为弥合这一差距提供了途径。
开源模式(open-source paradigm),即实时共享数据、代码和结果,特别有利于促进非洲传染病研究数据科学的发展。开源药物发现利用集体贡献来寻找无专利药物,由开源疟疾(Open Source Malaria)联盟开创,并已扩展到其他疾病领域。当与使非专业研究人员能够使用这些工具的开源平台(如Ersilia Model Hub)相结合时,这种方法为非洲科学家形成协作网络创造了机会。
药物重定向(drug repurposing)是一种有吸引力的策略,旨在利用现有药物的数据来减少药物研发的时间和成本。数据科学工具可以自动化活性配体的识别,并对有前景的分子进行多靶点评分优先排序。
天然产物(natural products)仍然是新化合物的未开发来源,非洲拥有大量具有潜在药用价值的动植物。已经建立了多个天然产物数据库(如NANPDB, SANCDB),可作为虚拟筛选的初始数据源。数据科学和AI/ML技术可用于系统收集、整理和分析丰富的传统医学和土著知识,以基于传统用途识别有前景的靶点或化合物。
非洲人口丰富的基因组多样性为推进精准医疗(precision medicine)目标提供了机会。“非洲遗传与健康”(H3Africa)联盟等计划正在投资开发生物样本库和泛非洲生物信息学网络H3ABioNet。发展药物遗传学知识库以了解非洲遗传多样性与治疗结果之间的相互作用,依赖于数据科学方法。
在临床研究阶段,数据科学工具可通过协助试验设计、受试者招募、患者监测和临床终点分析,在临床研究流程的多个环节提供帮助。尽管非洲拥有全球17%的人口,但只有3%的临床试验在非洲进行。非洲联盟于2021年成立了非洲药品管理局(African Medicines Agency),以推动建立标准化法律和伦理框架。
虽然传染病仍然是非洲健康的重大负担,但数据科学工具的出现为加速该地区的药物发现开辟了新途径。机器学习算法、数据挖掘和计算模型为分析复杂生物数据、识别潜在药物靶点和加速药物开发提供了强大方法。整合基因组学、蛋白质组学和流行病学数据将有助于全面了解病原体和疾病进展,从而优先考虑针对非洲独特流行病学背景定制的候选药物。
利用这些数据科学资产需要研究人员、临床医生、公共卫生专家和数据科学家之间的协作努力。尽管存在基础设施限制和需要加强计算与数据科学能力等障碍,但克服这些挑战需要资助机构、学术机构和政策制定者的协同努力。偏见、安全性、模型可解释性和治理等风险和挑战也不应被忽视。
通过利用数据科学工具的力量,可以提高药物发现工作的效率和有效性,以改善整个非洲大陆的公共卫生成果。需要强调的是,提供可负担得起且可靠的电力、数字基础设施和数据的接入——辅以熟练的人力资源——是数据科学工具帮助实现跨越式发展并避免非洲与世界其他地区之间不平等加剧的基本要素。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号