综述:人工智能和数字健康技术在眼科药物发现与开发中的应用

【字体: 时间:2025年09月26日 来源:npj Digital Medicine 15.1

编辑推荐:

  本综述系统探讨了人工智能(AI)和数字健康技术如何变革眼科药物研发。文章详细分析了AI在靶点识别、计算机辅助药物设计(CADD)、ADMET(吸收、分布、代谢、排泄和毒性)模拟、生物标志物开发及临床试验优化等多环节的应用,强调其在加速新药开发、降低成本及推动精准医疗方面的巨大潜力,并指出当前标准化监管框架的缺失亟待解决。

  

发现阶段:靶点识别

许多眼部疾病与蛋白质错误折叠和调控异常有关,如年龄相关性黄斑变性(AMD)、白内障、角膜营养不良和青光眼。理解这些蛋白质的三维结构对揭示其功能、作用机制及在疾病中的角色至关重要。传统方法如X射线晶体学和核磁共振波谱学成本高、耗时长。AI的出现改变了这一局面,其中AlphaFold系列算法通过卷积神经网络(CNN)和Transformer架构,能基于氨基酸序列精确预测蛋白质3D结构。AlphaFold3进一步扩展了预测能力,涵盖DNA、RNA及其与小分子的相互作用,为核酸疗法在眼科的应用开辟了新途径。
AI驱动的多组学分析也已成为靶点识别的重要策略。例如,PandaOmics平台整合基因表达、蛋白质组学和文本知识图谱,系统识别和排序潜在药物靶点。类似方法还被用于非传统生物数据集的分析,如利用多任务深度学习框架分析灭绝生物蛋白质组(“灭绝组”),发现具有治疗潜力的新型抗菌肽。这些计算引导的策略有望转化到眼部感染治疗及应对抗菌素耐药性这一全球健康威胁中。

计算机辅助药物设计

在确定有前景的靶点后,下一步是模拟药物相互作用并优化候选化合物。计算机辅助药物设计(CADD)主要包括基于结构的药物设计(SBDD)和基于配体的药物设计(LBDD)。SBDD利用生物靶点的三维结构,通过分子对接预测小分子的最佳结合取向和亲和力,并通过分子动力学(MD)模拟随时间建模蛋白质-配体相互作用,考虑灵活性和构象变化。LBDD则聚焦于已知活性化合物,采用定量构效关系(QSAR)建模,利用统计和机器学习方法根据分子特征预测药效。
AI驱动的对接方法,如Deep Docking,可快速筛选数百万潜在药物分子,预测其与靶点(如血管内皮生长因子VEGF)的结合亲和力,显著加速早期发现进程。MD模拟则在原子水平上帮助理解药物在动态生物环境(如眼房水)中的行为,对需要持续疗效的复杂眼病如青光眼和AMD尤为重要。QSAR模型则通过分子描述符预测药物-靶点相互作用,促进合理药物设计和先导化合物优化。生成式AI(GenAI)模型如SyntheMol能设计结构多样的新型肽类 therapeutics,而深度生成模型与高通量MD模拟结合,可大幅加速抗菌药物发现。
可解释人工智能(XAI)通过提供透明度和可解释性,在分子发现中发挥关键作用。特征归因方法如SHAP和LIME有助于识别关键的分子靶点相互作用,优化候选药物并减少黑盒模型的偏差。SmartCADD平台结合AI和量子力学原理进行虚拟筛选,提高了对接分数和配体结合亲和力预测的可解释性。

体外ADMET模拟

临床前阶段通常需进行大量实验和模拟以理解剂量反应和ADMET特性。传统动物模型存在伦理问题、种间外推困难和高失败率等挑战。类器官和器官芯片(OoC)技术作为有前景的替代方案,能模拟真实器官的结构和功能,提供更生理相关的人类系统以研究药物效应和毒性。
多种OoC模型已被提出用于研究视网膜和眼表。视网膜芯片模型整合人多能干细胞(iPSC)衍生的视网膜类器官(ROs)与血管样灌注,首次重现了成熟光感受器-RPE相互作用,对视网膜毒性建模和药物筛选至关重要。Wet-AMD芯片模拟外层血视网膜屏障,使研究人员能在生理相关环境中研究脉络膜新生血管形成。仿生人工眼模型成功重建了具有眨眼和泪膜动力学的眼表,实现了干眼病的疾病建模和高通量药物筛选。
AI与OoC的集成可显著增强现有技术潜力。深度学习模型处理来自各种传感器和成像的数据,自动化实验程序,提高重现性和通量。强化学习算法能自主优化微流体条件,动态调整流速和培养环境以增强细胞活力并模拟生理条件。AI还支持在3D类器官系统中进行表型为基础的高通量筛选,如AI驱动的干涉测量和基于机器学习的分割允许以单类器官分辨率动态、无标记量化治疗反应。
生理基于药代动力学(PBPK)建模是临床前研究中的另一有价值工具,用于预测药物在体内的ADMET。PBPK模型包含复杂的参数数学模型,模拟药物在不同生物隔室中的行为。准确获取生理和生化参数具有挑战性,而AI为模拟复杂眼部药代动力学过程提供了强大替代方案。例如,AI可通过整合药物理化特性和制剂数据建模角膜渗透性,利用成像和解剖数据集预测玻璃体和后段等隔室中的眼内分布,并通过识别相关酶途径和周转率预测眼部代谢。这些能力对优化给药策略、提高眼部生物利用度和开发下一代眼科治疗药物尤为重要。

开发阶段:用于反应监测的生物标志物

高通量测序和单细胞分析的显著进步增强了对药物分子影响的理解,为靶向治疗干预提供了坚实基础。AI促进了网络药理学的发展,研究影响药物反应的基因-基因和基因-环境相互作用的复杂动态网络,并推动了对药物-组学关联的研究,以解码药物与生物分子之间复杂的相互作用。
眼部因具有高度特异性的分子生物标志物(包括来自泪液、房水和玻璃体的蛋白质、DNA和代谢物)而提供独特机会。与全身生物标志物相比,眼部生物标志物局部富集,能更精确地理解眼部微环境。通过液体活检技术,可以微创方式检测和分析这些生物标志物,实时了解眼内分子景观,增强监测疾病进展和治疗反应的能力。
系统生物学方法涵盖各种“组学”生物标志物,包括表观基因组学、转录组学、蛋白质组学、脂质组学和代谢组学数据,从而提供更全面的病理生理学视角。研究人员为健康眼和病眼(如糖尿病视网膜病变)构建了转录组和蛋白质组网络,以更全面地理解这些疾病。借助AI,现在可以识别眼衰老的细胞机制,为新型治疗干预铺平道路。蛋白质组生物标志物也用于分析对地理萎缩(GA)治疗的反应。
在眼部诊断领域,成像技术比分子检测占据更重要的地位。彩色眼底照相、荧光素血管造影、光学相干断层扫描(OCT)和OCT血管成像等技术对详细眼部检查至关重要,而下一代研究模态利用可见光OCT、荧光和多光谱成像等新技术,可收集关于眼部(特别是视网膜)结构、功能、代谢和生理的更深入数据集。AI算法通过快速准确分析与疾病相关的关键特征(如血管系统和层厚度)来增强这些成像方法的能力。这种量化高度可靠和精确,减少了对人工评级的依赖,节省了时间,并加速了诊断过程。最近,无监督学习和视觉语言模型的兴起使AI能够在不依赖预定义标签或领域专业知识的情况下发现患病患者中的相似模式。这种能力将疾病形态学理解提升到更高水平,因为算法可以检测人类无法看到的细微变化。
同样,AI可用于量化治疗后的结构变化,并检测最初可能不可见的亚临床变化。因此,AI算法可以预测患者对治疗的反应,并根据从图像中提取的生物标志物确定治疗频率。这不仅有助于识别符合条件的治疗患者,还通过更个性化、有效的治疗方案最大化治疗成功率。生成式AI能够合成假设的治疗后图像,帮助临床医生和患者更直观地可视化治疗反应。此外,AI检测到的变化可作为试验期间的次要终点,为早期试验中的继续/终止决策提供支持,加速药物批准过程并使创新更快惠及患者。例如,在青光眼中,理解和保护神经结构与管理眼压(IOP)同样重要,AI可以分析视网膜神经纤维层厚度的变化,超越传统上对降低IOP的关注。更新的治疗途径,如视神经病变中的神经保护,可能完全依赖此类AI衍生的生物标志物作为潜在终点。

临床试验实施

临床试验中的关键挑战包括次优的患者队列选择、低效的招募技术以及在整个试验期间维持有效监测的困难。传统方法通常依赖电子健康记录(EHR)和手动流程来识别合格参与者,可能会遗漏关键患者或纳入不符合条件的患者。AI可以通过分析EHR、医学影像和基因组数据,以更高的准确性识别最适合特定试验的候选人。
AI还促进了去中心化临床试验的运作,允许参与者从不同地点参与研究,不再局限于少数中心试验点。这种方法显著扩大了参与者池,特别是对于主要影响老年人群的疾病如AMD和糖尿病视网膜病变,这些患者可能存在行动不便的问题。此外,AI通过联邦学习等技术实现跨中心协作,允许多个试验点实时共享见解和数据,而无需损害患者隐私,因为个体数据保留在本地。这有助于解决数据隐私问题,同时通过利用更大、更多样化的数据集提高试验结果的稳健性。
由AI支持的自适应试验设计进一步提高了临床试验的效率。在传统试验中,方案通常是静态和预先确定的,如果初始假设被证明无效,可能导致延迟或资源浪费。AI驱动的自适应试验根据中期结果动态调整方案,使研究人员能够将资源集中在最有希望的治疗途径上,同时更早停止效果较差的治疗。这些平台还通过自动化数据录入、不良事件报告和患者随访等任务来简化试验管理,提高试验的整体效率和准确性。这不仅加快了试验速度,还减少了与冗长和无效研究相关的财务负担。
AI生成的数字孪生整合到临床试验中具有革命性意义。数字孪生是由真实世界临床数据(包括生物特征、成像、基因组学和分子标志物)构建的AI驱动虚拟代表。数字孪生通过减少对大型对照组的依赖、实现自适应试验设计以及更准确地预测治疗反应,正在彻底改变临床试验效率。传统RCT需要大型对照组,参与者接受安慰剂或标准护理治疗。然而,AI驱动的数字孪生可以生成合成对照组——源自历史临床试验数据的安慰剂组的统计表示——从而减少这些组中所需的真实患者数量。这最大限度地减少了与拒绝给参与者治疗相关的伦理问题,并加速了试验时间表。此外,数字孪生支持预后协变量调整(PROCOVA),这是一种AI驱动的统计方法,通过增强统计功效来提高试验效率。该技术已被欧洲药品管理局(EMA)认可,并符合现有FDA指南,允许在保持严格科学标准的同时进行更小、更高效的试验。此外,AI驱动的数字孪生随着新生物标志物数据的更新而不断更新,完善个体治疗反应的预测。在眼科中,数字孪生可以整合多模态成像、分子生物标志物和AI驱动的风险模型,根据其疾病进展风险和治疗反应可能性对患者进行分层。
深度学习算法与智能手机技术和可穿戴设备的集成,通过使监测更易于访问和用户友好,进一步简化了试验过程。配备基于AI的诊断工具的智能手机可以方便患者自行进行定期眼部健康监测,实现整个试验期间的连续数据收集。这不仅使患者能够在医疗保健中发挥更积极的作用,还为制药公司和研究人员提供实时数据。更密切地监测药物性能的能力允许及时调整治疗方案,从而提高临床试验的整体有效性。

上市后药物重定位

药物开发确实是一个耗时且昂贵的过程。在这种情况下,将现有的、已证明安全的药物重新用于新的治疗用途提供了一个引人注目的替代方案。这种方法不仅节省时间、显著降低成本,而且由于这些药物的安全性已经得到充分了解,因此风险最小化。此外,药物重定位可以加快治疗方法的可用性,特别是在应对新的药物发现和批准可能太慢的紧急健康危机时。它还延长了药物的商业生命周期,为制药公司提供新市场,为患者提供更多治疗选择。
在当今大数据和广泛数据共享的时代,AI在药物重定位中的使用越来越可行和有价值。AI可以整合和分析来自全球数据集的不同数据类型,提供通过传统研究方法可能不明显的见解。这种技术方法正成为制药行业提高药物开发效率和应对新兴健康挑战战略的一个组成部分。
自然语言处理(NLP)和深度学习在通过从大量现有数据(包括已发表的研究、临床试验数据和EHR)中推断来识别重定位机会方面至关重要。多项研究证实了其在冠状动脉疾病、阿尔茨海默病和帕金森病等疾病中的可行性,这种能力在COVID-19大流行期间得到了最显著的展示。瑞德西韦(Remdesivir)是一种最初为埃博拉病毒设计的抗病毒药物,被深度学习模型识别为COVID-19的潜在治疗方法之一。随后的临床试验也证实了其益处,导致全球监管机构授予紧急使用授权。这一真实例子展示了AI如何利用大数据有效识别潜在的药物重定位候选者。最近,生成式AI(GenAI)的进步,特别是像ChatGPT这样的大型语言模型(LLM),将AI在药物重定位中的极限推向了新的高度。生成式AI擅长处理非结构化数据并识别非明显联系,使其成为药物发现和重定位中的宝贵工具。尽管最近才出现,研究人员已经应用生成式AI来识别阿尔茨海默病的潜在药物重定位候选者。虽然还没有眼部的具体应用,但生成式AI用于眼科研究和药物发现只是时间问题。
除了利用来自EHR的真实世界疗效数据外,重定位还可以由AI驱动的组学方法指导。最近的研究表明,将多组学与AI驱动的计算建模相结合可以增强药物发现和重新定位。例如,基于AI的组学分析已被应用于识别三阴性乳腺癌中细胞焦亡治疗的药物对,整合了转录组数据、药物数据库和生物因子调节的神经网络。类似的方法可以用于眼科,识别对眼部疾病有益处的全身药物。

局限性与未来方向

尽管AI在药物发现中具有巨大潜力,但它也有局限性。鉴于训练AI系统需要大量数据,数据隐私和安全问题已经出现。跨机构、国家或行业的数据共享通常会导致敏感健康数据的暴露风险。应遵守《通用数据保护条例》(GDPR)和《健康保险携带和责任法案》(HIPAA)等法规以保护患者机密和隐私。联邦学习是一种有前景的解决方案,它使原始数据保留在其来源处,从而最小化暴露风险。客户端在本地数据上训练本地机器学习模型,仅将更新的模型参数发送到中央服务器进行聚合。然后服务器将聚合后的参数分享回客户端进行进一步训练。这个过程重复直到模型达到所需精度。通过促进AI模型之间的协作,联邦学习可以在增强数据隐私的同时,有助于在药物发现中开发更准确的机器学习模型。
美国食品药品监督管理局(FDA)已率先尝试规范AI在药物发现中的应用,鉴于其对治疗和预后的影响。FDA已经审查了数百份涉及AI在药物开发中的监管提交。2024年3月,它引入了一个基于风险的监管框架,概述了四个重点领域:(1)促进合作以保障公共健康;(2)促进统一标准、指南、最佳实践和工具的制定;(3)推进支持创新的监管方法的开发;(4)支持与AI性能评估和监测相关的研究。在全球范围内,EMA和英国药品和保健品监管局(MHRA)正在制定用于药物发现中AI和机器学习的标准化协议。监管框架难以跟上AI的快速发展。当前的药物发现法规缺乏针对生成式AI和大型语言模型的条款,这些模型往往产生不可预测的输出和幻觉。这些法规应扩展到用于房水或玻璃体生物标志物分析的AI和生物信息学,以维护AI在药物开发中使用的伦理标准。目前,缺乏统一的国际指南。需要协调和全球努力,以制定更一致和统一的法规,用于AI在药物发现中的应用。此外,生命周期管理方法——监测上市后AI模型——可以改进实施,但仍然难以执行。
AI在药物发现中的作用引发了复杂的可专利性和知识产权问题。美国专利商标局允许对“任何新的和有用的过程”授予专利,但算法作为抽象程序可能不符合资格。2023年《患者资格恢复法案》排除了心理过程和数学公式的资格,使这一问题进一步复杂化。关于AI辅助或AI生成治疗药物的原创性问题已被提出。根据联邦巡回法院,发明人必须是自然人,因此AI算法不能成为指定发明人。第112条中的启用和书面描述要求一直是障碍,特别是当使用“机器学习”和“神经网络”的模糊描述而没有方法的详细信息时。为避免这些问题,说明书应旨在以可理解、完整、清晰和简洁的方式包含发明的书面描述。
透明度和可解释性对于监管批准和临床采用至关重要。AI模型缺乏透明度和可解释性,特别是黑盒系统,使在药物开发中采用和建立对AI的信任复杂化。可解释性是指AI以人类可理解的方式澄清其决策过程和偏见缓解方法的能力。这种透明度有助于在发生不良后果时确定责任。这种透明度在临床试验中尤其重要,监管机构必须理解AI驱动的预测以评估其有效性并确保患者安全。没有清晰的解释,AI生成的候选药物可能面临更多审查,延迟试验批准和监管接受。虽然法规仍不完善,但DECIDE-AI、SPIRIT-AI和CONSORT-AI等指南提供了结构化报告框架,以增强AI驱动临床研究中的问责制。然而,这些指南主要关注AI在疾病诊断中的应用,而不是药物开发。AI日益融入药物开发凸显了算法包容性和透明度的迫切需求。政策制定者必须尝试将这些指南转化为标准化法规,以保护患者免受相关风险。
AI主导的药物发现的质量和效率严重依赖于数据的可靠性、代表性和多样性。有限或不一致的训练数据可能通过错误表示药物的分子结构来损害模型性能。化学结构的微小改变可能显著影响结合亲和力、药代动力学和药效学,可能导致治疗无效或有毒。可以考虑几种解决方案来克服这些挑战。首先,具有标准化和全国代表性数据的中央生物标志物存储库可以最大限度地减少不一致并提高代表性。其次,迁移学习应用相关任务的知识,可以提高有限数据集的学习效率。第三,生成式AI模型,如生成对抗网络(GANs)和图卷积网络,促进了新喹啉支架分子的生成。这种方法可能对罕见眼病特别有吸引力,因为真实世界数据有限,合成增强可能有助于提高数据集多样性。然而,生成对抗网络也带来了一系列挑战,包括生成生物学上无关或有害化合物的风险、透明度的限制以及随后的监管接受度、放大的偏见和训练不稳定性。没有严格的验证,合成数据可能无意中强化现有偏见或产生误导性输出——特别是在生物学理解不完整的疾病领域。这些风险凸显了在将合成数据应用于罕见疾病研究时需要透明度、监督和谨慎解释。没有将AI生成的候选药物整合到已建立药物流水线中的标准化方法,监管接受度将仍然是一个重大障碍。
确保AI在药物开发中的公平和合乎道德的使用是另一个关键考虑因素。AI模型可能无意中延续偏见和歧视。例如,VisionFM是一个基础模型,支持多种AI应用,包括眼科诊断和生物标志物识别,它在 disproportionately 代表中国人群的数据集上进行了预训练。因此,它可能无法捕捉罕见疾病(如Leber遗传性视神经病变、Best病和Bietti结晶样营养不良)的异质性。如果这种偏见扩展到AI驱动的药物发现,可能导致对代表不足人群效果较差的疗法,最终扭曲临床试验结果并限制发现的普适性。此外,获取尖端AI工具和计算基础设施在不同地区之间仍然不均衡,影响低收入和中等收入国家(LMICs)最大,阻碍了它们参与AI驱动研究的能力。这加剧了医疗保健不平等,AI生成的治疗可能无法充分满足这些人群的健康需求。LMICs通常面临系统性障碍——如碎片化的卫生系统、有限的生物样本库访问和在基因组数据集中的代表不足——这进一步限制了它们在AI驱动的生物医学研究和创新中的参与。训练数据中的偏见也可能影响AI优化试验招募中的参与者选择,导致 skewed 人口统计表示和潜在混淆的结果。当前的AI辅助招募策略在基于资格标准简化患者匹配方面显示出 promise,但它们通常依赖于可能 underrepresent 某些人群的EHR。类似地,数字孪生必须使用高质量、有代表性的数据集构建。如果建立在有偏见或不完整的数据上,数字孪生可能产生误导性预测,可能导致错误的试验设计或无效的候选药物。数据增强通过生成合成数据并增强数据多样性,提供了一个潜在的解决方案,从而减轻AI驱动的药物发现中的歧视。然而,数据增强 alone 不能完全解决偏见;需要强大的验证协议和持续监测以确保临床试验的公平性和准确性。
随着AI日益塑造药物发现,监管更新必须解决这些新兴应用。鉴于AI的变革性影响,行业利益相关者必须加强FDA监督之外的质量评估。确保AI驱动药物开发中的公平性、建立专利框架和促进透明度将对广泛采用至关重要。
AI具有改变药物发现和开发的巨大潜力,在分子药物靶点识别、临床前和临床测试以及药物重定位方面提供 groundbreaking 机会。然而,该技术固有的伦理和社会复杂性需要谨慎和深思熟虑的策略以充分利用其益处。随着AI的不断发展,必须随时了解新兴发展并实施负责任的做法,以确保所有患者公平受益。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号