《Aquaculture》:Machine learning-driven discovery of quinoline derivatives against
Ichthyophthirius multifiliis
编辑推荐:
本研究建立了一种基于机器学习的抗寄生虫药物筛选流程,通过体外活性测试和定量结构活性关系(QSAR)建模,发现卤代8-羟基喹啉类化合物(如化合物13)对 Ichthyophthirius multifiliis 的滋养体和包囊体具有显著抑制作用,并成功筛选出四个新型候选化合物,验证了模型的有效性及在扩大化学空间中的潜力。
Jietao Liu|Shenye Qu|Yihang Liu|Yunlong Qin|Jiacheng Qin|Xiaofa Luan|Qing Yu|Gaoxue Wang|Fei Ling
中国海南省三亚市西北农林科技大学海南研究院,邮编572024
摘要
Ichthyophthirius multifiliis是一种引起淡水养殖中白点病的纤毛虫病原体,对全球经济造成了巨大损失。本研究建立了一种基于机器学习(ML)的工作流程,用于高效发现新的抗寄生虫剂。评估了24种喹啉衍生物对寄生虫不同生命周期阶段的抗寄生虫效果。研究发现卤代8-羟基喹啉类化合物具有最强的抗寄生虫活性,其中5,7-二氯-2-甲基-8-喹啉醇(化合物13)表现最为突出,其对寄生虫无性生殖阶段的EC??值分别为0.271 mg/L和对有性生殖阶段的EC??值为0.184 mg/L。我们构建了一个预测性的定量结构-活性关系(QSAR)框架,随机森林(RF)模型在预测效果上表现优异(测试集R2分别为0.761和0.703)。随后,利用该模型筛选了一个虚拟化合物库,发现了四种具有潜在活性的新喹啉化合物。实验验证证实了这些化合物的高抗寄生虫活性,证明了该模型在训练集化学空间之外识别新活性结构的能力。分子描述符的分析表明,卤素介导的电子效应、分子拓扑对称性和平衡的疏水性是决定抗寄生虫活性的关键因素。这项工作不仅发现了控制白点病的高潜力候选药物,还为水产养殖中的抗寄生虫药物发现提供了一种可扩展的、基于机器学习的加速方法。
引言
Ichthyophthirius multifiliis在其生命周期中经历三个阶段:感染性的无性生殖阶段(theront)、寄生性的营养阶段(trophont)和有性生殖阶段(tomont)(Ling等人,2013年)。有性生殖阶段可进一步分为未囊化和囊化两种形式。成熟的营养阶段个体离开宿主后成为未囊化的有性生殖阶段个体,在水中附着于基质并分泌囊壁,最终形成囊化的有性生殖阶段个体。在这些囊内,有性生殖阶段个体迅速分裂成数百或数千个后代。无性生殖阶段个体从囊中释放出来,感染新的宿主,从而延续生命周期(Huang等人,2022年;Liu等人,2017年)。I. multifiliis会感染宿主的皮肤、眼睛和鳃,导致鱼类患上“白点病”,给全球淡水渔业带来重大经济损失(J?rgensen,2017年;Wahli和Meier,1987年)。
喹啉类化合物因其生物活性和结构多样性而受到关注。它们具有抗肿瘤、抗疟疾、抗菌和抗病毒等多种药理作用(Kaur等人,2010年;Musiol,2013年;Gao等人,2017年)。此外,喹啉环系统的取代和结构衍生物化进一步增强了其广泛的生物和生化活性(Solomon和Lee,2011年)。羟基喹啉的化学结构使其具备类似药物的特性。
机器学习(ML)作为人工智能的核心组成部分,采用了多种算法(如线性回归、支持向量机和随机森林),在计算毒理学和化学信息学中的预测建模中得到了广泛应用(Sahu等人,2022年;Nayarisseri等人,2021年;Lu等人,2018年)。在传统的ML方法中,分子通常使用预定义的分子描述符(包括物理化学性质和拓扑指数)进行表示,然后通过训练算法来建立这些特征与生物效应之间的关系(Guntner等人,2021年;Thompson等人,2014年)。
为克服这些限制,人们开发了专门的算法来处理分子数据的复杂性。偏最小二乘法(PLS)通过将高维数据投影到与药理反应协方差最大的潜在变量上来解决描述符相关性问题。这种方法在QSAR建模中显示出显著效果,其中变量重要性投影(VIP)得分有助于识别影响药物吸收特性的关键物理化学因素(Eriksson等人,2012年;Nishikiori等人,2022年;Abdolmaleki等人,2015年)。支持向量机(SVM)利用基于核的非线性映射来捕捉电子描述符(如HOMO/LUMO能量)与生物活性之间的复杂关系,尤其在预测具有复杂空间电子效应的变构调节剂的IC??值方面表现出色(Jiang等人,2022年;ElFar等人,2022年)。随机森林(RF)能够自动从大量候选化合物中识别出有信息量的特征(包括非直观的拓扑指数),同时有效应对高通量筛选数据中的噪声。其在多药理学研究中的应用揭示了分子形状描述符与多靶点活性之间的先前未被发现的关联,从而挑战了传统的单一描述符方法(Nayarisseri等人,2022年;Rikken等人,2023年)。
本研究采用体外筛选和计算建模相结合的综合方法,系统评估了24种喹啉衍生物对I. multifiliis的抗寄生虫效果(图1)。研究旨在实现三个主要目标:首先,通过全面评估这些化合物对感染性无性生殖阶段和有性生殖阶段的活性来筛选出候选药物;其次,利用三种不同的ML算法(偏最小二乘法(PLS)、支持向量机(SVM)和随机森林(RF)开发QSAR模型,以准确预测EC??值;最后,通过系统解析分子描述符阐明控制抗寄生虫活性的关键结构特征。这种数据驱动的框架加速了新型白点病治疗药物的发现。
部分内容摘录
鱼类、寄生虫和化学试剂
实验用金鱼(平均体重4.0±0.8克;体长4–6厘米)来自中国重庆,将其置于300升的水族箱中,在22.0±1.0°C、pH 7.0±0.3、溶解氧浓度8.0±1.0 mg/L的条件下饲养两周。
Ichthyophthirius multifiliis是从自然感染的鱼中分离出来的,并通过感染金鱼进行繁殖(Ling等人,2009年)。为了促进寄生虫的传播,将健康金鱼放入受感染的鱼群中。
体外抗I. multifiliis效果检测
通过测定喹啉及其衍生物对Ichthyophthirius multifiliis无性生殖阶段和有性生殖阶段的半最大有效浓度(EC??)值,评估了它们的抗寄生虫效果。结果如表1所示,不同化合物之间的抗寄生虫活性存在显著差异,这突显了结构特征对其效果的重要性。
在测试的化合物中,2,8-双(三氟甲基)-4-喹啉醇(化合物5)表现出了较强的抗寄生虫活性。
讨论
Ichthyophthirius multifiliis是全球水产养殖中广泛存在且难以控制的外寄生虫(Ling等人,2009年)。传统上,控制这种寄生虫主要依靠化学方法,如孔雀石绿和甲醛。我们的实验数据证实了孔雀石绿的高体外活性(EC??:0.033 mg/L),这与实验室报告一致(Maceda-Veiga和Cable,2014年)。然而,在商业水产养殖中应用孔雀石绿时,控制I. multifiliis的效果并不一致。
结论
本研究提出了一个基于机器学习的平台,用于发现针对Ichthyophthirius multifiliis的新喹啉类化合物。我们对24种衍生物的评估表明,卤代8-羟基喹啉类化合物具有很强的抗寄生虫活性,其中5,7-二氯-2-甲基-8-喹啉醇(化合物13)表现出最佳效果。在开发的多种QSAR模型中,随机森林(RF)算法最为可靠。我们通过实际应用验证了该模型的实用性。
CRediT作者贡献声明
Jietao Liu:撰写原始稿件。Shenye Qu:项目管理和数据整理。Yihang Liu:方法论设计和概念构建。Yunlong Qin:方法论研究。Jiacheng Qin:方法论研究。Xiaofa Luan:方法论研究。Qing Yu:方法论研究。Gaoxue Wang:项目管理。Fei Ling:项目管理。
利益冲突声明
作者声明与本研究无关的任何商业或关联利益不存在冲突。
致谢
本研究得到了国家重点研发计划(项目编号:2023YFD2400703)和广西自然科学基金(项目编号:2021GXNSFDA196008)的支持。