
-
生物通官微
陪你抓住生命科技
跳动的脉搏
分子图交叉算子创新研究:基于切割-连接机制的虚拟药物筛选新策略
【字体: 大 中 小 】 时间:2025年06月18日 来源:Journal of Cheminformatics 7.1
编辑推荐:
本研究针对化学空间探索中传统遗传算法(GA)的局限性,创新性地提出了一类基于图论的切割-连接(cut-and-join)交叉算子。研究人员通过系统定义保持顶点度(degree-preserving)和键序(natural join)的图重组操作,实现了分子图的高效重组,在保持化学合理性的同时显著提升结构多样性。该工作发表于《Journal of Cheminformatics》,其开发的REvoLd系统在四种靶蛋白配体筛选中成功发现超越已知最佳结合剂的候选分子,为计算机辅助药物设计(CADD)提供了数学严谨且实用的新工具。
在计算机辅助药物设计领域,化学空间的探索始终面临"组合爆炸"的挑战。传统遗传算法虽然广泛应用于分子优化,但其基于字符串的交叉操作难以保持分子图的结构合理性,导致产生大量化学无效的候选分子。更棘手的是,现有方法往往需要依赖预先定义的片段库或反应规则,严重限制了新颖分子的发现空间。
针对这些瓶颈,来自德国莱比锡大学、马克斯·普朗克研究所等机构的研究团队另辟蹊径,将分子结构视为带标签的图(graph),创新性地开发了基于切割-连接机制的图交叉算子。这项发表于《Journal of Cheminformatics》的研究,通过数学上严格的图论方法重新定义了分子重组过程,不仅解决了化学合理性与结构多样性的平衡难题,更揭示了分子图空间探索的深层规律。
研究团队主要运用了三大关键技术:(1)基于最小割(minimal cut)的分子图分割算法,可枚举所有可能的2-切割(2-cut)方案;(2)整数线性规划(ILP)实现键序保持的自然连接(natural join),确保重组分子符合化学键价规则;(3)将平面图(planar graph)理论应用于结构筛选,自动排除空间冲突的分子构型。研究使用的测试数据集包括USPTO-10K专利分子库,并通过ETKG算法进行三维构象验证。
方法创新:图论框架下的分子重组
研究首先建立了严格的数学框架,将分子定义为带顶点标签(原子类型)和边标签(键序)的多重图(multigraph)。通过证明任何有限度约束的连通图都可通过有限次切割-连接操作从基础构件生成,确立了该方法的完备性。特别地,定理3表明仅需规模为|D|+3的种群(D为原子价集合),就能在2|E(G)|步内构建任意目标分子。
化学合理性的数学保障
研究提出的自然连接操作通过ILP精确控制键序分布,如图4所示,当切割两个三角形分子时,系统会严格保持每个顶点的键数(degree-preserving)和键型分布(natural join)。定理1进一步证明,对于平面分子图,总能找到保持平面性的重组方案,这解释了为何83.6%的生成分子能通过三维构象验证。
实际应用验证
在REvoLd系统的整合测试中,该方法展现出惊人效果:从292个酪氨酸酶(Tyrosyl)抑制剂的初始集出发,生成了4.81亿候选分子,最终筛选出的最佳配体结合评分超越已知化合物。如图15所示,针对食欲素受体1(Orexin 1)设计的分子不仅结合性能优异,其结构更接近天然肽类配体,突破了传统组合化学库的尺寸限制。
讨论与展望
这项研究的重要意义在于:首次建立了分子图空间探索的严格数学理论,证明切割-连接操作具有"遍历化学空间"的能力(ergodic exploration)。通过将化学直觉转化为图论约束(如定理4证明的搜索空间强连通性),实现了算法创新与化学合理性的完美结合。
研究还揭示了该方法与代谢反应的深层联系——切割-连接操作本质上模拟了自然界中模块化重组的进化策略。未来工作可进一步整合立体化学描述,或将Natta投影表示的构型信息纳入图操作框架。该成果不仅为CADD提供了新工具,更为"化学空间拓扑学"这一新兴领域奠定了重要基石。
生物通微信公众号
知名企业招聘