《Nature Microbiology》:Identification of chemical features for improved outer membrane permeation in mycobacteria using machine learning
编辑推荐:
化合物渗透并累积于细菌细胞的能力是决定抗生素疗效的关键因素。针对人类病原体结核分枝杆菌(Mycobacterium tuberculosis, Mtb)的更高效治疗药物需求迫切,然而其细胞包膜(包括分枝杆菌外膜)构成了药物进入的重要屏障,且调控渗
化合物渗透并累积于细菌细胞的能力是决定抗生素疗效的关键因素。针对人类病原体结核分枝杆菌(Mycobacterium tuberculosis, Mtb)的更高效治疗药物需求迫切,然而其细胞包膜(包括分枝杆菌外膜)构成了药物进入的重要屏障,且调控渗透的化学特征尚不清楚。研究人员利用基于生物正交点击化学的PAC-MAN(Peptidoglycan Accessibility Click-Mediated AssessmeNt,肽聚糖可及性点击介导评估)实验,在Mtb和模式生物耻垢分枝杆菌(M. smegmatis, Msm)中分析了1,572种叠氮标记化合物的分枝菌膜渗透性。化学信息学和机器学习鉴定了与分枝菌膜渗透相关的化学特征,这些特征在三个分子系列中具有预测价值。分枝菌膜渗透的化学预测因子包括含氮芳香骨架(如吲哚),在某些情况下与增强的抗Mtb活性相关。研究数据为改善分枝菌膜渗透及靶向Mtb抗生素的全细胞活性提供了理性框架。
结核病(Tuberculosis, TB)由结核分枝杆菌(
Mycobacterium tuberculosis, Mtb)引起,每年夺走超过一百万人的生命。抗生素治疗周期长、方案复杂且疗效不一。开发更好的抗结核药物和方案是迫切的公共卫生优先事项。
确保药物候选物在Mtb细胞内有效累积是开发或改善抗结核药物面临的突出挑战。为获得全细胞活性,分子通常必须克服包括细胞膜、外排泵和代谢在内的多重障碍,以所需的动力学和浓度累积以有效作用于靶点。然而,克服单个累积障碍的化学特征各不相同,有时甚至相互矛盾。此外,即使在细菌内部,不同物种和属之间的分子累积也存在差异。这些发现表明,Mtb中的分子累积可能是一个复杂的表型。
识别促进Mtb细胞累积的化学特征可能加速新结核病治疗方案的开发。一种应对累积复杂性的方法是关注使分子克服单一障碍的化学特征。长期以来,人们认为Mtb及相关病原体的固有耐药性部分源于分枝菌外膜的不渗透性。这一假设基于膜扰动使分枝杆菌对特定抗菌药物敏感的实验。然而,活性是摄取的间接替代指标,细胞包膜扰动带来的附带代谢功能障碍也可能影响药物敏感性。为澄清这一问题,研究人员近期同时检测了活性与PAC-MAN实验(一种独立于活性、测量叠氮修饰分子到达周质能力的实验),证明分枝菌膜是一种选择性渗透屏障,差异性限制药物进入。然而, underlying 分枝菌膜选择性的化学特征此前未知。
本研究通过PAC-MAN筛选超过1,500种叠氮标记小分子,并运用化学信息学和机器学习技术,发现了与分枝菌膜渗透性相关的化学特征。从头化学合成和分枝菌膜渗透性测试三个分子系列证实,化学相关性具有预测价值。芳香氮杂环(特别是吲哚)等化学预测因子在不同分子环境中与抗Mtb活性相关。
研究人员首先采用PAC-MAN高通量筛选分枝菌膜渗透性,使用三种来源的1,572种叠氮测试分子:通过氟磺酰叠氮化学从相应伯胺合成的1,152种、购自Enamine的380种以及购自其他商业来源的40种。为控制叠氮测试分子对DBCO(二苯并环辛炔)的内在反应性,还筛选了DBCO功能化聚苯乙烯珠。通过log线性回归分析计算观察与预期荧光之间的竞争差异,得到标准化残差值与呼喊菌膜渗透性成反比。
化学信息学分析发现,含氮芳香骨架(如吲哚、咪唑、吡唑)与分枝菌膜渗透正相关,而环戊烷、环己烷等骨架负相关。值得注意的是,物理化学性质与分枝菌膜渗透的相关性具有骨架依赖性:整体分析时相关性微弱,但按骨架分组后相关性显著。例如,拓扑极性表面积(TPSA,Topological Polar Surface Area)在含吲唑分子中强负相关于渗透性,而脂水分配系数(logP,Crippen logP)在含萘分子中强负相关。这与普遍将亲脂性视为抗结核药物有利属性的认知形成对比,且此前与革兰氏阴性菌累积相关的物理化学性质与分枝菌膜渗透性无关。
基于这些发现,研究人员构建了名为Mycobacterial Permeability neural Network(MycoPermeNet)的机器学习模型。该模型以简化分子线性输入规范(SMILES,Simplified Molecular Input Line Entry System)字符串和Mtb筛查数据为输入,采用两阶段深度学习过程预测分枝菌膜渗透性。模型在80%训练数据、10%验证数据和10%测试数据(基于Bemis-Murcko骨架分组)上表现良好,训练集R
2为0.66,测试集R
2为0.51,Spearman秩相关系数(ρ)分别达0.81和0.74。模型预测的20种最渗透骨架中,吲哚、咪唑和吡唑类骨架占主导,与化学信息学分析结果高度一致。
为增强模型可解释性,研究人员还构建了基于XGBoost算法的替代模型,并结合SHapley Additive exPlanations(SHAP)方法解释特征重要性。结果显示,TPSA和logP是驱动预测的两个最重要物理化学性质,但其调控方向因骨架而异。该分析既能从整体层面量化各物理化学性质的贡献,也能针对单个化合物预测各性质对其渗透性的具体影响。
为验证化学特征与分枝菌膜渗透性的因果关系,研究人员进行了三个分子系列的设计、合成和测试。第一系列基于此前报道的抗结核候选物JSF-2985,将2位伯酰胺的N-H替换为与渗透性正相关(咪唑、吡唑、吡咯烷)或负相关(环戊烷)的五元环。 docking研究表明酰胺基团不参与靶点结合,位于溶剂暴露区。PAC-MAN实验结果与化学信息学和MycoPermeNet预测完全一致:含咪唑、吡唑和吡咯烷的衍生物(Δlog
10CC
50=1.1—1.3)比较环戊烷衍生物(Δlog
10CC
50=2)具有更好的分枝菌膜渗透性。
第二系列为五肽(Phe-Lys-Phe-Lys-Phe),系统性地用色氨酸替代苯丙氨酸(W肽)。色氨酸侧链含吲哚(强正相关)、苯丙氨酸含苯环(弱负相关),两者结构相似。实验结果与预测一致:色氨酸取代增强了Mtb和Msm中的分枝菌膜渗透,液相色谱-串联质谱(LC-MS)还检测到更高的Msm细胞累积。
第三系列基于辛基三并卡菌素A1(OctTriA1),将其9位苯丙氨酸替换为色氨酸得到OctTriA5。此前研究表明未N-甲基化的OctTriA1在Msm中无法检测渗透,除非肽骨架N-甲基化。因此研究人员合成了N-甲基化衍生物(每分子两个N-甲基)。MycoPermeNet预测OctTriA5衍生物优于OctTriA1衍生物,且甲基化衍生物优于未甲基化衍生物。实验证实,甲基化叠氮-OctTriA5比较甲基化叠氮-OctTriA1能更好地渗透Mtb分枝菌膜。
研究人员进一步探究了修饰分枝菌膜渗透性对全细胞抗Mtb活性的影响。对于JSF-2985系列,尽管渗透性存在显著差异,但各衍生物的Mtb生长抑制效果并未反映其渗透性特征。亚抑制浓度乙胺丁醇(间接破坏分枝菌膜)也不能增强JSF-2985活性,表明分枝菌膜对其全细胞活性并非重要障碍,或其分子量较小(309 Da),用大体积渗透性调节基团修饰可能影响了靶点结合。
相比之下,OctTriA1系列分子量较大(1,521 Da),可能对膜屏障更敏感。亚最小抑菌浓度(sub-MIC)乙胺丁醇确能敏化Mtb对OctTriA1的反应。通过MurJ(必需脂质翻转酶)耗竭限制脂质II可得性发现,OctTriA1和OctTriA5均使用分枝菌脂质II作为受体,其杀菌机制与万古霉素不同。荧光显微镜显示,叠氮-OctTriA肽与万古霉素类似,在分枝杆菌细胞两极富集。
在四个匹配的OctTriA1和OctTriA5衍生物对(含或不含叠氮、含或不含甲基化)中,OctTriA5类似物在Msm和Mtb中均能更好地抑制生长。OctTriA5虽能渗透红细胞和金黄色葡萄球菌,但在Mtb中却降低了细胞包膜通透性(以溴化乙锭摄取和DBCO标记肽聚糖对叠氮荧光探针的可及性衡量),且该现象在OctTriA1和OctTriA5对之间无差异,表明苯环到吲哚的替换不引起该表型。因此,该骨架替换同时促进了分枝菌膜渗透和全细胞抗Mtb活性。
研究人员还通过回顾性分析验证了吲哚在其他分子环境中的作用。在约20万个化合物的分子库小分子库(MLSMR,Molecular Libraries Small Molecule Repository)中,筛选结构相似但外围位置含或不含吲哌的分子集,发现化合物活性与吲哚存在及MycoPermeNet预测渗透性相关。进一步在三个不同筛选中分析:MLSMR和TAACF(Tuberculosis Antimicrobial Acquisition and Coordinating Facility)全细胞筛选,以及纯化Mtb酶Rv3671c筛选。结果显示,全细胞筛选中的分子活性与观察到的骨架渗透性和MycoPermeNet预测均相关,而酶筛选(分枝菌膜屏障的阴性对照)中无此相关性。这表明影响分枝菌膜渗透的骨架和其他化学特征也能预测大数据集中的全细胞抗Mtb活性。
研究讨论部分指出,物理化学性质对分枝菌膜渗透的影响具有骨架依赖性。尤其是芳香氮杂环如吲哚,在不同分子环境中与分枝菌膜渗透相关并/或促进渗透。在药理学中,吲哚被视为"优势骨架"(privileged scaffold),因其在多种药物类别中高度富集并能有效与多种靶点相互作用。结合多种现有抗结核候选药物均为吲哌基的事实,本研究发现吲哚也可能是分枝菌膜渗透的优势骨架。
鉴定影响分枝菌膜渗透的化学特征可从多方面助力药物发现。在个体层面,MycoPermeNet及其个体化合物可解释性研究(如SHAP分析)可指导先导化合物的衍生化,但其实用性取决于多种因素:首先,分枝菌膜并非对所有抗结核抗菌药物都是重要屏障;其次,即使对分枝菌膜构成主要障碍的分子,通过衍生化改善渗透也可能损害靶点结合或增加代谢/外排敏感性。例如,N-甲基化增强辛基三并卡菌素的渗透性但仅提高对Msm的活性,而苯环到吲哘的替换则同时增强了两种物种中的渗透和活性。研究认为,可解释性研究可指导个体化渗透促进修饰:小分子可能更适合微调TPSA和logP等物理化学性质,而非环状骨架的增减。
在宏观层面,MycoPermeNet可应用于化合物库筛选前后的候选物优先级排序。本工作中,该模型帮助在大型数据集中鉴定了化学预测因子与全细胞活性之间的稳健相关性。
与革兰氏阴性菌外膜不同,Mtb分枝菌膜具有独特的结构和类孔蛋白,因此本研究鉴定的渗透预测因子与革兰氏阴性菌累积的预测因子不同不足为奇。未来使用靶向破坏分枝菌膜转运蛋白或结构完整性的菌株,可能有助于鉴定途径特异性的渗透预测因子。
PAC-MAN通过共价捕获周质分子实现亚细胞定位,避免了非特异性结合和样品处理中的分子损失等技术问题。然而,方法的局限在于需要叠氮标签。尽管叠氮被广泛认为是理想的生物正交标签(小且对母药理化性质影响小),且LC-MS证实叠氮标记与未标记化合物累积相似,但不能完全排除叠氮对某些分子渗透或活性的潜在影响。事实上,JSF-2985和辛基三并卡菌素衍生物的叠氮化略微降低了活性。但从叠氮标记库中识别的化学特征与未标记化合物的全细胞活性相关,且MycoPermeNet对叠氮化/未叠氮化匹配化合物的预测一致性,以及此前发现叠氮修饰药物渗透对膜扰动的敏感性与母药活性高度一致,均支持该方法的可靠性。叠氮在所有测试分子中的恒定性、大量测试分子以及部分分子的冗余性(仅叠氮位置不同的化合物)共同促成了模型预测能力。
任何测量活细胞中分子累积的方法都面临细胞内代谢的挑战。研究人员推测,PAC-MAN的2小时暴露窗口可能限制了胞内代谢(包括叠氮或其他部分的代谢),因已观察到Mtb中其他分子的转化在2小时后才开始。
Mtb的细胞内累积取决于分子克服膜、外排和代谢障碍的能力。由于PAC-MAN共价捕获周质测试分子且对分枝菌膜遗传和化学扰动敏感,该实验主要反映累积的一个方面——分枝菌膜渗透,尽管应变促进叠氮-炔环加成反应(SPAAC,strain-promoted alkyne-azide cycloaddition)的慢反应动力学(二级速率常数0.2—0.5 M
?1s
?1)也可能允许内膜渗透和外排过程的贡献。此外,测试分子占据有限的化学空间,均为符合Lipinski规则五(rule of five)的小分子。细胞区室和化学空间的限制既是优势也是局限:一方面,能鉴定明确累积方面的清晰结构-功能关系;另一方面,对更复杂分子或全细胞累积的关系可能需要进一步验证。扩大叠氮库的化学空间覆盖面、结合全细胞质谱分析、改造PAC-MAN用于细胞质、使用膜/外排/代谢缺陷限定菌株,将共同促成更全面的累积模型。这些模型进而可与靶点抑制、药代动力学和合成可行性模型整合,构建全面、可生物学和化学解释的研发管线,助力抗菌药物开发。