一种用于单层保护金纳米粒子的评分函数,该纳米粒子能够识别溶液中的小有机分子
《Journal of Chemical Theory and Computation》:A Scoring Function for Monolayer-Protected Gold Nanoparticles Capable of Recognizing Small Organic Molecules in Solution
【字体:
大
中
小
】
时间:2025年10月27日
来源:Journal of Chemical Theory and Computation 5.5
编辑推荐:
配体修饰的金纳米颗粒(AuNPs)可作为自组装纳米受体选择性识别溶液中的小分子分析物,其应用包括核磁共振化学传感。本文提出基于化学相似性、疏水性和电荷互补性的评分函数,通过ridg回归模型快速预测AuNP-分析物结合亲和力,验证显示R2=0.85,MAE=0.45 kcal/mol。分子动力学模拟表明配体柔韧性、单层堆积和氢键网络对结合亲和力起关键作用,尤其弱结合系统中构象限制和氢键模式差异显著影响传感性能。
### 解读:基于金纳米颗粒的纳米传感器设计与优化的新方法
金纳米颗粒(AuNPs)作为一种重要的纳米材料,在化学传感领域展现出独特的潜力。它们不仅能够作为自组织的纳米受体,还能在溶液中选择性地识别小分子有机物(分析物)。这种识别能力为多个应用领域提供了可能性,其中核磁共振(NMR)化学传感尤为突出。为了推动这类基于AuNPs的纳米传感器的理性设计,研究者提出了一种数据驱动的评分函数,能够快速估算AuNP与分析物之间的结合亲和力,从而实现高效的计算机模拟筛选。这种评分函数引入了化学相似性、疏水性和电荷互补性作为关键的分子描述符,其在实验数据验证中的表现十分出色,相关系数(R2)达到0.85,平均绝对误差(MAE)为0.45 kcal/mol。
在当前的研究中,纳米传感器的设计不仅依赖于静态的分子特性,还需要考虑分子动态行为。研究者通过增强采样分子动力学(MD)模拟,揭示了配体灵活性、单层排列和氢键网络如何影响结合行为,特别是在弱结合系统中。这些数据驱动与原子级别的见解为AuNPs的理性设计和优化提供了一个坚实的基础。
### 化学相似性与分子结构的关联
为了更深入地理解AuNP与分析物之间的结合机制,研究者首先对所有系统进行了化学相似性分析。他们使用了Tanimoto相似性作为评估方法,对配体和分析物分别进行了聚类分析。这一方法能够直观地展示不同分子之间的结构关系。通过对配体和分析物的化学相似性进行计算,研究者发现了三个主要的配体聚类:第一类(橙色)配体包含烷基连接、二肽结构和甲酯封端的天冬氨酸,呈现出负电荷特性。尽管它们的疏水性范围较广(log P从?2.07到1.61),但这些配体的结合自由能相对集中在?5 kcal/mol左右。第二类(绿色)配体则主要由烷基连接(除了一个含醚的配体)和中心的酰胺、氨基甲酸或氨基甲酸酯结构组成,呈现出中性或适度疏水的特性,并且与数据集中最低的结合亲和力相关。第三类(红色)配体虽然共享烷基连接,但其末端功能不同,包含负电荷的磺酸基团或正电荷的铵基团。这些配体表现出高度疏水性(log P从1.82到2.59),并且与最高的结合亲和力相关。值得注意的是,在每个聚类内部,结合亲和力保持一致,表明化学相似性可以将复杂的分子结构编码为一个有意义的数值,从而用于预测建模。
同样地,分析物的化学相似性也通过Tanimoto相似性进行了聚类分析。研究者发现,分析物主要基于功能化的芳香环结构。在16个分析物中,有1个包含芘,1个包含萘,1个包含吲哚,其余13个则以苯环为主。通过计算分析物与苯酚骨架(SMILES字符串:“Oc1ccccc1”)的相似性,研究者能够更清晰地识别不同分析物之间的结构关系。这一方法不仅有助于理解分子识别的机制,也为后续的结合预测提供了基础。
### 评分函数的设计与应用
基于上述化学相似性分析,研究者开发了一种评分函数,用于预测AuNP与分析物之间的结合亲和力。该评分函数结合了三个关键的分子描述符:疏水性、电荷互补性和化学相似性。研究者使用了岭回归(Ridge Regression)作为建模方法,这是一种带有正则化的线性模型,能够减少过拟合的风险。模型的超参数通过嵌套的k折交叉验证进行了优化,确保模型在小数据集上的稳健性。
评分函数的输入特征向量由五个维度组成,分别包括:配体和分析物的疏水性(log P),电荷互补性(即配体和分析物电荷的绝对差值),以及配体和分析物的化学相似性(Tanimoto相似性分数)。研究者利用这些特征向量训练模型,并在实验数据验证中取得了优异的预测效果。在验证过程中,研究者采用了五折交叉验证,并进行了1000次重复以评估模型的预测稳定性。最终的模型相关系数(R2)达到0.85,平均绝对误差(MAE)为0.45 kcal/mol,表明该评分函数在预测结合亲和力方面具有较高的准确性。
### 分子动力学模拟揭示结合机制
为了进一步研究弱结合系统的结合机制,研究者选择了六个代表性系统进行增强采样分子动力学(MD)模拟。其中,四个系统具有实验测量的结合自由能,而另外两个系统在实验条件下未检测到结合行为。通过这些系统的模拟,研究者发现配体的灵活性、氢键网络和单层排列对结合行为具有显著影响。特别是在弱结合系统中,静态描述符可能不足以捕捉结合行为的细微差异,因此需要结合分子动力学模拟的原子级别信息。
在模拟过程中,研究者使用了拉伸分子动力学(sMD)方法,并结合了伞形采样分子动力学(US-MD)以恢复半定量的势能均分函数(PMFs)。通过计算AuNP与分析物之间的中心质量距离作为反应坐标(RC),研究者能够近似分析物解离的自由能景观。然而,这一方法在强结合系统中表现良好,但在弱结合系统中预测精度下降。这表明,简单的反应坐标可能无法涵盖结合行为中的关键因素,特别是配体重组相关的构象罚分。
通过分析配体和分析物之间的氢键相互作用,研究者发现,具有可检测结合行为的系统通常表现出更多的氢键相互作用。特别是,分析物与磺酸基团的氢键数量与结合亲和力呈正相关。相反,弱结合系统则表现出更多的氢键相互作用,这些相互作用主要与酰胺羰基有关。这可能源于L3配体的羰基基团在分子表面的暴露程度较高。此外,L3配体的灵活性较低,限制了分析物与磺酸头基团和疏水内部的同步相互作用,导致L3-A10和L3-A18未检测到结合行为。然而,L3-A19表现出不同的模式,其含芘的分子通过更广泛的疏水相互作用补偿了配体灵活性的下降,从而实现了可检测的结合行为。此外,研究者还分析了配体之间的氢键相互作用,发现L2配体的氢键数量显著高于L3配体,表明这些短暂的相互作用有助于维持配体单层的协同和适应性环境。
### 结论与未来展望
本研究开发了一种基于分子描述符的数据驱动评分函数,用于预测AuNP与分析物之间的结合亲和力,取得了较高的预测精度(R2 = 0.85,MAE = 0.45 kcal/mol)。该方法不仅能够实现候选纳米颗粒系统的快速筛选,还显著降低了计算成本,使其更接近实验测试。然而,研究者也指出,尽管该模型能够有效排名可测量的结合亲和力,但在预测低亲和力系统时表现不足。这表明,当前的方法在捕捉低亲和力系统中的构象罚分和瞬时相互作用方面仍存在局限。
为了进一步提升预测模型的准确性,研究者建议扩大实验数据集的规模,以便更好地应用于机器学习方法。此外,研究者强调,分子动力学模拟能够提供更详细的原子级别信息,有助于理解配体-分析物界面的动态行为。通过这些方法,研究者为AuNP的理性设计和优化提供了一个新的框架,使研究人员能够更深入地理解AuNP与分析物之间的结合机制。
### 计算方法与技术实现
本研究采用了多种计算方法和技术手段,以确保结果的准确性和可靠性。化学相似性分析通过Tanimoto相似性进行,研究者使用了RDKit生成分子指纹,并通过SciPy的树状图功能进行聚类分析。这一方法能够清晰地展示不同分子之间的结构关系,从而为后续的结合预测提供基础。
在建模过程中,研究者使用了岭回归方法,这是一种带有L2正则化的线性模型,能够减少过拟合的风险。数据集由32个AuNP-分析物系统组成,每个系统具有实验测量的结合亲和力数据。通过五折交叉验证,研究者评估了模型的性能,并进行了1000次重复以计算置信区间。为了确保模型的稳定性,研究者对特征进行了标准化处理,使其均值为0,方差为1。
在模型训练和优化过程中,研究者使用了嵌套交叉验证方法,通过网格搜索确定最佳的正则化参数(α)。参数范围从10??到10?,以确保模型在不同数据集上的泛化能力。最终的模型表达式如下:
ΔG = 0.5450 + (?2.5822 · ChargeDifference) + (?0.4023 · Ligand log P) + (?0.4902 · Analyte log P) + (?4.7748 · Ligand Tanimoto) + (0.6395 · Analyte Tanimoto)
其中,ΔG表示结合自由能(单位为kcal/mol),ChargeDifference表示配体与分析物之间的电荷差值,Ligand log P和Analyte log P分别表示配体和分析物的疏水性,Ligand Tanimoto和Analyte Tanimoto分别表示配体和分析物的化学相似性。
研究者使用了多种软件工具,包括scikit-learn、pandas、matplotlib和RDKit,以实现数据分析和可视化。在交叉验证过程中,研究者使用了tqdm库进行进度跟踪,提供实时更新,以确保计算过程的透明性。
在分子建模和系统设置方面,研究者使用了NanoModeler网络服务器生成初始构型,基于Lopez-Acevedo等人的结构(Au???(SR)??)进行建模。所有系统均包含一个配体保护的AuNP和十个相同的分析物副本。通过自定义的Python脚本,研究者将分析物放置在配体单层的中间位置(或距离AuNP表面的三分之一处),并确保所有原子之间的最小距离为0.15 nm,以避免分子间碰撞。
所有系统被放置在十二面体模拟盒的中心,模拟盒与AuNP边缘的最小距离为1.6 nm。系统随后被溶剂化(使用TIP3P水模型),并加入氯化钠以中和电荷并达到150 mM的盐浓度。通过最速下降法对系统进行了能量最小化,最多进行50,000步。所有模拟均采用周期性边界条件,积分时间步长为2 fs,氢键的线性约束,以及1.2 nm的短程非键相互作用截断半径。长程静电相互作用通过第四阶粒子网格Ewald方法进行计算,所有模拟均在GROMACS v2021.4上运行。
### 分子动力学模拟的细节
在完成能量最小化后,系统在NVT统计系综中进行平衡和热化,以达到300 K的最终温度,时间为500 ps。使用速度重缩 thermostat(时间常数为0.1 ps)对溶剂和非溶剂组进行了耦合。系统随后在NPT系综中进一步平衡,使用Berendsen barostat(时间常数为2 ps,参考压力为1 bar,压缩性为4.5 × 10?? bar?1)。
一旦系统达到目标温度和压力,研究者进行了拉伸分子动力学(sMD)模拟,其中每个分析物同时被拉离AuNP的质心,通过谐波势(2000 kJ mol?1 nm?2)和拉伸速率(0.4 nm ns?1)进行耦合。这一较高的拉伸速率使得分析物在10 ns内解离(对于2 nm长度的配体)。在拉伸MD模拟过程中,作用在集体变量(CV)上的力每4 ps存储一次,用于重构势能均分函数(PMF)沿CV的变化趋势。CV被定义为AuNP质心与分析物质心之间的距离。
为了进一步研究弱结合系统的结合机制,研究者采用了伞形采样分子动力学(US-MD)方法。从拉伸MD模拟中选取的配置被用于伞形采样,确保每个窗口包含所有10个分析物。通过这种方式,伞形采样能够覆盖所有分析物的完整反应坐标范围,而无需对每个分析物单独进行采样。这种方法提供了多个优势:首先,它能够捕捉广泛结合配置,反映真实系统的结构和动态异质性;其次,多个分析物分布的求和减少了噪声,提高了统计不确定性。所有系统均采用0.2 nm的窗口间距,每个系统生成11至17个窗口,总模拟时间为220至320 ns。
在伞形采样模拟中,每个窗口被进行2 ns的MD模拟,使用谐波势(力常数为1000 kJ mol?1 nm?1)对配置进行限制。通过WHAM算法(gmx wham模块)重构自由能剖面,研究者将所有10个分析物纳入分析,以计算单个系统的解离自由能。为了估计特定系统的分析物解离自由能,研究者计算了在配体单层内的最低自由能(CV < 3 nm)与在溶液中的最高自由能(CV > 3 nm)之间的无偏能量差。收敛性通过GROMACS WHAM命令中的bootstrapping函数进行监控,同时通过10个块的分析评估配体RMSD的标准差(见图S5)。
### 硬件、软件与性能
所有系统均在Fondazione Istituto Italiano di Tecnologia的Franklin HPC集群上进行模拟。每模拟使用一个节点,该节点包含两个AMD EPYC 7713处理器,每个处理器使用60个核心,运行频率为2.0 GHz。每节点使用60个MPI进程和2个OpenMP线程,以确保计算效率。拉伸MD模拟运行到分析物达到最大反应坐标值,而伞形采样模拟运行时间为2 ns。整体性能在伞形采样模拟中为50至70 ns/day,而在拉伸MD模拟中为80至150 ns/day,具体取决于系统规模。
通过这些计算方法和技术手段,研究者不仅能够高效地预测AuNP与分析物之间的结合亲和力,还能够深入理解结合行为的分子机制。这一方法为纳米传感器的设计和优化提供了一个新的框架,使研究人员能够更准确地评估和预测结合行为,从而推动纳米传感技术的发展。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号