
-
生物通官微
陪你抓住生命科技
跳动的脉搏
利用主动学习和分子动力学预测全氟和多氟烷基物质(PFAS)的扩散系数
《Environmental Science & Technology》:Predicting PFAS Diffusion Coefficients with Active Learning and Molecular Dynamics
【字体: 大 中 小 】 时间:2025年11月12日 来源:Environmental Science & Technology 11.3
编辑推荐:
本研究开发了一个集成机器学习和分子动力学的框架,通过主动学习预测全氟和多氟烷基物质(PFAS)的扩散系数,有效降低预测误差(减少88%),提升R2值至0.907,支持环境风险评估和修复规划。

全氟和多氟烷基物质(PFAS)是一类超过14,000种的合成化合物,具有极强的环境持久性。这些物质广泛应用于工业和消费领域,它们难以降解,并在环境介质和生物体内积累,从而引发严重的健康风险,包括癌症、肝脏损伤和免疫系统功能障碍。鉴于其持久性和毒性,迫切需要对它们的环境行为进行评估。然而,由于缺乏可靠的扩散系数数据,预测PFAS在环境中的迁移路径仍然具有挑战性,而这些数据对于模拟污染物迁移规律和制定修复策略至关重要。实验测量既耗时又昂贵,而完全基于计算的方法因化学空间的复杂性而难以实现。我们开发了一个结合机器学习和分子动力学的框架,利用主动学习技术来预测PFAS化合物的扩散系数。该框架首先利用已测量的扩散系数数据,通过化学图谱表示法和物理化学描述符对模型进行训练。该方法会迭代识别预测不确定性最高的化合物,进行针对性的分子动力学模拟,并重新训练模型,以高效地探索化学空间同时降低计算成本。最终,该框架的性能得到了显著提升:平均相对误差降低了88%,R2值从0.095提高到了0.907。在最佳批量规模(50–100种化合物)下,基于不确定性的采样方法始终优于随机选择方法。这种数据高效的方法能够预测数千种PFAS化合物的迁移特性,为环境风险评估和修复规划提供有力支持。