
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于生成式人工智能的化学污染物筛查策略:以全氟和多氟烷基物质为例
《Environmental Science & Technology》:Generative AI-Empowered Screening Strategy for Chemical Pollutants: A Case on Per- and Polyfluoroalkyl Substances
【字体: 大 中 小 】 时间:2025年11月13日 来源:Environmental Science & Technology 11.3
编辑推荐:
本研究提出基于化学语言模型(CLM)的筛查策略,成功生成并验证了1.4万余种全氟烷基和多氟烷基物质(PFASs)结构,显著扩展化学空间覆盖率(21.6%),并实现高精度标注(Top-1准确率87%),有效发现88种及100种新型PFASs污染物,为高通量污染筛查提供新方法。

识别未知化学污染物对于有效的风险管理至关重要。然而,目前的分析技术仅限于现有数据库所涵盖的结构,仅能捕捉到庞大污染物化学空间中的冰山一角。生成式人工智能(AI)在探索这一领域并揭示未知污染物的结构方面具有巨大潜力。本研究提出了一种基于化学语言模型(CLM)的筛选策略,并将其应用于识别未知的全氟烷基和多氟烷基物质(PFASs)。利用CLM生成了超过140万个PFAS结构,使PFAS的化学空间扩展了21.6%。这些生成的结构被整理成可疑列表用于进一步筛选。该策略在添加了PFAS的样本上的标注准确率达到了87%。当应用于含氟化学物质的废水进水样本时,成功识别出了88种此前未被发现的PFAS特征。为了进一步证明其实用性,将生成的可疑列表与现有的计算工具结合使用,用于分析出水样本,结果又发现了100种新的PFAS特征。这些发现凸显了生成式AI在阐明未知污染物结构方面的巨大潜力,为高通量污染物标注提供了一种新的方法。
生物通微信公众号
知名企业招聘