
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于q-RASPR方法的脂质归一化膳食生物放大因子(BMFL )预测模型:评估水生生态系统中有机化学品生物放大潜力的新框架
【字体: 大 中 小 】 时间:2025年06月05日 来源:Aquatic Toxicology 4.1
编辑推荐:
本研究针对有机化学品在水生食物链中的生物放大潜力评估难题,创新性地结合定量结构-性质关系(QSPR)与跨读(RA)技术,开发了q-RASPR预测模型。该模型以OECD 305指南实验数据为基础,实现了BMFL 的高精度预测(Q2 F1 =0.90),为化学品环境风险评估提供了高效计算工具。
随着工业化进程加速,大量有机化学品进入水生生态系统,通过食物链产生生物放大效应,威胁生态安全和人类健康。传统实验方法评估化学品生物放大因子(Biomagnification Factor, BMF)存在周期长、成本高等问题,而现有计算模型预测精度有限。如何建立高效可靠的预测体系,成为环境毒理学领域亟待解决的难题。
针对这一挑战,研究人员开展了一项创新性研究,通过融合定量结构-性质关系(Quantitative Structure-Property Relationship, QSPR)和跨读(Read-Across, RA)技术优势,首次将定量跨读结构-性质关系(quantitative Read-Across Structure-Property Relationship, q-RASPR)方法应用于脂质归一化膳食生物放大因子(BMFL
)预测。研究采用OECD 305指南标准实验数据,构建了包含477种有机化学品的多质量等级数据集,通过特征选择获得14个关键分子描述符。
关键技术包括:(1)基于Arnot-Quinn数据库构建高/中/低质量三级数据集;(2)采用网格搜索和留一法交叉验证筛选7个核心描述符;(3)建立偏最小二乘(PLS)回归模型;(4)引入结构相似性和误差度量开发q-RASPR混合模型。
【Preparation of data sets】
研究团队从Bertalo等整理的数据库中获取经OECD TG 305标准验证的高、中、低质量BMF数据。通过脂质含量校正公式BMFL
=[C]predator
/[C]prey
×Ldiet
/Lfish
实现数据标准化,确保不同来源数据的可比性。
【Model development using Dataset 1 (D1)】
特征选择过程从143个预处理描述符中筛选出14个显著参数,最终建立包含7个描述符的多元线性回归模型。PLS模型显示关键参数X2v和C-026对LogBMFL
预测贡献显著,模型方程LogBMFL
=-1.29+0.077×X2v+0.242×C-026-0.57×MaxaaaC展现出优异拟合度。
【Conclusion】
该研究突破性地将q-RASPR方法应用于BMFL
预测,最终模型展现出卓越的预测性能(Q2
F1
=0.90,Q2
F2
=0.89),测试集平均绝对误差(MAEtest
)仅0.27。模型成功整合了低质量数据中可靠样本,显著拓展了适用范围。通过引入结构相似性度量,解决了传统QSPR模型对结构新颖化合物预测不准的缺陷。
这项研究的意义在于:首次建立可直接预测BMFL
的计算模型,为评估化学品在食物链中的迁移风险提供量化工具;发展的q-RASPR框架实现了化学信息学方法与生态毒理学的跨学科融合;模型的高精度特性使其可支持OECD等国际机构的化学品管理决策,对实施《斯德哥尔摩公约》关于持久性有机污染物的管控具有重要实践价值。该成果标志着计算毒理学在环境风险预警领域取得重要进展,为发展新一代智能评估系统奠定方法学基础。
生物通微信公众号
知名企业招聘