
-
生物通官微
陪你抓住生命科技
跳动的脉搏
斑马鱼化学表型推断系统ZFinfer:填补环境污染物研究数据空白的创新工具
【字体: 大 中 小 】 时间:2025年07月15日 来源:Ecotoxicology and Environmental Safety 6.2
编辑推荐:
为解决环境污染物毒性评估中实验数据不足的问题,研究人员开发了基于化学-蛋白质互作和基因-表型关联的斑马鱼化学表型推断系统ZFinfer。该系统整合STITCH数据库和ZFIN数据库资源,实现了对419,328种化学物质、23,180种斑马鱼蛋白及3,104种表型的关联分析,验证显示其对关键形态学终点的敏感性达0.72,对ECOTOX已知毒性记录的再发现率达93%。该工具为环境污染物优先评估和药物发现提供了高效计算框架。
随着环境污染问题日益严峻,如何高效评估成千上万种化学物质的毒性效应成为科学界面临的重大挑战。斑马鱼因其体积小、繁殖快且与人类基因高度保守(约70%人类基因存在斑马鱼同源基因),已成为毒理学研究的重要模式生物。然而传统实验方法难以应对海量化合物的检测需求,而现有计算模型如Laggner等开发的化学相似性预测工具又存在适用范围窄的问题。
为突破这一瓶颈,国家科学及技术委员会(原科技部)资助的研究团队开发了名为ZFinfer的创新性化学表型推断系统。这项发表于《Ecotoxicology and Environmental Safety》的研究,通过整合STITCH(Search Tool for Interacting Chemicals)数据库的化学-蛋白质互作数据与ZFIN(Zebrafish Information Network)的基因-表型注释数据,构建了覆盖419,328种化学物质、23,180种斑马鱼蛋白和3,104种表型的关联网络。
研究采用GO语言和MongoDB数据库构建系统架构,关键技术包括:1)基于超几何检验的富集分析方法;2)使用Tanimoto相似度≥0.65的化学相似性预测策略;3)整合Gene Ontology(GO)、Zebrafish Anatomy Ontology(ZFA)和Zebrafish Phenotype Ontology(ZP)三大本体系统。验证阶段采用777种USEPA ToxCast化学品和51种优先污染物,通过比较17个形态学终点的实验数据与预测结果评估性能。
3.1 模型适用性分析
研究发现,仅依赖实验数据时仅能分析136种化学品,而整合实验、预测、数据库和文本挖掘四类数据源后,系统可覆盖全部测试化学品。ZP系统展现出0.37的平均敏感性,显著高于GO/ZFA系统的0.15,尤其在心脏(0.77)、眼睛(0.66)等终点的预测表现突出。
3.3 毒性等级相关性
将毒性分为强(<1 μM)、中(1-10 μM)、弱(10-64 μM)三组时,系统对强毒性化学品的敏感性达0.49,显示其优先识别高危害物质的特性。值得注意的是,心脏、躯干长度等终点的预测准确性与相关蛋白注释量呈正相关(46.9-51% vs 0.3-3.4%)。
3.4 环境污染物验证
对USEPA优先污染物的分析显示,系统对心脏毒性(86%再发现率)、脑部毒性(75%)等终点的预测与ECOTOX记录高度吻合。以锌为例,系统推断的182种表型中,包括游泳行为、氧消耗等效应均得到其他鱼类实验数据的支持。
3.5 PFAS毒性预测
在分析12,034种PFAS物质时,系统成功预测PFOS(194种表型)和PFOA(107种表型)的全部已知效应,并对15种PFAS实现100%效应组再发现。尤为重要的是,系统推断的免疫毒性虽缺乏斑马鱼数据支持,但与绿贻贝等水生生物的研究证据一致,为PFAS免疫抑制机制研究提供了新线索。
这项研究的突破性在于:1)首次实现化学-基因-表型的多层级关联推断;2)通过相似性预测将适用范围扩展至5,195种PFAS;3)验证了计算模型指导实验设计的可行性。尽管存在部分终点数据不足(如触觉反应仅0.02敏感性)的局限,ZFinfer仍为环境污染物风险评估和药物开发提供了高效的计算工具。未来通过持续更新注释数据和优化算法,该系统有望成为连接计算毒理学与实验研究的重要桥梁。
生物通微信公众号
知名企业招聘