
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于知识图谱的化学传输模型模拟表示:实现空气质量预测的语义化与标准化
【字体: 大 中 小 】 时间:2025年06月01日 来源:Journal of Cheminformatics 7.1
编辑推荐:
为解决化学传输模型(CTM)数据缺乏标准化和互操作性的问题,研究人员开发了首个CHIMERE模型本体,通过SWIT框架将netCDF文件转化为RDF三元组知识图谱。该研究实现了线性计算复杂度的数据转换,构建的空气质量知识图谱支持SPARQL查询,为环境政策制定提供了FAIR化数据支持,发表于《Journal of Cheminformatics》。
空气污染已成为全球公共卫生危机,世界卫生组织数据显示91%的城市居民暴露于超标污染物中。欧盟2008/50/EC指令要求成员国建立连续空气质量监测体系,但传统传感器网络存在地理覆盖不全、数据离散等问题。化学传输模型(CTM)如CHIMERE虽能模拟污染物扩散,但其输出的netCDF格式存在查询困难、语义缺失等缺陷,阻碍了跨系统数据共享。Karolinska Institutet等机构的研究团队创新性地将语义网技术引入该领域,通过构建知识图谱实现CTM数据的机器可读与跨平台应用。
研究团队采用SWIT(语义网集成工具)框架,结合新开发的CHIMERE本体,将netCDF格式的72小时模拟数据转化为包含266,369个三元组的RDF知识图谱。关键技术包括:1)基于Protégé构建符合OQuaRE质量标准的本体,复用CHEBI等生物医学本体词汇;2)通过tabular2xml库实现netCDF到XML的转换;3)设计映射规则将XML元素关联到本体类(如AirQualityForecast);4)利用SPARQL端点实现时空一致性验证。
研究结果部分显示:
结论部分强调,该研究首次实现CTM数据的语义化转换,其知识图谱可无缝对接生物医学本体(如CHEBI),为探究污染物健康效应提供新途径。例如,PM2.5个体可通过本体关联到毒性机制或代谢通路。未来需扩展本体覆盖更多CTM模型(如WRF-Chem),并优化长期模拟的存储效率。这项发表于《Journal of Cheminformatics》的工作,为环境科学与大健康领域的知识融合树立了范式。
生物通微信公众号
知名企业招聘