编辑推荐:
Mulka等研究人员针对氟化试剂信息分散问题,开发了FluoBase数据库,为氟化学研究提供全面信息资源,助力科学发现
FluoBase:氟化试剂数据库的构建与应用
研究背景
在化学领域,有机氟化物因其独特的物理化学性质,在医药、农药和先进材料等领域发挥着越来越重要的作用。例如,氟元素在药物和农药中被视为“神奇元素”,约30%的农药和20%的药物含有氟。氟化试剂是合成有机氟化物的关键,但目前关于这些试剂的结构、性质和功能的信息分散在海量文献中,给合成化学家带来不便。为解决这一问题,中国科学院上海有机化学研究所的研究人员开发了FluoBase——一个全面的氟化试剂数据库,旨在为氟化学研究提供便捷的信息资源。
研究方法
研究人员利用MongoDB构建了FluoBase数据库,采用BSON(Binary JSON)格式存储数据,支持灵活的文档结构。数据库整合了来自科学文献的广泛数据,包括2050个分子(1810种氟化试剂和240种氟化功能分子)、7373个性质、747个3D结构、200个CCDC晶体数据和1208个参考文献。此外,数据库还提供了GraphQL和REST API接口,支持与人工智能系统的无缝集成,便于预测氟化物的性质。
研究结果
数据库构建与内容
FluoBase数据库于2024年上线,包含超过20种不同类别的氟化试剂,涵盖亲核、亲电和自由基三大类。数据库不仅提供氟化试剂的信息,还包含氟化功能分子(如天然产物、制冷剂、麻醉剂和表面活性剂)的详细数据。用户可以通过名称、化学式、CAS注册号(CASRN)、DOI或SMILES等关键词进行搜索,获取相关信息。此外,数据库还支持多语言界面(中文和英文),并提供19F NMR预测工具,基于图卷积网络(Graph Convolutional Network, GCN)模型,能够准确预测有机分子的19F NMR化学位移。
数据库功能与应用
FluoBase为用户提供了一个用户友好的界面,支持通过化学结构绘制工具(如Ketcher)进行搜索,并提供3D结构、合成方法和参考文献等详细信息。此外,用户还可以提交自己的数据,经过验证后纳入数据库。数据库的持续更新和扩展计划包括增加更多氟化功能分子(如绝缘气体、药物分子等)和相关药理性质(如logP/logD、水溶性等)。
研究结论与讨论
FluoBase作为一个公开的氟化试剂数据库,为氟化学研究提供了全面的信息资源。它不仅涵盖了广泛的氟化试剂和功能分子,还通过集成多种工具(如19F NMR预测工具)提升了用户体验。该数据库的开发有助于加速氟化学研究,促进新发现,并为机器学习在氟化物性质预测中的应用提供了重要平台。随着数据库的不断扩展和更新,FluoBase将成为氟化学领域的重要资源,服务于科学界和对氟化学应用感兴趣的研究人员。研究成果发表在《Journal of Cheminformatics》上,为相关领域的研究者提供了重要的参考。