
-
生物通官微
陪你抓住生命科技
跳动的脉搏
化学信息学微服务V3:基于Web的化学结构操作与分析统一门户
【字体: 大 中 小 】 时间:2025年09月24日 来源:Journal of Cheminformatics 5.7
编辑推荐:
为解决开源化学信息学工具包因技术实现障碍(如复杂安装、依赖管理和集成挑战)而难以广泛应用的问题,研究人员开发了Cheminformatics Microservice V3。该研究通过RESTful API框架整合RDKit、CDK和Open Babel等工具,并提供基于React的交互式Web前端,支持结构编辑、PubChem集成、批量分子处理及InChI/RInChI生成等功能,显著降低了化学信息学方法的访问门槛,促进了跨学科研究中的可重复工作流。
在过去的三十年中,化学信息学领域取得了显著进展,这主要得益于众多开源软件工具包的开发。然而,研究人员在实际整合多种工具到工作流中时,仍面临诸多实际障碍,包括复杂的安装程序、依赖和兼容性问题、部署开销以及编程专业知识的需求。化学工具包在不同编程语言和平台上的碎片化,进一步加剧了集成研究工作流开发的复杂性。
为了应对这些限制并简化对化学信息学功能的访问,Cheminformatics Microservice V3应运而生。这一平台通过统一的RESTful API框架,整合了广泛使用的工具包,如RDKit、Chemistry Development Kit (CDK)和Open Babel,使研究人员能够通过一致的接口访问核心化学信息学操作。最新版本还引入了基于React开发的交互式Web前端,为用户提供了直观的图形界面,用于操作和分析化学结构,显著提升了工具的可用性和可访问性。
该研究由Kohulan Rajan等人开展,并发表在《Journal of Cheminformatics》上。研究团队通过采用现代Web技术(如React和Tailwind CSS)和容器化部署(Docker),确保了平台的稳定性、可维护性和可扩展性。此外,平台还集成了多项新功能,包括Ertl功能组查找器、统一过滤套件(涵盖PAINS、Lipinski规则、Veber、REOS、Ghose和Rule-of-3等)、PubChem搜索以及批量分子处理能力,进一步扩展了其应用范围。
研究采用Python和FastAPI框架构建后端RESTful API,通过JPype桥接Java工具(如CDK、Sugar Removal Utility和OPSIN)。前端使用React和Tailwind CSS实现响应式设计,通过Axios库与后端交互。平台通过Docker容器化确保环境一致性,并集成Prometheus、Grafana和Matomo等工具进行监控和隐私保护。此外,利用GitHub Actions实现CI/CD自动化部署。
后端保留了初始版本的稳定模块化架构,使用FastAPI框架通过RESTful API暴露化学信息学功能。工具包集成采用混合方法:Python原生库(如RDKit和Open Babel)直接集成,而Java工具(如CDK、Sugar Removal Utility和OPSIN)通过JPype桥接访问。系统通过Docker容器化,确保可重复性和跨环境一致部署。前端基于React开发,采用组件化架构和模块化服务层,通过Axios管理与后端的HTTP通信,实现了关注点分离和可维护性。
平台在保留现有五模块架构(chem、convert、depict、ocsr和tools)的基础上,新增了三项工具:Ertl功能组查找器、统一过滤套件(包括PAINS、Lipinski规则、Veber、REOS、Ghose、Rule-of-3、QED、SA评分和NP似然度指标)以及PubChem搜索。格式转换支持批量处理,depict模块提供了更精细的2D渲染控制(包括旋转和子结构高亮)。前端引入了交互式Web图形界面,支持PubChem分子查询和检索、InChI/RInChI标识生成、Ketcher结构编辑器集成以及批量转换和可视化功能(最多50个分子)。
平台通过Ketcher结构编辑器与InChI和RInChI库结合,使用mol文件作为输入生成InChI及其键、AuxInfo和日志语句。RInChI利用RXN文件计算RInChI、键和RAuxInfo。用户可通过复选框或下拉菜单选择InChI选项,并支持不同版本(如1.07.3、1.06和分子无机物原型)。
前端界面分为五个主要标签页(Chemical Analysis、Format Conversion、Depiction、Tools和OCSR),提供模块化访问功能。界面采用响应式设计,兼容不同屏幕尺寸,支持暗模式和数据本地存储(保护用户隐私)。平台通过公开实例(https://app.naturalproducts.net)和完整文档(https://api.naturalproducts.net/latest/docs)确保易用性和可扩展性。
Cheminformatics Microservice V3通过将模块化微服务架构与用户友好的图形Web界面结合,显著降低了化学信息学工具的访问门槛,使研究人员无需专业软件或编程知识即可使用先进功能。平台统一集成多个开源工具包,减少了用户管理独立软件环境的需求,同时通过容器化部署和CI/CD自动化确保了可重复性和可维护性。其强调可重复性和可扩展性,使其成为数据驱动化学分析和合作项目的重要工具,进一步促进了化学信息学方法在跨学科研究中的广泛应用。
生物通微信公众号
知名企业招聘