Macrocycle-DB:首个综合性大环化合物数据库助力突破性药物研发

《Nucleic Acids Research》:Macrocycle-DB: a comprehensive database for macrocycle-based drug discovery

【字体: 时间:2025年11月04日 来源:Nucleic Acids Research 13.1

编辑推荐:

  为解决大环化合物数据分散、缺乏专业整合平台的难题,研究团队开发了Macrocycle-DB——目前最全面的在线大环化合物数据库。该库收录45,525个化合物(含76个获批药物和105个临床候选物),涵盖2,533个靶点蛋白,提供结构信息、生物活性数据、理化性质及共晶结构等专业内容。数据库特别设计了大环特异性描述符和linker分类系统,支持结构相似性搜索和可下载数据集,为bRo5(超越类药五原则)药物开发提供关键资源。平台免费开放访问(https://macro-db.dpbio.tech/),将显著推动AI辅助大环药物设计领域发展。

  
在药物研发领域,大环化合物正成为攻克"不可成药"靶点的秘密武器。这类由12个以上原子构成环状结构的分子,凭借其独特的刚性构象和强大的结合能力,能够精准靶向传统小分子难以触及的蛋白质相互作用界面和浅表结合口袋。然而,尽管已有76个大环药物获得FDA批准,超过105个候选物进入临床研究,研究人员在获取系统化的大环化合物数据时却面临重重障碍——现有数据库如ChEMBL和PubChem虽包含部分大环信息,但缺乏专门的结构注释、linker分类和大环特异性描述符,使得高效药物设计难以实现。
为破解这一瓶颈,暨南大学周阳教授、陆晓云教授与浙江大学侯廷军教授团队在《Nucleic Acids Research》发表了题为"Macrocycle-DB: a comprehensive database for macrocycle-based drug discovery"的研究论文,正式推出全球最大规模的大环化合物专用数据库Macrocycle-DB。该平台整合了45,525个经过严格筛选的大环化合物,其中包含26261个环肽、9327个合成大环、4532个天然产物等六大类别,每个化合物均标注了详细的理化性质、生物活性数据以及48种大环特异性结构描述符。
研究团队通过多源数据整合与智能计算技术构建了这一平台。他们从PubMed文献、专利及ChEMBL、DrugBank等9个公共数据库中系统采集数据,采用Schr?dinger LigPrep模块生成三维构象,利用RDKit计算理化参数,并基于Morgan指纹(2048位,含手性信息)构建相似性矩阵。特别值得关注的是,团队首次对合成大环中的1746个linker进行了功能基团分类,为理性药物设计提供了关键参考。
数据库内容深度解析显示,大环化合物确实主要分布在bRo5(beyond Rule of Five)化学空间,其中环肽的环尺寸最大(12-60原子),而合成大环更符合传统类药性原则。靶点分析揭示GPCRs(33.3%)、激酶(26.9%)和水解酶(17.3%)是最常被靶向的蛋白家族,其中黑皮质素4受体、酪氨酰-DNA磷酸二酯酶1等靶点出现频率最高。
平台功能设计极具实用性。用户可通过"靶点"、"大环化合物"、"PDB"和"Linker"四个专用标签页浏览数据,每个条目均设有详细信息页面。以大环化合物页面为例,不仅展示基本结构信息(SMILES、IUPAC名称、2D/3D结构),还专门为合成大环提供支架和linker细节,为环肽标注氨基酸序列。
搜索功能支持多种智能查询方式。用户可通过化合物名称、Macrocycle-DB ID(如MCD00001)等文本信息检索,也可使用JSME分子编辑器绘制结构进行相似度(Tanimoto系数≥0.8)或子结构匹配。对于靶点蛋白页面,除基本注释信息外,还提供相关大环化合物的理化性质分布统计和代表性非环分子对照,助力研究人员快速把握靶点特征。
研究团队在讨论中强调,Macrocycle-DB的出现恰逢其时。随着Macformer、MacroHop等AI驱动的大环设计工具不断发展,专业数据库已成为训练机器学习模型、优化结合亲和力预测算法的必备基础。该平台特有的linker分类系统和支架注释功能,为开发新型大环化策略提供了宝贵参考。特别是对蛋白降解靶向嵌合体(PROTAC)研究领域,数据库未来计划增加分子胶活性分类(如环孢素A、雷帕霉素等)和降解相关参数(DC50、Dmax等),将进一步拓展其应用边界。
作为目前唯一全面覆盖大环研究需求的公共资源,Macrocycle-DB通过系统整合结构、活性、靶点和开发阶段信息,成功搭建了连接实验数据与计算设计的桥梁。平台持续更新机制将不断纳入新发现的大环化合物和靶点注释,而未来规划中的双环体系描述符、ADMET(吸收、分布、代谢、排泄和毒性)分析模块等升级,有望使其成为大环药物研发领域不可或缺的基础设施。这项研究不仅解决了领域内的数据碎片化问题,更通过精心设计的专业工具链,为攻克疑难靶点提供了全新的解决方案,极大加速了创新大环药物的临床转化进程。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号