
-
生物通官微
陪你抓住生命科技
跳动的脉搏
HArD数据库:31,500种杂芳基取代基的立体与电子特性全景图谱及其在药物设计中的应用
【字体: 大 中 小 】 时间:2025年07月31日 来源:Scientific Data 6.9
编辑推荐:
研究人员针对杂芳基取代基缺乏系统性定量描述的问题,开发了HArD数据库(HeteroAryl Descriptors),通过DFT计算获得31,500种杂芳基的65种立体(如VBur)和电子(如σHet)参数,首次提出基于pKa的Hammett型常数σHet,为药物设计、催化及机器学习模型提供关键工具,发表于《Scientific Data》。
在药物研发和材料科学领域,杂芳基取代基(Heteroaryl substituents)如同分子世界的“万能积木”,其立体和电子特性直接影响化合物的反应活性和生物功能。然而,长期以来,科学界缺乏系统性量化这些特性的工具——传统的Hammett常数(σ)仅适用于苯环,而杂芳基的复杂结构(如吡啶、噻吩等)使得实验测定困难重重。这种数据空白严重制约了理性分子设计,迫使研究人员依赖试错法筛选化合物。
针对这一挑战,美国匹兹堡大学(University of Pittsburgh)的Turki M. Alturaifi团队联合Peng Liu课题组在《Scientific Data》发表了突破性研究。他们构建了迄今最全面的杂芳基描述符数据库HArD(HeteroAryl Descriptors),涵盖238种母核衍生的31,500种杂芳基取代基,通过高精度DFT(密度泛函理论)计算获得65种参数,包括立体参数(如埋藏体积VBur、Sterimol参数)、电子参数(如HOMO/LUMO系数、原子电荷)以及首创的Hammett型杂芳基常数σHet。该数据库首次实现了杂芳基与芳基电子效应的直接比较,为药物共价弹头(covalent warheads)设计和催化反应预测提供了标准化工具。
研究团队采用三大关键技术:
1. 电子特性全景图谱
σHet分析揭示杂芳基电子效应跨度远超苯基(-1.68~+2.01),如4-吡啶基σHet=1.33(强吸电子),而吡咯-2-基σHet=-0.91(强供电子)。UMAP降维显示杂芳基占据独特的化学空间(图4b),无法被芳基替代。
2. 立体效应量化
Sterimol参数和VBur成功区分异构体差异,如3-溴-2-吡啶基VBur=35.2%,而3-溴-4-吡啶基为38.7%(图3d),证实数据库对位阻敏感反应的预测潜力。
3. 反应性预测验证
CM5原子电荷(q(Het)-CM5)与文献报道的亲核芳香取代(SNAr)活化能ΔG?高度相关(R2>0.9),如2-磺酰嘧啶与谷胱甘肽(GSH)的反应速率(图6b)。
HArD数据库填补了杂芳基定量描述的空白,其核心创新在于:
该成果已通过网站(hard.pengliugroup.com)开源,未来可拓展至更多杂环体系和反应类型,推动有机化学从经验探索向数据驱动范式转变。
生物通微信公众号
知名企业招聘