
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于机器学习的QSAR建模与单细胞转录组学相结合,用于发现肺癌的新药物靶点
《Journal of Translational Medicine》:Machine learning-driven QSAR modeling combined with single cell transcriptomics identifies novel drug targets for lung cancer
【字体: 大 中 小 】 时间:2026年06月20日 来源:Journal of Translational Medicine 7.5
编辑推荐:
摘要背景非小细胞肺癌是导致癌症相关死亡的主要原因之一,这主要是因为肿瘤常常会转移到大脑和骨骼。治疗效果往往受到药物耐药性、肿瘤异质性以及不同阶段和转移部位缺乏有效治疗方案的限制。找到在原发肿瘤和转移灶中都存在的可药物靶向靶点,对于推动精准肿瘤学的发展至关重要。方法通过分析原发性非
非小细胞肺癌是导致癌症相关死亡的主要原因之一,这主要是因为肿瘤常常会转移到大脑和骨骼。治疗效果往往受到药物耐药性、肿瘤异质性以及不同阶段和转移部位缺乏有效治疗方案的限制。找到在原发肿瘤和转移灶中都存在的可药物靶向靶点,对于推动精准肿瘤学的发展至关重要。
通过分析原发性非小细胞肺癌肿瘤及其对应的脑部和骨部转移灶的scRNA-seq表达谱,识别出保守的及具有部位特异性的基因表达特征。随后运用Ingenuity Pathway Analysis对靶点进行优先级排序。从scRNA-seq分析中筛选出的潜在靶点,再通过基于机器学习的定量结构-活性关系建模来进行配体筛选。这些QSAR模型是利用ChEMBL的生物活性数据构建的,并通过多种机器学习算法进行评估。在大规模虚拟筛选之后,还进行了分子对接和分子动力学模拟,以优化候选化合物。
共有8个候选治疗靶点被列为优先对象,其中ARPC2、PSMB4和RAC2在原发肿瘤、脑部转移灶和骨部转移灶中均存在过度表达现象,且与关键的癌症相关通路有功能关联。QSAR建模显示出较强的预测能力,XGBoost和随机森林模型的AUROC值均高于0.97。针对每个靶点进行的虚拟筛选共发现了大约900万到1500万种高亲和力候选化合物。后续的分子对接和分子动力学模拟表明,ARPC2-14465616、PSMB4-74833722和RAC2-57175325这三种复合体具有最高的结构稳定性,且能保持稳定的分子间相互作用。
这种结合单细胞转录组学和机器学习技术的药物发现框架,为转移性非小细胞肺癌找到了保守的可药物靶向靶点以及具有潜力的候选化合物。这些研究结果为后续的实验验证以及开发针对原发肿瘤和转移病灶的新型治疗策略奠定了坚实基础。
非小细胞肺癌是导致癌症相关死亡的主要原因之一,这主要是因为肿瘤常常会转移到大脑和骨骼。治疗效果往往受到药物耐药性、肿瘤异质性以及不同阶段和转移部位缺乏有效治疗方案的限制。找到在原发肿瘤和转移灶中都存在的可药物靶向靶点,对于推动精准肿瘤学的发展至关重要。
通过分析原发性非小细胞肺癌肿瘤及其对应的脑部和骨部转移灶的scRNA-seq表达谱,识别出保守的及具有部位特异性的基因表达特征。随后运用Ingenuity Pathway Analysis对靶点进行优先级排序。从scRNA-seq分析中筛选出的潜在靶点,再通过基于机器学习的定量结构-活性关系建模来进行配体筛选。这些QSAR模型是利用ChEMBL的生物活性数据构建的,并通过多种机器学习算法进行评估。在大规模虚拟筛选之后,还进行了分子对接和分子动力学模拟,以优化候选化合物。
共有8个候选治疗靶点被列为优先对象,其中ARPC2、PSMB4和RAC2在原发肿瘤、脑部转移灶和骨部转移灶中均存在过度表达现象,且与关键的癌症相关通路有功能关联。QSAR建模显示出较强的预测能力,XGBoost和随机森林模型的AUROC值均高于0.97。针对每个靶点进行的虚拟筛选共发现了大约900万到1500万种高亲和力候选化合物。后续的分子对接和分子动力学模拟表明,ARPC2-14465616、PSMB4-74833722和RAC2-57175325这三种复合体具有最高的结构稳定性,且能保持稳定的分子间相互作用。
这种结合单细胞转录组学和机器学习技术的药物发现框架,为转移性非小细胞肺癌找到了保守的可药物靶向靶点以及具有潜力的候选化合物。这些研究结果为后续的实验验证以及开发针对原发肿瘤和转移病灶的新型治疗策略奠定了坚实基础。