编辑推荐:
为解决乳腺癌治疗难题及中药有效成分组合筛选问题,上海中医药大学的研究人员开展基于转录调控和化学结构筛选中药组合的研究,发现 HONA 组合有协同抗癌效果。该研究为乳腺癌治疗提供新思路,值得科研人员一读。
上海中医药大学上海中医化学生物学前沿科学中心、中西医结合医学研究院(第一作者单位)的 Shensuo Li、Lijun Zhang、Wen Zhang 等研究人员在《Chinese Medicine》期刊上发表了题为 “Identifying traditional Chinese medicine combinations for breast cancer treatment based on transcriptional regulation and chemical structure” 的论文。这篇论文在乳腺癌治疗和中医药研究领域具有重要意义,为开发基于中药的乳腺癌治疗方案提供了新的思路和方法,有助于推动中医药现代化发展,更好地发挥中医药在攻克癌症难题方面的潜力。
一、研究概述
该研究旨在基于转录调控和化学结构发现具有协同作用的中药化合物组合,用于乳腺癌治疗。研究人员通过综合运用生物信息学和机器学习等多学科方法,筛选出潜在的中药化合物组合,并通过细胞实验验证其协同效应,为乳腺癌的治疗提供了新的候选药物组合,同时也为中药复方研究提供了新的策略。
二、研究背景
癌症是全球范围内严重威胁人类健康的重大疾病,据世界卫生组织报告,2020 年癌症导致约 1000 万人死亡 。在女性群体中,乳腺癌(Breast Cancer,BC)尤为高发,每年新增病例约占女性所有癌症的 30%,也是女性癌症相关死亡的第二大原因 。尽管化疗、激素治疗、免疫治疗等多种疗法不断涌现,但由于乳腺癌具有显著的分子、病理和临床异质性(如可分为管腔 A 型、管腔 B 型、人表皮生长因子受体 2 富集型和三阴性乳腺癌四种亚型 ),治疗效果往往不尽人意,耐药性问题也严重阻碍了治疗进程。例如,经典的激素治疗药物他莫昔芬虽能显著降低乳腺癌复发和死亡率,但仍有 20 - 30% 的肿瘤对其产生耐药性 。
药物联合治疗被认为是提高癌症治疗效果、克服耐药性的有效策略。与单一药物治疗相比,联合用药可以针对肿瘤细胞的多种补偿机制,同时抑制多条信号通路,提高根除肿瘤细胞的可能性,还能降低每种药物的使用剂量,减少毒性 。然而,探索有效的药物组合面临巨大挑战,因为组合数量庞大,传统的实验方法既耗时又耗资源。
中医药(Traditional Chinese Medicine,TCM)有着数千年的临床应用历史,其 “多成分、多靶点、多活性” 的特点在抗肿瘤方面展现出独特优势 。现代研究也不断证实中医药的抗肿瘤效果,但从复杂的中药成分中筛选出有效的化合物组合并非易事。一方面,组合可能性众多,实验筛选成本高昂;另一方面,中药天然产物与常规小分子药物不同,基于生物知识的计算机预测方法对其适用性有限。不过,化合物扰动转录组分析和基因集等研究手段为解决这一难题提供了新的方向。
三、研究方法
- 收集代表综合生物事件的基因集:研究人员从分子特征数据库(Molecular Signatures Database)获取了 9940 个与综合生物事件相关的基因集,涵盖了不同的生物过程、信号通路以及癌症进展模块等信息 。
- 鉴定 BC 相关的差异表达基因和失调基因集:利用 R 软件的 TCGAbiolinks 包从癌症基因组图谱(The Cancer Genome Atlas,TCGA)项目下载乳腺癌转录组数据集(包含 1106 个肿瘤样本和 113 个正常样本),通过 DESeq2 管道分析提取 19,934 个蛋白质编码基因的表达计数矩阵,筛选差异表达基因(Differentially Expressed Gene,DEG) 。再运用 ClusterProfiler R 包进行过表达分析(Over - representation analysis,ORA),确定与乳腺癌相关的显著富集事件,进而筛选出与乳腺癌进展相关的基因集 。
- 计算基因集与 BC 靶点的距离:构建包含 15,898 个蛋白质和 213,763 个相互作用的人类蛋白质 - 蛋白质相互作用组(Protein - Protein Interactome,PPI)网络,从 TTD 数据库获取乳腺癌的标准靶点 。采用随机游走重启算法测量每个基因集到乳腺癌靶点的距离,并通过计算 1000 次随机排列的距离估计背景分布,筛选出距离显著的基因集 。
- 评估基因集之间的冗余度:使用重叠系数评估基因集之间的相似性,去除相似基因集中的冗余信息 。当两个基因集的重叠系数大于 0.5 时,保留富集分析中显著性更高的基因集用于后续研究。
- 获取 MCF7 细胞系的转录谱:从 LINCS 数据库检索能干扰 MCF7 乳腺癌细胞系生长的化合物转录谱,根据 24 小时时间点和最高转录活性得分的标准,保留了 TTD 数据库中记录的 2312 种化合物的转录谱,其中 62 种与乳腺癌相关 。
- 计算 wAC 指数:为评估化合物对基因集转录调控的逆转效应,研究人员提出 wAC 指数 。先提取乳腺癌上调或下调(调整后 p 值 <0.01,绝对 log2FoldChange>0.5)的基因并标记,再检查化合物处理后的表达谱是否存在反向调控,生成标签混淆矩阵,通过 irrCAC R 包计算 AC1 指数,并考虑基因在 PPI 网络中的介数中心性对其加权,得到 wAC 指数 。该指数范围为 - 1 到 1,数值越高表示化合物处理与乳腺癌失调之间的反向一致性越强。
- 发现具有协同调控基因集的组合:从 ITCM 数据库收集 496 种中药来源化合物在 MCF7 细胞上的转录谱,计算每种化合物在各特征基因集上的 wAC 指数,并根据乳腺癌药物 wAC 指数的 50 分位数和 80 分位数将调控分数分为 0(0 - 50%)、0.5(50 - 80%)、1(80 - 100%)三个等级 。分别计算单个化合物的总体调控分数(PS)和两个化合物组合的协同调控分数(TCS),筛选出 TCS 值较高的组合进行进一步研究 。
- 药物组合数据收集和 ML 建模:从 NCI - ALMANAC 项目获取 MCF7 乳腺癌细胞系中 4966 种独特组合(涉及 101 种药物)的四种协同评分(ZIP、Loewe、HSA、Bliss) ,去除异常值并进行归一化处理。选择 MACCS、CDK Substructure、PubChem 三种化学指纹描述符,将两种药物的指纹连接起来代表组合的结构特征 。使用 Autogluon 工具构建 9 种机器学习回归模型,通过五折交叉验证在训练集上训练模型,并在测试集上评估,根据最低均方根误差(Root Mean Square Error,RMSE)选择最优模型 。
- 细胞实验:选用 MCF7 人乳腺癌细胞系,在含 1% 青霉素 - 链霉素和 10% 胎牛血清的 1640 培养基中,于 37°C、5% CO?条件下培养 。通过细胞增殖实验(采用 CCK - 8 法)、细胞周期和凋亡实验(使用碘化丙啶、RNase A 等染色,经流式细胞仪检测)、活性氧(Reactive Oxygen Species,ROS)测量(利用 ROS 检测试剂盒)和集落形成实验,评估化合物组合对细胞的影响,并计算组合指数(Combination Index,CI)判断组合效应是协同(CI<1)、相加(CI = 1)还是拮抗(CI>1) 。
四、研究结果
- 鉴定出 860 个与 BC 相关的关键基因集:通过对肿瘤和正常样本的表达谱分析,检测到 5015 个显著差异表达基因(3018 个上调,1997 个下调) 。基于这些差异表达基因,根据 ORA 富集分数筛选出 860 个基因集,它们分别代表生物状态、生物过程、信号通路和癌症模块等不同生物事件 。
- 获得 115 个低冗余且接近 BC 靶点的基因集:评估基因集到疾病靶点在 PPI 网络中的距离,筛选出 318 个基因集 。再通过重叠系数去除冗余,最终得到 115 个低冗余基因集用于后续研究 。
- 基于 wAC 指数推断出 9 个特征基因集:通过比较乳腺癌药物和非乳腺癌药物对基因集转录调控的 wAC 指数,结合基因集与 MCF7 细胞中 log 转换后的 IC50 的相关性分析,确定了 9 个与乳腺癌治疗相关的特征基因集 。这些基因集涉及细胞增殖、雌激素信号、酒精反应、金属离子反应等多个与乳腺癌发生发展密切相关的过程 。
- 基于协同调控筛选候选中药来源组合:计算 496 种中药化合物在 9 个特征基因集上的 wAC 指数并分级,评估单个化合物和化合物组合的调控分数 。结果显示,129 种化合物对至少一个基因集有逆转效应(PS 值 > 0) ,估计 129 种化合物的 8256 种可能组合的 TCS 值后,确定了 11 个 TCS 值大于 8 的候选组合,这些组合对所有特征基因集均有显著调控作用 。
- 基于协同预测识别潜在组合:建立基于化学结构的机器学习模型预测化合物组合对 MCF7 细胞的协同评分 。研究发现基于 ZIP 测量的模型表现更优,其中 NeuralNetFastAI 模型在使用不同指纹类型作为输入时,均展现出较低的 RMSE 值和较高的 R2 值 。用该模型预测 11 个候选组合的 ZIP 分数,发现 S10S12(Honokiol,HO)和 S2S3(Neochlorogenic acid,NA)组合(简称 HONA)的平均预测分数最高,提示其可能具有潜在的协同效应 。此外,药物 - 药物相互作用(Drug - Drug Interaction,DDI)预测显示 HONA 具有良好的安全性 。
- HONA 协同效应的细胞实验验证:细胞实验表明,HO 和 NA 对 MCF7 细胞活力均有剂量依赖性抑制作用,且 HO 的抑制作用更强 。HONA 组合在抑制细胞活力方面表现优于单独使用 HO,当 HO 浓度超过 1μM 时,HONA 的 CI 值大多小于 1,呈现协同效应,其中 10μM HO 和 30μM NA 组合的 CI 值最小(0.306),协同作用最强 。进一步实验发现,HONA 组合可显著诱导细胞早期凋亡、使细胞周期阻滞在 S 期、增加 ROS 生成,并减少集落形成,表明其对乳腺癌细胞具有较强的抑制作用 。
五、研究结论与讨论
本研究通过整合生物信息学和机器学习方法,系统地挖掘了用于乳腺癌治疗的潜在中药化合物组合 。研究人员利用转录调控和化学结构特征,成功筛选出 HONA 组合,并通过细胞实验验证了其协同抑制乳腺癌细胞生长的效果 。这一成果不仅为乳腺癌治疗提供了新的潜在药物组合,也为中药复方的研究开辟了新途径,证明了基于多组学数据和计算模型筛选中药有效成分组合的可行性 。
在研究过程中,确定的 9 个特征基因集对理解乳腺癌的发病机制和药物作用靶点具有重要意义 。例如,HALLMARK - 9 和 GOBP - 4886 参与细胞增殖调控,这是肿瘤发展和治疗的关键环节;HALLMARK - 14 与雌激素信号相关,而雌激素在大多数乳腺癌的发生发展中起着重要作用 。此外,GOBP - 6268 和 GOBP - 1462 分别涉及酒精反应和金属离子反应,进一步揭示了乳腺癌发生发展的复杂机制 。
基于化学结构的机器学习模型为预测化合物组合的协同效应提供了有力工具 。研究发现基于 ZIP 测量的模型能更好地学习化合物组合的结构特征,通过不同指纹类型编码化合物结构,为优化组合设计提供了参考 。
不过,该研究也存在一定局限性。机器学习模型具有黑箱性质,难以明确协同效应与特定结构片段的关系,虽然进行了特征重要性分析,但仍需进一步研究揭示协同作用的具体机制 。此外,目前仅在细胞实验层面验证了 HONA 组合的效果,未来还需要开展动物实验和更深入的毒性评估,以全面确认其协同效益和安全性,为临床应用提供更可靠的依据 。
总体而言,这项研究为中医药在乳腺癌治疗领域的应用提供了重要的理论和实验基础,有望推动中医药现代化进程,为攻克乳腺癌这一重大疾病带来新的希望 。未来研究可在此基础上,进一步拓展中药化合物组合的筛选范围,探索更多潜在的治疗方案,同时深入研究协同作用机制,为精准医疗提供更有力的支持 。