机器学习整合多组学数据预测肺癌化疗敏感性的创新模型构建及TMED4/DYNLRB1耐药机制研究

【字体: 时间:2025年07月26日 来源:Computational and Structural Biotechnology Journal 4.5

编辑推荐:

  本研究针对肺癌化疗个体差异大的临床难题,通过整合GDSC和GEO数据库的多组学数据,运用45种机器学习算法开发了RF+SVM组合预测模型(训练集R=0.997)。研究发现TMED4和DYNLRB1基因在耐药组显著高表达,siRNA敲除实验证实其调控5-FU、DDP等药物敏感性(PC9细胞IC50降低35.5倍)。该研究为肺癌个性化化疗提供新工具(可访问LC-DrugPortal网络服务器),同时揭示新的耐药靶点。

  

肺癌作为全球死亡率最高的恶性肿瘤,化疗仍是其基础治疗手段。然而患者对铂类、紫杉醇等药物的响应存在显著个体差异,传统"试错式"给药模式导致约30-60%患者承受无效治疗带来的毒副作用。更棘手的是,目前缺乏可靠的预测标志物,EGFR等已知靶点仅适用于少数患者。这种"盲人摸象"的现状使得精准化疗方案的制定成为临床重大挑战。

南方医科大学珠江医院的研究团队在《Computational and Structural Biotechnology Journal》发表的研究中,开创性地将机器学习与多组学数据相结合,构建了肺癌化疗敏感性预测系统。研究人员首先从GDSC数据库获取肺癌细胞系的RNA-seq数据和23种化疗药物IC50值,采用10种特征选择方法筛选关键基因后,用45种算法(包括RF、SVM、XGBoost等)构建预测模型。通过GEO的10个独立数据集验证后,利用siRNA敲除和CCK-8实验验证关键基因功能,最终开发出临床可用的网络预测平台。

关键技术包括:1) 基于GDSC1/GDSC2的肺癌细胞系多组学数据建模;2) 10个GEO数据集的外部验证;3) 使用Wilcoxon检验和KM生存分析评估预测效果;4) 在NCI-H460等4种肺癌细胞系中进行TMED4/DYNLRB1基因功能验证。

研究结果部分显示:

  1. 模型开发与验证:RF+SVM组合模型表现最优,训练集R值达0.997。对替尼泊苷等10种药物预测R>0.77,显著优于pRRophetic工具(如5-FU预测R提高42%)。
  2. 预后差异分析:模型预测的敏感组患者中位生存期显著延长,如GSE69795数据集甲氨蝶呤敏感组死亡风险降低81.5%。
  3. 关键基因发现:TMED4在17个模型中权重最高,耐药组表达量较敏感组升高2.1-4.8倍(p<0.01);DYNLRB1在11个模型中起关键作用。
  4. 功能验证:PC9细胞敲除TMED4后对5-FU敏感性提升35.5倍(IC50从171.1降至4.82 μM);H1299细胞敲除DYNLRB1使吉西他滨IC50降低5.1倍。

讨论部分指出,该研究首次系统评估45种算法在化疗预测中的性能,并发现TMED4(跨膜p24运输蛋白)和DYNLRB1(动力轻链)的新型耐药调控作用。值得注意的是,TMED4通过调控内质网-高尔基体蛋白运输可能影响药物代谢,这为克服耐药提供新靶点。研究者开发的LC-DrugPortal平台(https://smuonco.shinyapps.io/LC-DrugPortal/)已实现临床转化,可预测300余种药物的敏感性。

该研究的局限在于细胞系数据到临床的转化存在gap,且TMED4在EPI处理中呈现细胞系特异性双相调控。未来需开展前瞻性临床试验,并探索TMED家族其他成员(如TMED2/9)的协同作用。这项研究为肺癌精准医疗提供了"算法-标志物-平台"三位一体的解决方案,将机器学习预测与实验验证相结合,推动了个性化化疗决策系统的创新发展。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号