机器学习整合多组学数据预测肺癌化疗敏感性的创新模型构建及TMED4/DYNLRB1耐药机制研究

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年07月26日 来源：Computational and Structural Biotechnology Journal 4.5

编辑推荐：

　　本研究针对肺癌化疗个体差异大的临床难题，通过整合GDSC和GEO数据库的多组学数据，运用45种机器学习算法开发了RF+SVM组合预测模型（训练集R=0.997）。研究发现TMED4和DYNLRB1基因在耐药组显著高表达，siRNA敲除实验证实其调控5-FU、DDP等药物敏感性（PC9细胞IC50降低35.5倍）。该研究为肺癌个性化化疗提供新工具（可访问LC-DrugPortal网络服务器），同时揭示新的耐药靶点。

肺癌作为全球死亡率最高的恶性肿瘤，化疗仍是其基础治疗手段。然而患者对铂类、紫杉醇等药物的响应存在显著个体差异，传统"试错式"给药模式导致约30-60%患者承受无效治疗带来的毒副作用。更棘手的是，目前缺乏可靠的预测标志物，EGFR等已知靶点仅适用于少数患者。这种"盲人摸象"的现状使得精准化疗方案的制定成为临床重大挑战。

南方医科大学珠江医院的研究团队在《Computational and Structural Biotechnology Journal》发表的研究中，开创性地将机器学习与多组学数据相结合，构建了肺癌化疗敏感性预测系统。研究人员首先从GDSC数据库获取肺癌细胞系的RNA-seq数据和23种化疗药物IC₅₀值，采用10种特征选择方法筛选关键基因后，用45种算法（包括RF、SVM、XGBoost等）构建预测模型。通过GEO的10个独立数据集验证后，利用siRNA敲除和CCK-8实验验证关键基因功能，最终开发出临床可用的网络预测平台。

关键技术包括：1) 基于GDSC1/GDSC2的肺癌细胞系多组学数据建模；2) 10个GEO数据集的外部验证；3) 使用Wilcoxon检验和KM生存分析评估预测效果；4) 在NCI-H460等4种肺癌细胞系中进行TMED4/DYNLRB1基因功能验证。

研究结果部分显示：

模型开发与验证：RF+SVM组合模型表现最优，训练集R值达0.997。对替尼泊苷等10种药物预测R>0.77，显著优于pRRophetic工具（如5-FU预测R提高42%）。
预后差异分析：模型预测的敏感组患者中位生存期显著延长，如GSE69795数据集甲氨蝶呤敏感组死亡风险降低81.5%。
关键基因发现：TMED4在17个模型中权重最高，耐药组表达量较敏感组升高2.1-4.8倍（p<0.01）；DYNLRB1在11个模型中起关键作用。
功能验证：PC9细胞敲除TMED4后对5-FU敏感性提升35.5倍（IC₅₀从171.1降至4.82 μM）；H1299细胞敲除DYNLRB1使吉西他滨IC₅₀降低5.1倍。

讨论部分指出，该研究首次系统评估45种算法在化疗预测中的性能，并发现TMED4（跨膜p24运输蛋白）和DYNLRB1（动力轻链）的新型耐药调控作用。值得注意的是，TMED4通过调控内质网-高尔基体蛋白运输可能影响药物代谢，这为克服耐药提供新靶点。研究者开发的LC-DrugPortal平台（https://smuonco.shinyapps.io/LC-DrugPortal/）已实现临床转化，可预测300余种药物的敏感性。

该研究的局限在于细胞系数据到临床的转化存在gap，且TMED4在EPI处理中呈现细胞系特异性双相调控。未来需开展前瞻性临床试验，并探索TMED家族其他成员（如TMED2/9）的协同作用。这项研究为肺癌精准医疗提供了"算法-标志物-平台"三位一体的解决方案，将机器学习预测与实验验证相结合，推动了个性化化疗决策系统的创新发展。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号