编辑推荐:
研究人员利用机器学习算法分析 SEER 数据库数据,构建皮肤黑色素瘤预后模型,StepCox[both] + RSF 为最优模型,助力临床研究。
皮肤黑色素瘤,这个隐匿在皮肤之下的 “杀手”,正悄然威胁着人们的健康。它是一种由皮肤黑素细胞恶变引发的恶性肿瘤,虽然在所有皮肤癌中占比仅 4%,却要为 75% 的皮肤癌相关死亡 “负责” 。而且,其发病率和死亡率在全球范围内都呈上升趋势,预计到 2040 年,新发病例将增至 51 万,死亡人数更是会飙升至 9.6 万。
目前,手术是治疗局部侵袭性黑色素瘤的主要手段,但如何精准选择手术方式、确定最佳切除边缘,以降低术后复发风险、提高患者生存率,仍是一大难题。此外,中晚期尤其是转移性皮肤黑色素瘤的治疗挑战重重,即便有新的化疗药物和靶向治疗药物,患者仍可能出现获得性耐药,预后依旧不佳。正因如此,深入研究和评估皮肤黑色素瘤的预后,成为了降低患者死亡率、减轻社会疾病负担的关键。
甘肃省妇幼保健院(甘肃省中心医院)烧伤整形科的研究人员,肩负着攻克这一难题的使命,开展了一项极具意义的研究。他们的研究成果发表在《Discover Oncology》杂志上,为皮肤黑色素瘤的临床研究点亮了新的希望。
为了构建一个精准的皮肤黑色素瘤预后预测模型,研究人员采用了多种关键技术方法。首先,他们借助 SEER*Stat 8.4.3 软件,从 SEER 研究数据(8 个登记处,涵盖约 8.3% 的美国人口)中筛选出符合条件的患者。这些患者需满足诊断时间在 2010 - 2015 年、疾病部位为皮肤黑色素瘤等一系列严格标准。接着,研究人员收集了患者的多项临床特征数据,像年龄、婚姻状况、TNM 分期(依据 AJCC 第 7 版标准)等。随后,运用随机数法将数据按 7:3 的比例分为训练集和测试集,利用 12 种不同的机器学习算法,对 97 种算法组合进行评估,最终筛选出最优模型。评估模型预测能力则借助一致性指数(Concordance index)来实现。
研究结果主要涵盖以下几个方面:
- 患者信息:研究初期共收集 24457 例病例,经过层层筛选,最终纳入 8441 例,其中训练集 5908 例,测试集 2533 例。通过对比训练集和测试集的基线特征发现,多数特征在两组间分布均衡,仅有 M 分期和化疗情况存在差异。
- 模型构建与验证:对 97 种算法组合的研究表明,StepCox[both] + RSF 模型在训练集中表现最为出色,C 指数高达 0.869;在测试集中,StepCox[both] + obliqueRSF 模型的 C 指数最高,为 0.867。综合来看,StepCox[both] + RSF 模型脱颖而出,被确定为最优模型。该模型筛选出的变量特征包括性别、年龄、婚姻状况、T 分期、N 分期、溃疡、肿瘤部位、组织学类型、手术、化疗以及骨转移、肝转移、肺转移。
- 模型的可解释性研究:为了让模型更易理解,研究人员通过多种方式进行分析。利用 RSF 模型展示训练集中变量的重要性,用热图呈现变量间的相关性。基于最优模型构建列线图(nomogram graph),并通过校准曲线和决策曲线分析(DCA 曲线)进行验证,结果显示列线图具有高度的预测能力。
在研究结论与讨论部分,研究人员成功构建了基于 97 种机器学习算法组合的皮肤黑色素瘤预后预测模型,StepCox[both] + RSF 模型表现最佳。这一模型的建立,有助于临床医生更精准地预测患者预后,为制定个性化治疗方案提供有力依据。
不过,该研究也存在一定局限性。作为一项回顾性研究,数据均来自 SEER 数据库且未进行外部验证,可能导致模型过拟合。此外,研究仅纳入了临床因素,未涉及黑色素瘤基因表达、微小 RNA(miRNA)等生物标志物的分析,而已有研究表明结合临床病理和基因表达谱(CP - GEP)的模型能显著提升预测能力。
尽管如此,这项研究依旧意义非凡。它为皮肤黑色素瘤的预后研究开辟了新方向,后续研究可以在此基础上,进一步纳入更多生物标志物,优化模型,为皮肤黑色素瘤患者带来更多的希望和曙光。<>
从临床角度看,医生可以依据这个模型,对患者的病情进行更精准的评估。例如,对于一位新诊断的皮肤黑色素瘤患者,医生能够借助模型所考虑的多个因素,快速判断其预后情况,从而制定出更具针对性的治疗方案。对于高风险患者,可尽早采取更积极的治疗措施,如强化化疗、联合免疫治疗等;对于低风险患者,则可以避免过度治疗,减少不必要的痛苦和医疗资源浪费。
从研究方向上,此模型的建立为后续的深入研究提供了坚实的基础。一方面,研究人员可以针对模型中筛选出的关键变量,进一步探究其内在的生物学机制。例如,性别差异影响预后的具体分子机制是什么?不同组织学类型的黑色素瘤在基因表达和信号通路方面有哪些差异?这些问题的解答将有助于揭示皮肤黑色素瘤的发病机制,为开发更有效的治疗方法提供理论依据。
另一方面,未来的研究可以尝试将更多的临床数据、基因数据以及其他生物标志物数据整合到模型中,进一步优化模型的预测能力。例如,结合基因测序技术获取的肿瘤基因突变信息,或者利用蛋白质组学技术检测肿瘤相关蛋白的表达水平,使模型更加精准地反映患者的真实病情。
同时,该研究也为其他肿瘤疾病的预后研究提供了借鉴。机器学习算法在皮肤黑色素瘤预后研究中的成功应用,为其他肿瘤的研究开辟了新的思路。研究人员可以尝试将类似的方法应用于肺癌、乳腺癌、结直肠癌等常见肿瘤的预后预测,构建更精准的预测模型,推动整个肿瘤学领域的发展。
总的来说,这项研究成果虽然存在一定的局限性,但它所带来的积极影响和潜在价值不可忽视。随着研究的不断深入和技术的不断进步,相信在未来,我们能够更好地攻克皮肤黑色素瘤这一难题,为患者带来更多的生存希望和更好的生活质量。