编辑推荐:
研究人员对比传统统计方法与机器学习算法,开发 SANN 模型预测口腔潜在恶性疾病(OPMDs)恶变风险,效果良好。
在口腔健康领域,口腔鳞状细胞癌(OSCC)是一种常见的全球性恶性肿瘤,严重威胁着人们的生命健康。它在全球癌症发病率中排名第 16 位,每年导致超过 17.7 万人死亡。而且,随着病情的发展,OSCC 患者的 5 年生存率会大幅下降,从局部阶段的 86.3% 骤降至远处转移阶段的 39.3%。这使得早期预测、检测和诊断 OSCC 变得至关重要。
口腔癌变有一个较长的病理前期,在这个阶段,口腔潜在恶性疾病(OPMDs)会悄然出现,它们具有较高的恶变(MT)风险。像口腔扁平苔藓(OLP)和口腔苔藓样病变(OLLs)就是临床中常见的 OPMDs。其中,OLP 是一种慢性炎症性疾病,会反复复发和缓解,表现为白色网状病变,还可能伴有萎缩、糜烂、溃疡或斑块状区域;OLLs 则可由多种因素引发,比如对牙科材料的过敏反应、某些药物的使用、移植物抗宿主病(GVHD)以及系统性疾病等。OPMDs 的恶变率在 2.6% - 7.9% 之间,OLP 和 OLLs 的恶变率分别为 0.4% - 12.5% 和 1.2% - 4.4%。虽然已经发现了一些与 OLP 和 OLLs 恶变相关的风险因素,包括患者的年龄、性别、临床亚型、全身合并症、上皮发育异常以及吸烟、饮酒等生活方式因素,但目前针对 OPMDs 恶变的临床预测模型非常有限,而且现有模型的预测效果也有待提高。
为了攻克这些难题,来自香港大学牙医学院口腔颌面外科、深圳大学计算机科学与软件工程系等机构的研究人员展开了深入研究。他们的研究成果发表在《iScience》杂志上。
研究人员采用了多种关键技术方法。首先,他们收集了 2004 年 1 月 1 日至 2023 年 12 月 31 日期间,来自香港玛丽医院和菲腊牙科医院的 1094 例患者的数据,这些数据来自香港医院管理局临床管理系统(HA - CMS)。然后,对数据进行了一系列处理,包括提取患者的各种信息,如患者状态、个人特征、系统性疾病、病变类型等,并进行特征选择、缺失值处理、编码和标准化,还使用了合成少数过采样技术(SMOTE)来平衡数据集。接着,研究人员开发了一种名为自注意力人工神经网络(SANN)的新型机器学习模型,并将其与其他经典算法,如人工神经网络(ANN)、随机生存森林(RF)和 DeepSurv 进行对比。在模型训练、测试和验证过程中,使用了 10 折交叉验证,并利用一个外部数据集进行进一步验证。
下面来看具体的研究结果:
- 研究人群的基线特征和风险因素:研究共纳入 681 例 OPMDs 患者,其中 OLP 患者 444 例,OLL 患者 237 例。患者的恶变率为 6.608%,平均随访时间为 8.62 年。女性患者更多,且恶变率高于男性。OLP 和 OLL 在老年人中更为常见,60 岁及以上患者的恶变率远高于 60 岁以下患者。有吸烟和 / 或饮酒史的患者、伴有全身疾病的患者以及红色病变、舌部和多部位病变的患者恶变风险更高。此外,口腔上皮发育异常(OED)无论是在初次就诊时存在,还是在随访期间出现,都与恶变风险增加显著相关。通过 Cox 比例风险(Cox - PH)回归分析确定了多个风险因素12。
- 列线图的构建和验证:基于风险因素构建的列线图,计算出综合得分来预测患者的无事件生存率。该列线图的 C 指数为 0.8835,校准曲线显示预测概率与实际概率吻合良好,通过贝叶斯 Cox 回归分析也验证了所选因素的统计学意义。将患者根据列线图得分分为低风险和高风险两组,两组的生存曲线有显著差异。列线图在不同随访时间的受试者工作特征(ROC)曲线下面积(AUC)表明其具有良好的预测性能,决策曲线分析(DCA)也显示该列线图在 20 年内具有临床实用性34。
- 机器学习模型的性能:四种机器学习模型的预测性能指标显示,它们的 AUC 均超过 94%,敏感性和特异性普遍高于 90%,整体表现优于列线图。其中,SANN 模型的 AUC 达到 0.9877,表现最佳。在决策曲线分析中,SANN 模型的临床效用最为突出。校准曲线显示,DeepSurv 模型校准性能较差,而其他三种算法相对较好。对四种算法进行综合评估后发现,SANN 模型的预测效果和稳定性最佳,且在外部验证中也表现出色,证明了其良好的泛化能力56。
研究结论和讨论部分指出,准确预测 OPMDs 的恶变潜能对于口腔癌的预防和早期诊断至关重要。目前缺乏可靠的决策支持模型,而本研究通过对比传统 Cox - PH 模型和机器学习算法,发现机器学习算法在预测 OPMDs 患者无恶变生存方面表现更优,尤其是 SANN 模型,各项性能指标都很出色,在内部和外部验证中都展现出强大的判别能力和良好的校准概率估计。此外,研究还强调了发育异常在 OPMDs 恶变风险中的重要作用。同时,研究也存在一些局限性,如样本量有限、数据收集方法有待完善、缺乏对复杂病例的考虑、不确定性研究不足以及未充分整合文本和图像数据等。未来的研究需要在多中心真实世界数据、更全面标准化的数据收集、复杂病例纳入、不确定性研究以及数据整合等方面加以改进。
总的来说,这项研究为口腔潜在恶性疾病恶变风险的预测提供了新的思路和方法,SANN 模型展现出了巨大的潜力,有望为临床决策提供有力支持,推动口腔癌预防和早期诊断的发展。