编辑推荐:
研究人员开发用健康体检数据预测视网膜静脉阻塞(RVO)风险的模型,有助于早期检测和预防,提升患者预后。
在眼科疾病的领域中,视网膜静脉阻塞(Retinal vein occlusion,RVO)如同一个隐匿的 “视力杀手”,悄然威胁着全球众多人的眼部健康。它是由于视网膜中央或分支静脉被血栓堵塞,或是动静脉交叉处视网膜静脉显著变窄,进而引发一系列严重的视力并发症,如黄斑水肿、视网膜纤维化、继发性青光眼等,严重影响患者的生活质量。目前,RVO 的检测主要依赖眼底摄影或其他视网膜成像技术,但这些方法存在诸多限制,比如需要专业设备和技术人员操作,成本较高,且在常规健康体检中并非普遍开展。同时,虽然常规健康体检中的实验室测试能评估一些与 RVO 相关的风险因素,像血压、胆固醇水平等,但却一直缺乏一种能有效整合这些数据来预测 RVO 的方法。
为了攻克这一难题,来自韩国多所机构的研究人员 Na Hyeon Yu、Daeun Shin 等展开了一项意义重大的研究。他们的研究成果发表在《BMC Medical Informatics and Decision Making》杂志上。研究旨在利用常规健康体检数据,开发一种无需编码专业知识和视网膜成像的机器学习模型,以预测普通人群的 RVO 风险。
在研究过程中,研究人员主要采用了以下关键技术方法:首先,他们使用了韩国国民健康与营养检查调查(KNHANES)在 2017 - 2020 年收集的数据来开发 RVO 预测模型,并利用 2021 年的数据进行外部验证。其次,借助无代码软件平台 Orange Data Mining 和 Google Vertex AI 进行模型构建。其中,Orange Data Mining 是一款免费开源的图形组件化工具,提供多种机器学习算法;Google Vertex AI 则是基于云的无代码机器学习开发工具。此外,为解决数据集中 RVO 病例较少导致的类别不平衡问题,研究人员采用了合成少数过采样技术(Synthetic Minority Oversampling Technique,SMOTE)进行过采样处理。
研究结果如下:
- 模型训练与性能:所有机器学习训练均无需编码经验即可完成。在 Orange Data Mining 中训练的带有 ReLU 激活函数的人工神经网络(Artificial neural network,ANN)表现出色,内部验证中受试者工作特征曲线下面积(Area under the receiver operating characteristic curve,AUC)达到 0.856(95% 置信区间 [CI],0.835 - 0.875),外部验证中 AUC 为 0.784(95% CI,0.763 - 0.803)。在外部验证中,ANN 的表现略优于逻辑回归(P=0.044),与 Google Vertex AI 模型相比无显著差异。
- 风险因素分析:通过经典统计分析,研究人员确定了 RVO 的关键预测变量,包括年龄、家庭收入、血压相关因素等。年龄越大、家庭收入越低、血压异常,RVO 的风险越高。此外,糖尿病和甘油三酯(TG)水平与 RVO 的关系较为复杂,需要进一步研究。
- 模型对比:对比了不同机器学习算法和无代码平台的性能。结果显示,在内部验证中,ANN、朴素贝叶斯和 Google Vertex AI 算法的 AUC 值优于逻辑回归,但差异不显著;在外部验证中,随机森林、朴素贝叶斯和 Google Vertex AI 算法的 AUC 值也优于逻辑回归,但差异同样不显著。
在研究结论和讨论部分,研究表明利用健康体检数据和无代码机器学习平台开发可及且成本效益高的 RVO 风险预测工具是可行的。这一工具能够在普通医疗保健环境中提高 RVO 的早期检测和预防能力,有助于医生及时发现高风险患者,为他们提供更精准的医疗建议,如对无疾病的高风险个体进行血压控制等,从而改善患者的预后。同时,该研究也为其他低患病率疾病的预测模型开发提供了新思路,展示了利用表格数据进行疾病风险预测的潜力。然而,研究也存在一定局限性,如 KNHANES 数据的横断面性质限制了未来 RVO 预测模型的开发,数据仅来自单一亚洲国家,模型的普适性有待验证,且缺乏 RVO 类型的信息等。未来研究可在这些方面加以改进,进一步完善 RVO 风险预测模型。总之,这项研究为眼科疾病的预防和早期干预开辟了新的道路,具有重要的临床意义和应用价值。