基于树结构算法的糖尿病患者与非糖尿病患者肝癌风险因素交互模式及评分系统比较研究
《JMIR Medical Informatics》:Comparison of Risk Factors, Their Interaction Patterns, and Scoring Systems for Liver Cancer Between Patients With and Those Without Diabetes: Retrospective Cohort Study Using Electronic Health Records and Tree-Structured Algorithms
【字体:
大
中
小
】
时间:2025年11月04日
来源:JMIR Medical Informatics 3.8
编辑推荐:
本研究针对糖尿病患者肝癌风险预测缺乏特异性模型的问题,通过回顾性队列分析香港地区19万例电子健康记录,采用条件推断生存树和随机生存森林算法,首次系统比较了糖尿病与非糖尿病人群肝癌风险因素的交互模式。研究发现ALT、年龄、性别和甘油三酯是共同预测因子,而慢性病毒性肝炎在糖尿病人群中作用更显著。构建的四个评分系统C-index达0.75-0.82,为糖尿病分层管理提供了精准预测工具。
在全球癌症死亡原因中,肝癌高居第三位。更值得关注的是,糖尿病会使肝癌发生风险显著增加。然而,当前大多数肝癌风险预测模型并未充分考虑糖尿病患者特有的风险特征,也缺乏对糖尿病患者与非糖尿病患者之间风险因素交互模式的系统比较。这导致临床实践中难以针对不同人群制定个性化的肝癌筛查和预防策略。
为了解决这一难题,香港中文大学公共卫生及基层医疗学院的Sarah Tsz Yui Yau、Chi Tim Hung、Eman Yee Man Leung、Albert Lee和Eng Kiong Yeoh研究团队开展了一项大规模回顾性队列研究,研究成果发表在《JMIR Medical Informatics》上。研究人员利用香港医院管理局的电子健康记录数据库,纳入了1997年至2021年间使用公立医疗服务的190,971名患者数据,其中糖尿病患者132,221人,非糖尿病患者58,750人,中位随访时间达6.25年。
研究采用了创新的树结构算法来探索风险因素之间的复杂关系。条件推断生存树用于可视化展示各因素间的交互模式,而随机生存森林则用于构建稳定的预测模型。通过整合这两种方法的优势,研究人员开发了四套针对不同人群的肝癌风险评分系统:糖尿病患者总体评分系统(D0)、非糖尿病患者总体评分系统(N0)、无肝病的糖尿病患者评分系统(D1)和无肝病的非糖尿病患者评分系统(N1)。
研究的关键技术方法主要包括:基于香港地区电子健康记录的大规模回顾性队列设计,使用条件推断生存树分析变量间交互作用,应用随机生存森林进行变量重要性排序,以及通过Cox比例风险模型构建临床适用的评分系统。
研究结果揭示了糖尿病与非糖尿病人群在肝癌风险因素上存在的显著差异:
在糖尿病人群中,慢性病毒性肝炎状态是区分肝癌风险的首要因素。存在慢性病毒性肝炎时,肝硬化是最主要的风险因素;而无慢性病毒性肝炎时,性别成为最显著的因素。男性中,他汀类药物使用和年龄是关键因素;女性中,年龄和ALT水平起主导作用。
在非糖尿病人群中,年龄是区分肝癌风险的主要因素。年龄较大(>55岁)的患者中,ALT水平成为主导因素。ALT较高时,他汀使用、LDL胆固醇和性别是关键因素;ALT较低时,吸烟成为主要风险因素。年轻患者(≤55岁)中,男性性别是最显著风险因素。
在总体评分系统中,肝硬化、ALT水平、年龄、性别和血清甘油三酯是糖尿病和非糖尿病人群共有的预测因子。慢性病毒性肝炎状态仅在糖尿病人群中被选为独特预测因子。值得注意的是,甘油三酯在所有系统中均与肝癌风险呈负相关。
在无肝病亚组中,ALT水平、年龄、性别和甘油三酯仍是共同预测因子。基线空腹血糖和吸烟状态分别成为糖尿病(D1)和非糖尿病(N1)评分系统的独特预测因子。
四个评分系统在测试集上表现出色:D0的C-index为0.80,N0为0.80,D1为0.75,N1为0.82,相应的综合Brier评分分别为0.011、0.006、0.011和0.006。
研究的讨论部分深入分析了这些发现的临床意义。慢性病毒性肝炎在糖尿病人群中作用更显著,可能与肝炎病毒感染干扰胰岛素信号通路、改变葡萄糖和脂质代谢以及诱导炎症反应促进2型糖尿病发展有关。ALT水平作为肝功能标志物,其与年龄的交互作用反映了肝脏随年龄增长发生的生理变化,包括再生能力减弱、炎症反应降低、肝脏体积缩小和血流量减少。
他汀类药物使用在多个亚组中显示保护作用,可能的机制包括通过下调甲羟戊酸途径抑制肿瘤生长,以及对抗HBV的致癌作用。甘油三酯与肝癌风险的负相关关系可能与低血脂水平提示肝功能受损、自然杀伤细胞效应功能激活抑制肿瘤生长,以及肿瘤细胞摄取循环脂质满足自身需求有关。
空腹血糖反映糖尿病严重程度,可能通过上调胰岛素样生长因子-1和促炎因子水平促进肝癌发生。吸烟作为致癌物质,可能通过产生反应性致癌代谢物、慢性炎症、免疫抑制和加速端粒功能障碍等机制增加肝癌风险。
这项研究具有重要的公共卫生和临床意义。首先,慢性病毒性肝炎在糖尿病人群中的突出作用提示需要加强该人群的肝炎筛查和管理。其次,甘油三酯与肝癌风险的负相关关系挑战了传统认知,提示血脂管理在肝癌预防中的复杂性。第三,在无肝病人群中,空腹血糖和吸烟等可干预因素的重要性上升,为预防提供了具体靶点。第四,基于树结构算法开发的线性评分系统较好地反映了预测因子间的交互模式,提高了模型的临床适用性。
研究也存在一些局限性,如糖尿病状态仅通过降糖药物使用定义、可能存在反向因果关系、缺乏肥胖指标和饮酒等潜在混杂因素信息、未能区分当前和既往吸烟状态、缺乏肝炎病毒血清学检测数据等。未来研究可考虑纳入更全面的变量,建立临床风险分层阈值,并验证模型在其他人群中的适用性。
综上所述,这项研究通过创新的树结构算法,系统揭示了糖尿病与非糖尿病人群肝癌风险因素的差异及其交互模式,开发了具有良好预测性能的评分系统,为糖尿病患者的肝癌风险分层和精准预防提供了重要工具。研究成果对优化肝癌防控策略、实现个体化风险管理具有重要价值。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号