
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于k均值聚类与模糊认知图的双阶段网络推理系统实现心血管疾病精准诊断
【字体: 大 中 小 】 时间:2025年07月05日 来源:Engineering Applications of Artificial Intelligence 7.5
编辑推荐:
语: 本研究针对心血管疾病(CVD)诊断中存在的症状重叠、个体差异及规则优化难题,提出一种结合k均值聚类、模糊认知图(FCM)和Mamdani模糊推理系统(MFIS)的双阶段网络推理模型。通过k均值聚类划分可干预/不可干预风险因子,FCM识别关键影响因子,并创新性构建双阶段规则生成网络,最终实现99.23%准确率、98.99%敏感性的高精度诊断。该成果发表于《Engineering Applications of Artificial Intelligence》,为临床提供高效、可解释的AI辅助决策工具。
心血管疾病(CVD)作为全球头号死因,每年导致约1790万人死亡,其早期诊断面临严峻挑战:症状存在个体差异且与其他疾病重叠(如糖尿病神经病变掩盖心绞痛),诊断测试存在假阳性/假阴性风险,肥胖等干扰因素影响检测准确性。传统多准则决策(MCDM)模型难以处理医疗不确定性,而模糊推理系统(FIS)虽能整合模糊信息,但规则数量随变量增长呈指数级膨胀——当存在n个输入变量时,规则总数达3n,导致计算复杂度激增、可解释性下降。
为突破这一瓶颈,研究人员开发了基于k均值聚类与模糊认知图(FCM)的双阶段网络推理系统。研究首先采用k均值聚类将35项CVD风险因子划分为可干预(如血压、胆固醇)与不可干预(如年龄、遗传)两类,通过轮廓系数分析确定最优聚类数k=2。随后利用FCM量化因子间因果关系:以专家赋权法构建权重矩阵,计算各因子中心度(如收缩压权重0.83、空腹血糖0.79),筛选出8项核心可干预因子。创新性设计双阶段规则生成网络:第一阶段整合核心因子的子类别(如血压分为收缩压/舒张压),生成初级规则;第二阶段加入生物因子(如肌钙蛋白水平),最终输出36条优化规则。这些规则输入Mamdani模糊推理系统(MFIS),通过去模糊化生成0-1的风险评分。
关键技术方法包括:1) 使用印度金奈心脏病学中心1250例临床数据集,包含年龄、血压、胆固醇等35维特征;2) k均值聚类实现风险因子分类;3) FCM量化因子因果关系;4) 双阶段规则网络压缩规则数(从理论57600条降至36条);5) MFIS结合高斯隶属函数与重心法去模糊化。
风险因子聚类结果
k均值聚类将风险因子划分为两类:可干预因子(血糖、LDLC等)与不可干预因子(年龄、性别)。轮廓系数0.68表明聚类效果显著,为后续规则分层奠定基础。
FCM中心度分析
通过因果权重矩阵计算,收缩压(0.83)、吸烟史(0.81)、空腹血糖(0.79)位列中心度前三,而BMI(0.43)、压力水平(0.39)影响较弱。证明血压与代谢指标为最关键干预靶点。
双阶段规则网络构建
第一阶段整合核心因子的子类别:收缩压/舒张压→高血压等级、LDLC/HDLC→血脂异常等级,生成24条初级规则。第二阶段加入hs-CRP(超敏C反应蛋白)、肌钙蛋白等生物标记物,扩展为36条诊断规则。例如:"IF收缩压>140 AND空腹血糖>126 AND hs-CRP>3mg/L THEN CVD风险=0.92"。
系统验证结果
采用十倍交叉验证显示:准确率99.23%(95%CI:98.7-99.8%)、敏感性98.99%、特异性95.76%。ROC曲线下面积(AUC)达0.996,显著优于单一FIS模型(AUC=0.92)和随机森林(AUC=0.95)。统计检验证实结果稳健性(p<0.001)。
该研究通过融合无监督学习(k均值聚类)、因果推理(FCM)与模糊逻辑(MFIS),首次实现CVD诊断规则的维度压缩与可解释性提升。双阶段网络将规则数减少99.94%,大幅降低计算负载(推理时间<0.5秒/案例),同时维持超高精度。临床意义在于:1) 为基层医疗提供快速筛查工具;2) 明确可干预靶点的优先级(血压>血糖>血脂);3) 生物标记物整合增强无症状患者识别能力。未来可扩展至其他多因素疾病诊断,推动精准医疗发展。
生物通微信公众号
知名企业招聘