基于随机对比学习协同粒子群优化的交互式特征选择新方法CPSORCL及其在GWAS中的应用

《Big Data Mining and Analytics》:CPSORCL: A Cooperative Particle Swarm Optimization Method with Random Contrastive Learning for Interactive Feature Selection

【字体: 时间:2025年12月19日 来源:Big Data Mining and Analytics 6.2

编辑推荐:

  本研究针对全基因组关联分析(GWAS)中高阶SNP交互作用检测难题,提出了一种融合自适应随机对比学习、特征权重引导翻转和深度搜索策略的协同粒子群优化方法CPSORCL。该方法在模拟数据集和AMD真实数据集上验证显示,能有效识别二至三阶SNP交互作用,显著提升检测效能与计算效率,为解析复杂疾病遗传机制提供新工具。

  
在遗传学研究中,复杂疾病如年龄相关性黄斑变性(AMD)的发病机制往往涉及多个基因位点的协同作用。全基因组关联研究(GWAS)作为探索基因-表型关联的重要工具,虽已鉴定出大量疾病相关单核苷酸多态性(SNP),但传统方法主要关注单个SNP的独立效应,难以捕捉SNP间非线性的交互作用(epistasis),这导致遗传力缺失(missing heritability)问题长期悬而未决。尤其当交互作用阶数升高时,搜索空间呈指数级增长,使得检测工作面临巨大计算挑战。
现有SNP交互作用检测方法主要包括穷举搜索、随机搜索、机器学习和群体智能优化四类。穷举法虽精度高但计算成本巨大;随机搜索易遗漏关键SNP;机器学习方法可解释性差;而群体智能算法如粒子群优化(PSO)和蚁群优化(ACO)虽显示出潜力,但在处理大规模数据和高阶交互时性能显著下降。这些局限性促使研究人员探索更高效的检测策略。
为解决上述问题,曲阜师范大学李亚晗等人开发了CPSORCL方法,该工作发表于《Big Data Mining and Analytics》。该方法通过三大创新策略提升检测性能:自适应随机对比学习策略动态调整粒子群拓扑结构,促进粒子间竞争合作;特征权重引导翻转策略基于互信息(MI)量化SNP与表型关联度,平衡全局探索与局部搜索;深度搜索策略结合禁忌表机制,系统挖掘多阶SNP交互作用。
关键技术方法包括:基于互信息的目标函数评估SNP交互作用强度;自适应随机对比学习动态构建粒子邻域拓扑;特征权重引导的位点翻转概率调整;以及针对高权重SNP候选集的深度搜索策略。实验采用模拟数据集(包含16种二、三阶交互模型)和真实AMD数据集(含103611个SNP和146个样本),以检测效能(Power)和运行时间(Time)作为评价指标。
模拟数据验证结果
在二阶SNP交互检测中,CPSORCL的检测效能显著优于IOBLPSO、SIPSO等7种对比方法(图3),且运行时间保持合理范围(图4)。对于三阶交互,CPSORCL在多数模型中获得最高Power值(图5),同时维持较低时间复杂度(图6)。多阶交互检测实验进一步显示,该方法能系统识别Data100、Data500等数据集中一至三阶致病SNP组合(表1),并通过禁忌表策略避免强效应SNP的干扰,实现交互作用的渐进式挖掘(图7)。
消融实验分析
通过对比CPSORCL与其变体(去除对比学习策略w/o CLS、去除翻转与深度搜索策略w/o FS and DS、仅去除深度搜索策略w/o DS)的性能(图8-9),证实三大策略均对检测效能提升有重要贡献。其中特征权重引导与深度搜索策略对识别显著性SNP作用尤为关键,而对比学习策略则有效增强粒子群多样性。
真实数据集应用
在AMD数据集分析中,CPSORCL成功识别出10组关键二、三阶SNP交互作用(表2-3)。其中rs380390(CFH基因)在多数交互中起主导作用,与rs1363688、rs2402053等SNP形成的组合已被既往研究证实与AMD相关。新发现的交互涉及MED27、CSMD1等肿瘤相关基因,以及SDK1、PDE5A等神经与心血管疾病基因,为AMD多基因致病机制提供新线索。
研究结论表明,CPSORCL通过协同优化框架有效解决了GWAS中高阶SNP交互检测的瓶颈问题。其自适应机制保障了算法在不同数据集上的鲁棒性,而深度搜索策略则突破传统方法对交互阶数的限制。尽管在处理极高阶交互时仍存在计算复杂度挑战,但该方法为解析复杂疾病遗传架构提供了新范式,未来通过算法优化有望进一步拓展其应用边界。该研究的开源代码(https://github.com/CDMBlab/CPSORCL)将促进方法在遗传学研究中的普及与应用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号