
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于秩稀疏神经网络的混合结局联合建模方法及其在皮肤黑色素瘤研究中的应用
【字体: 大 中 小 】 时间:2025年07月10日 来源:Journal of Biomedical Informatics 4.0
编辑推荐:
针对高维生物医学数据中混合结局(含生存数据)联合建模的难题,研究团队提出创新性秩稀疏神经网络(Rank-based Sparse Neural Network),通过构建统一秩损失函数解决梯度失衡问题,开发稀疏层实现特征选择。在皮肤黑色素瘤(SKCM)数据分析中展现出优越性能,为癌症基因组研究提供新范式。
随着高通量测序技术的成熟,癌症研究面临高维基因组数据与小样本量的矛盾。传统方法对包含生存时间、连续变量和分类变量的混合结局建模存在局限:参数假设过强、梯度失衡导致训练困难、损失函数度量不统一。这些问题严重制约了皮肤黑色素瘤(SKCM)等复杂疾病的多组学整合研究。
厦门大学的研究团队在《Journal of Biomedical Informatics》发表创新成果,提出秩稀疏神经网络框架。该方法突破性地采用秩相关统一不同结局的损失度量,通过自适应稀疏层实现高维特征选择,在SKCM肿瘤微环境(TME)研究中成功识别关键基因组特征。研究证实该方法预测准确率较传统方法提升显著,为癌症异质性研究提供新工具。
关键技术包括:1) 构建混合结局联合建模框架(含生存数据);2) 开发基于Kendall秩相关的统一损失函数;3) 设计L1正则化稀疏层实现自动特征选择;4) 采用TCGA皮肤黑色素瘤队列(n=400+)验证性能。
【Problem setting and implementation】
建立包含二分类(|R1|)、连续型(|R2|)和生存结局(|R3|)的联合模型,通过神经网络隐层捕获协变量Xi∈?p与多结局Yi∈?q的非线性关系。创新点在于将传统线性加权损失替换为秩相关系数优化目标。
【Simulation study】
在ρ=0.25-0.75的AR(1)协方差结构下,p=100-200维时该方法特征选择准确率达92%,较MTL-Net提升23%。特别在|R3|=1的生存数据场景下,C-index提高0.15。
【Skin cutaneous melanoma data analysis】
应用TCGA-SKCM数据集(含Buffa缺氧评分、转移状态和OS时间),识别出HIF1A、VEGFA等20个核心基因,其通路富集与TME缺氧特征高度吻合(p<0.001)。
【Discussion】
该研究突破性地解决了混合结局建模三大瓶颈:1) 通过秩转换实现损失函数无量纲化;2) 利用梯度归一化消除任务失衡;3) 稀疏层保证高维可解释性。方法学创新为癌症基因组学、药物靶点发现等研究提供普适性分析框架。
研究获得国家自然科学基金(72071169)等资助,相关算法已封装为Python开源工具包。未来可扩展至单细胞多组学整合分析领域,为精准医疗提供新方法学支撑。
生物通微信公众号
知名企业招聘