基于混沌游戏表征与深度学习整合方法的葡萄全基因组测序遗传检测研究

【字体: 时间:2025年09月02日 来源:Bioinformatics Advances 2.8

编辑推荐:

  本研究针对葡萄品种鉴定中传统微卫星标记法的局限性,创新性地将混沌游戏表征(CGR)与深度学习相结合,开发了全基因组测序(WGS)分析新方法。研究人员通过构建4种模型整合策略(染色体级、早期整合、晚期整合和全基因组),在5个葡萄品种分类中达到99%平衡准确率,在41个栽培变种分类中达到80%准确率。该研究为作物遗传检测提供了高精度、低成本的互补性技术方案,特别解决了加拿大等地区检测服务可及性难题。

  

葡萄作为全球重要经济作物,其品种鉴定长期面临两大难题:一是传统形态学方法受限于近缘品种的细微差异,二是主流微卫星标记(SSR)技术仅能检测有限位点,难以区分克隆变种。随着测序技术发展,全基因组测序(WGS)虽能获取海量变异信息,但如何处理高达10GB/样本的数据成为新挑战。Andrew Vu团队在《Bioinformatics Advances》发表的研究,开创性地将数学领域的混沌游戏表征(CGR)与深度学习结合,为这一困境提供了创新解决方案。

研究团队开发了标准化生物信息学流程:从NCBI SRA和CNCB GSA数据库获取4,312份葡萄样本WGS数据,经BWA比对和bcftools变异检测后,将SNP和indel转换为伪DNA序列。通过CGR算法将序列映射为二维图像(A(0,0)、C(0,1)、G(1,1)、T(1,0)),采用Robust Scaler归一化处理。基于PyTorch框架,系统比较了ResNet18/101、VGG11_bn和ViT_b_16等模型在224×224至1024×1024分辨率下的表现,创新性地设计染色体级、早期整合、晚期整合和全基因组四种集成策略。

物种水平分类结果显示,晚期整合策略在1024×1024分辨率下取得99±2.4%平衡准确率(图3)。

比较发现,ResNet18显著优于ViT(0.947 vs 0.857),且全基因组图像分辨率提升使准确率提高12%(图4)。

栽培变种鉴定中,全基因组方法在512×512分辨率下对25%类别达到79.7%准确率(图5),

但Kmer-db(k=21)仍保持91%优势(表3),反映小样本场景下传统方法的稳定性。

研究结论指出,CGR能有效捕获全基因组变异模式,其与深度学习的结合突破了传统方法的标记数量限制。特别是晚期整合策略通过染色体模型投票机制,显著提升物种分类鲁棒性。该技术框架不仅适用于葡萄,也为其他作物遗传检测提供了新范式。未来工作将聚焦于克隆鉴定和可解释性研究,通过整合k-mer特征进一步提高分类精度。这项研究标志着作物基因组学进入"图像驱动"分析新阶段,对保障农业种质资源安全具有重要实践价值。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号