
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于混沌游戏表征与深度学习整合方法的葡萄全基因组测序遗传检测研究
【字体: 大 中 小 】 时间:2025年09月02日 来源:Bioinformatics Advances 2.8
编辑推荐:
本研究针对葡萄品种鉴定中传统微卫星标记法的局限性,创新性地将混沌游戏表征(CGR)与深度学习相结合,开发了全基因组测序(WGS)分析新方法。研究人员通过构建4种模型整合策略(染色体级、早期整合、晚期整合和全基因组),在5个葡萄品种分类中达到99%平衡准确率,在41个栽培变种分类中达到80%准确率。该研究为作物遗传检测提供了高精度、低成本的互补性技术方案,特别解决了加拿大等地区检测服务可及性难题。
葡萄作为全球重要经济作物,其品种鉴定长期面临两大难题:一是传统形态学方法受限于近缘品种的细微差异,二是主流微卫星标记(SSR)技术仅能检测有限位点,难以区分克隆变种。随着测序技术发展,全基因组测序(WGS)虽能获取海量变异信息,但如何处理高达10GB/样本的数据成为新挑战。Andrew Vu团队在《Bioinformatics Advances》发表的研究,开创性地将数学领域的混沌游戏表征(CGR)与深度学习结合,为这一困境提供了创新解决方案。
研究团队开发了标准化生物信息学流程:从NCBI SRA和CNCB GSA数据库获取4,312份葡萄样本WGS数据,经BWA比对和bcftools变异检测后,将SNP和indel转换为伪DNA序列。通过CGR算法将序列映射为二维图像(A(0,0)、C(0,1)、G(1,1)、T(1,0)),采用Robust Scaler归一化处理。基于PyTorch框架,系统比较了ResNet18/101、VGG11_bn和ViT_b_16等模型在224×224至1024×1024分辨率下的表现,创新性地设计染色体级、早期整合、晚期整合和全基因组四种集成策略。
物种水平分类结果显示,晚期整合策略在1024×1024分辨率下取得99±2.4%平衡准确率(图3)。


栽培变种鉴定中,全基因组方法在512×512分辨率下对25%类别达到79.7%准确率(图5),

研究结论指出,CGR能有效捕获全基因组变异模式,其与深度学习的结合突破了传统方法的标记数量限制。特别是晚期整合策略通过染色体模型投票机制,显著提升物种分类鲁棒性。该技术框架不仅适用于葡萄,也为其他作物遗传检测提供了新范式。未来工作将聚焦于克隆鉴定和可解释性研究,通过整合k-mer特征进一步提高分类精度。这项研究标志着作物基因组学进入"图像驱动"分析新阶段,对保障农业种质资源安全具有重要实践价值。
生物通微信公众号
知名企业招聘