
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于Axiom SNP阵列数据的可视化倍性评估工具axiomFP.py开发及其在苹果种质资源分析中的应用
【字体: 大 中 小 】 时间:2025年09月04日 来源:in silico Plants 2.4
编辑推荐:
为解决Affymetrix Axiom SNP阵列缺乏倍性诊断工具的问题,研究人员开发了开源软件axiomFP.py。该工具通过标准化SNP位点频率图谱可视化分析,实现了混合倍性苹果种质的精准鉴定(准确率100%),为多倍体作物遗传研究提供了高效解决方案。
在植物遗传学研究领域,准确鉴定样本倍性水平是基因组分析的关键前提。传统流式细胞术(Flow Cytometry, FCA)虽可靠但耗时耗力,而主流SNP阵列平台中,Illumina Infinium可通过B等位基因频率(BAF)分析倍性,但Affymetrix Axiom阵列却长期缺乏相应功能。这一技术空白严重制约了苹果(Malus spp.)等常见混合倍性作物的研究效率——野生和栽培苹果种质中天然存在二倍体与三倍体混杂现象,若无法快速鉴别将导致后续关联分析、亲缘关系重建等研究产生系统性偏差。
来自波黑萨拉热窝大学的Almira Konjic团队在《in silico Plants》发表的研究,开发出名为axiomFP.py的开源工具,巧妙利用Axiom阵列输出的标准化SNP位点坐标数据,通过三重过滤算法生成频率分布图谱,首次实现了该平台的倍性可视化诊断。研究团队选取480K和50K两种苹果Axiom阵列数据验证,结果显示其鉴定结果与流式细胞术及已知品种倍性记录完全一致,为多倍体作物研究提供了"一图定倍性"的创新方案。
关键技术方法包括:1)使用Axiom Analysis Suite 4.0.3处理原始CEL文件,生成SNP统计数据和SNP位点对比坐标文件;2)基于Python 3.12.3开发分析流程,通过pandas库合并数据并应用三重过滤(缺失值剔除、纯合簇间距阈值、杂合簇坐标框架筛选);3)matplotlib库绘制标准化SNP位点频率分布图,通过峰值数量判断倍性(二倍体3峰、三倍体4峰)。测试样本包含52份波黑地方种质和13个国际对照品种(如二倍体'Topaz'、三倍体'Jonagold')。
结果
倍性诊断准确性验证
通过480K阵列分析13个已知倍性品种,axiomFP.py生成的频率图完美匹配文献记录:二倍体'Topaz'呈现典型三峰模式(图3A),三倍体'Jonagold'则显示四峰分布(图3B)。对波黑地方种质'Butulija'(二倍体)和'Prijedorska zelenika'(三倍体)的分析结果与FCA数据完全吻合(图3C-D),证实该方法在不同遗传背景下均具可靠性。
50K阵列的扩展应用
在包含982份种质(含野生近缘种)的50K数据分析中,软件成功识别出Malus sieversii(二倍体,图4A)等野生资源的倍性特征。值得注意的是,对于call rate较低(如M. baccata仅90.6%)或DNA质量差的样本(如'Cortland' call rate 93.7%),软件仍能生成可解读的图谱(图4D),为传统质控标准排除的样本提供了补救分析可能。
技术参数优化
测试表明至少需要5个CEL文件输入才能获得稳定结果(图5)。分析耗时与数据量正相关:480K阵列95样本约20分钟,50K阵列982样本需1小时,输出文件体积控制在10MB内,显示良好的可扩展性。
结论与讨论
该研究填补了Axiom平台倍性分析工具的技术空白,其创新性体现在:1)将复杂的BAF计算转化为直观的频率图谱;2)突破性兼容低质量样本分析;3)开源设计促进方法优化。特别对于苹果育种,软件能快速筛选核心种质中的天然三倍体(如果实更大的'Jonagold'),避免传统细胞学分析的瓶颈。未来可扩展至四倍体分析,并增加图像参数自定义功能。
研究结果再次验证了SNP阵列数据在倍性分析中的潜力——通过标准化坐标的数学转换,原本用于基因分型的数据产生了新的生物学价值。随着Axiom阵列在石榴、烟草等多倍体作物中应用扩大,axiomFP.py有望成为标准化分析流程的关键组件,其GitHub开源模式(https://github.com/allmiraria/axiomFP)更将加速工具的迭代升级。
生物通微信公众号
知名企业招聘