MuPETFlow:从流式细胞术数据中精准估算多倍体的创新工具

【字体: 时间:2025年03月27日 来源:BMC Genomics 3.5

编辑推荐:

  在多倍体(Ploidy)估算中,现有流式细胞术(FC)数据分析工具存在局限,如专有软件需付费、开源软件缺乏图形用户界面(GUI)或操作复杂。研究人员开发了 MuPETFlow 工具,可自动化多样本 FC 数据的多倍体估算,结果准确且高效,对大规模数据集分析意义重大。

  在生命科学的微观世界里,细胞的多倍体现象就像一场神秘的 “染色体派对”。多倍体(Ploidy)代表着细胞中同源染色体的组数,这一特性在酵母、植物等生物中广泛存在,对生物的遗传、进化和育种研究有着重要意义。想要揭开多倍体的神秘面纱,流式细胞术(FC)是一项得力工具,它能通过测量用荧光 DNA 染料染色的单细胞荧光,来推断细胞的多倍体状态和基因组大小。
然而,目前用于 FC 数据分析的工具却不尽人意。专有软件往往与设备绑定或需要付费,这让不少科研人员望而却步;而开源软件虽然免费,但大多缺乏友好的图形用户界面,需要编写脚本,这对于一些不熟悉编程的科研人员来说,无疑是一道难以跨越的门槛。比如 Cytoflow 和 flowPloidy 这两款开源工具,虽然提供了图形界面,但在操作上仍存在诸多不便,无法满足科研人员高效、精准分析数据的需求。在这样的背景下,来自法国索邦大学(Sorbonne Université)、法国国家科学研究中心(Centre National de la Recherche Scientifique,CNRS)的实验室(Laboratory of Computational, Quantitative and Synthetic Biology,CQSB)的研究人员 C. Gómez-Mu?oz 和 G. Fischer 决定研发一款新的工具,来打破这一困境。

他们研发的 MuPETFlow(Multiple Ploidy Estimation Tool from Flow cytometry data),就像是为 FC 数据分析量身定制的 “智能助手”。这款工具基于 R 语言的 Shiny 框架开发,拥有简洁易用的图形用户界面,操作流程分为三个主要模块:“Peaks”“Regression”“Summary”。在 “Peaks” 模块,研究人员可以轻松上传多个本地的流式细胞术标准(FCS)文件,软件会自动扫描文件中的可用通道,并生成样本的直方图。利用局部最大值算法,它还能精准地检测出峰值,并且用户可以根据需求调整平滑度、窗口宽度等参数。在 “Regression” 模块,MuPETFlow 能够基于外部标准进行线性回归,从而估算多倍体或基因组大小。最后,在 “Summary” 模块,研究人员可以预览生成的所有直方图,并将结果保存为图片或表格文件。

为了验证 MuPETFlow 的性能,研究人员进行了一系列实验。他们首先利用新生成的酿酒酵母(S. cerevisiae)FC 数据进行基准测试,对两种酿酒酵母多倍体 CRE 和 AVQ 的多倍体状态进行估算。结果显示,MuPETFlow 估算的多倍体均值与预期相符,即使在不同实验条件下分析样本,它也能准确估算多倍体。随后,研究人员将 MuPETFlow 与其他工具进行比较,分析相同的酿酒酵母生物重复数据集。虽然在峰值荧光上,MuPETFlow 与 flowPloidy 存在显著差异,但最终估算的多倍体值在三款工具间并无差异。而且,MuPETFlow 的自动化能力十分出色,在估算 20 种酿酒酵母多倍体菌株的多倍体时,它能快速完成任务,总用户时间不到 2 秒。

除了酿酒酵母,研究人员还利用其他物种的已发表数据对 MuPETFlow 进行测试。在利用酿酒酵母(S. pastorianus)数据集进行基因组大小估算时,MuPETFlow 得到的结果与之前的估算值相近;在分析辣椒(S. pseudocapsicum)数据集时,它能准确检测出多倍体峰值,与之前报道的结果一致。此外,研究人员还创建了混合倍性数据集进行测试,结果表明 MuPETFlow 能够检测出低至 1% 比例的单倍体群体和 5% 比例的二倍体群体的多倍体状态。

综合这些研究结果,MuPETFlow 是一款功能强大、易于使用的多倍体估算工具。与其他工具相比,它不仅实现了多个分析步骤的自动化,还具备独特的多峰值检测能力,能够在同一工具内完成多倍体或基因组大小的计算。这一工具的出现,大大加速了多倍体分析的流程,对于涉及大量数据集的研究项目来说,具有极高的价值。它为生命科学领域中多倍体相关的研究提供了更高效、准确的分析手段,有望推动该领域的进一步发展。

在研究过程中,研究人员用到的主要关键技术方法包括:使用 R 语言的 Shiny 框架开发 MuPETFlow 软件;利用流式细胞术获取酵母和植物细胞的荧光数据;通过线性回归方法估算多倍体和基因组大小;运用配对威尔科克森符号秩精确检验(paired Wilcoxon signed rank exact test)比较不同工具分析结果的差异。

研究结果主要包括:

  • 基准测试:通过对酿酒酵母多倍体 CRE 和 AVQ 的 FC 数据进行分析,MuPETFlow 能准确估算多倍体,且不同实验样本估算结果一致。与其他工具比较,虽然峰值荧光有差异,但最终估算的多倍体值无差异,同时 MuPETFlow 自动化能力强,处理 20 个样本总用户时间不到 2 秒。
  • 其他物种和混合倍性样本测试:在分析酿酒酵母(S. pastorianus)和辣椒(S. pseudocapsicum)的数据集时,MuPETFlow 在基因组大小估算和多倍体检测上结果准确。在混合倍性样本测试中,能检测出低比例的单倍体和二倍体群体的多倍体状态。

研究结论和讨论部分表明,MuPETFlow 是目前唯一一款能在应用程序内直接、高效地对大量样本进行多倍体或基因组大小计算的工具,它独特的多峰值检测功能,使其在酵母和植物等物种的研究中具有显著优势,为相关领域的科研工作提供了极大便利,推动了多倍体研究的发展,有望在更多物种的多倍体分析中发挥重要作用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号