基于性状的芝麻开花候选基因识别及CRISPR/Cas9靶标筛选

《Plant Gene》:Trait-guided identification of candidate flowering gene and CRISPR/Cas9 target prioritization in sesame (Sesamum indicum L.)

【字体: 时间:2026年06月14日 来源:Plant Gene 1.6

编辑推荐:

  Rakhi Kumari印度本地治里邦本地治里大学生物技术系摘要芝麻(Sesamum indicum L.)农艺性状的改良依赖于识别功能重要的基因并应用精准的基因组编辑技术。在本研究中,采用以性状为引导的计算策略,通过多变量形态学特征分析来确定与开花相关的过程,从而为后续CRIS

  
Rakhi Kumari
印度本地治里邦本地治里大学生物技术系

摘要

芝麻(Sesamum indicum L.)农艺性状的改良依赖于识别功能重要的基因并应用精准的基因组编辑技术。在本研究中,采用以性状为引导的计算策略,通过多变量形态学特征分析来确定与开花相关的过程,从而为后续CRISPR/Cas9靶点选择提供依据。研究使用基于Python的工作流程分析了13个数量性状,结果发现与开花相关的性状在主成分中占有重要地位,且这些性状之间存在较高的相关性。基于这些多变量关联关系,选出了一个与开花相关的候选基因(SIN_1017333)作为后续CRISPR/Cas9靶点分析的对象。通过CRISPOR工具生成了44个sgRNA候选序列,并对其效率、特异性以及潜在的脱靶效应进行了评估。其中3个sgRNA具有很高的特异性,且脱靶风险极低,被选为进一步研究的对象。所有被选中的引导序列都位于编码区域,这表明它们适合作为未来功能基因组编辑研究的候选靶点。总体而言,本研究构建了一个可重复的计算框架,将多变量表型分析与基于生物学原理的CRISPR/Cas9靶点选择相结合,用于芝麻的改良。

引言

芝麻(Sesamum indicum L.)是一种重要的油料作物,因其高品质的油脂以及能够在多种农业生态条件下生长而备受重视(Bedigian, 2003; Weiss, 2000)。尽管其具有重要的经济价值,但由于遗传变异有限,以及与产量和生长相关的农艺性状的遗传机制较为复杂,其在遗传改良方面的进展相对缓慢(Dossa et al., 2017; Zhang et al., 2018; Wang et al., 2016)。在这些农艺性状中,开花时间对作物的适应性起着核心作用,因为它会影响作物的生长周期、繁殖成功率以及整体生产力。
形态学性状仍然是评估作物种质资源变异性的实用且可靠的方法,因为它们反映了遗传因素和环境因素的共同作用(Mohammadi and Prasanna, 2003; Tripathi et al., 2013)。当同时分析多个性状时,多变量统计方法能够更全面地了解变异情况以及各性状之间的关联关系。主成分分析(PCA)和相关性分析等方法被广泛用于识别关键影响性状并简化复杂的数据库(Jolliffe, 2002; Crossa and Franco, 2004; Yan and Kang, 2003)。在芝麻研究中,这些方法也多次指出,与开花相关的性状对于决定作物的变异模式和适应性具有重要意义(Banerjee and Kole, 2006; Pandey et al., 2015; Gupta et al., 2021; Mehdizadeh et al., 2022)。
与此同时,计算生物学和基因组编辑技术的进步为将表型观察结果与有针对性的遗传改良相结合提供了新的机会。CRISPR/Cas9系统已成为一种高效的基因组修饰工具,能够实现对与重要农艺性状相关的基因进行精确改造(Jinek et al., 2012; Cong et al., 2013; Hsu et al., 2014; Bortesi and Fischer, 2015)。不过,这类方法的成功实施取决于对候选基因的精心筛选,以及特定单引导RNA(sgRNA)的设计,而这些都可以通过CRISPOR之类的计算平台来进行评估(Haeussler et al., 2016)。
将表型分析与候选基因识别相结合,能为作物改良提供更为有针对性的方法。以往在作物领域的计算CRISPR研究主要侧重于基因组注释、序列保守性分析或基因家族信息筛选,以此确定候选靶点(Jaganathan et al., 2018; Uniyal et al., 2019)。而本研究则采用了以性状为引导的框架,首先通过多变量表型分析找出那些对整体变异有显著贡献且具有协同生物学意义的与开花相关的性状,再利用这些性状关联来为PEBP/MFT家族中的一个与开花相关的候选基因(SIN_1017333)的优先级排序提供依据,进而开展后续的CRISPR/Cas9靶点分析。
虽然本研究并未提出新的基因组编辑算法,但它展示了如何将表型证据与计算得到的sgRNA评估结果相结合,从而为芝麻的靶点选择提供基于生物学的指导。通过将多变量性状分析、候选基因筛选以及sgRNA检测相结合,本研究提出了一种以表型为导向的策略,有望提升计算基因组编辑技术在作物改良中的应用价值。
尽管基于PCA的表型分析和CRISPR靶点设计分别是成熟的独立技术,但将它们整合到以性状为引导的框架中,或许能为确定芝麻中与关键农艺过程相关的具有生物学意义的候选基因提供有效的筛选策略。因此,本研究探索了一种概念验证型的计算工作流程,将多变量性状分析与sgRNA优先级排序相结合。

章节节选

表型数据集与实验设计

本研究使用了38份芝麻(Sesamum indicum L.)样本的表型数据。共选择了13个数量性状进行统计分析,包括:从花序开始形成到开花所需天数(DFI)、从开始开花到50%花朵开放所需天数(DHF)、从开始开花到全部花朵开放所需天数(DFF)、从花序开始形成到结荚所需天数(DPI)、植株高度(PH)、每株植物的主枝数量(NPB)、蒴果长度(CL)、每株植物的蒴果数量(NCP)、每株植物的产量(YPP)、千粒重(TSW)、叶片长度(LL)、叶片宽度(LW)以及叶柄长度。

结果

通过多变量分析,利用形态学性状分析确定了与开花相关的关键性状。这些性状为候选基因的选择提供了依据,随后通过CRISPOR工具设计了sgRNA,并根据特异性、效率以及脱靶情况对候选序列进行了筛选,最终得到了高质量的引导RNA。
主成分分析(图2)显示,有三个特征值大于1的主成分,解释了总变异量的79.10%。第一个主成分(PC1)

讨论

本研究的结果强调了与开花相关的性状在决定芝麻表型表现中的重要性。虽然这些性状的变异系数相对较低,但它们在主成分中占有重要地位,且彼此之间具有较高的相关性,这说明这些性状的表达存在一定的协同性。由于与开花相关的性状始终对表型变异的主要成分有着重要贡献,因此它们被视为具有生物学意义的指标。

结论

本研究构建了一个基于性状的计算框架,用于将芝麻的表型分析与基因组编辑技术相结合。研究结果表明,由于与开花相关的性状具有稳定的表达模式和较强的相互关联性,因此可作为基于性状的靶点优先级选择的有效指标。候选基因SIN_1017333及其对应的高质量sgRNA的识别,为未来的实验性基因组编辑研究奠定了计算基础。

人工智能工具的应用

作者使用ChatGPT(OpenAI,GPT-5.3)对文本进行了编辑,以提高可读性。该工具并未用于数据分析、结果生成或科学解读。本文中所呈现的所有结果和结论均为作者的原创成果。

CRediT作者贡献声明

Rakhi Kumari: 文章撰写——审阅与编辑,文章撰写——初稿编写,结果验证,软件应用,方法设计,实验研究,正式分析,数据整理,概念构思。

资金支持

本研究没有获得任何资金支持。

利益冲突声明

作者声明,自己不存在任何可能影响本文研究结果的已知财务利益关系或个人关系。
相关新闻
生物通微信公众号
微信
新浪微博

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号