《Discover Plants》:AI assisted optimization of CRISPR Cas systems and functional gene screening in cucurbit crops
编辑推荐:
本文系统评述了人工智能(AI)与多组学技术如何赋能CRISPR/Cas系统,以克服sgRNA设计、脱靶效应等瓶颈,在黄瓜、西瓜、甜瓜等瓜类作物中实现抗病、品质改良与高效育种。通过整合深度学习模型(如DeepCRISPR)与组学数据(如WGCNA),文章构建了“靶点发现→AI设计→编辑验证”的智能工作流,并展现了全球(尤其中国团队)在此领域的突破性应用与未来挑战。
在当今农业生物技术的前沿,一场由人工智能(AI)驱动的革命正在深刻改变我们对作物遗传改良的认知与实践。尤其对于具有重要经济价值的瓜类作物——如黄瓜(Cucumis sativus)、西瓜(Citrullus lanatus)和甜瓜(Cucumis melo)——而言,其遗传改良长期受限于复杂的基因组、依赖基因型的转化效率以及关键性状的多基因本质。CRISPR/Cas基因组编辑系统的出现,为这些作物的功能基因验证和性状强化提供了变革性工具。然而,向导RNA(sgRNA)设计、脱靶效应和监管不确定性等挑战,依然阻碍着其广泛应用。近年来,人工智能驱动的模型与多组学技术正日益与CRISPR工作流整合,以应对这些挑战。AI工具提升了sgRNA活性和特异性的预测,使得编辑策略更为精准高效。同时,转录组、表观组和单细胞组学数据,促进了与果实品质、胁迫耐受和抗病性相关的功能基因的识别与优先排序。
AI辅助的CRISPR/Cas系统优化
CRISPR/Cas技术的编辑结果高度依赖于向导RNA(gRNA)的效率和特异性。在瓜类作物这类具有复杂基因组和低转化效率的物种中,设计最优gRNA至关重要。人工智能,特别是深度学习和机器学习(ML)模型,已成为优化CRISPR/Cas设计和实施流程每个阶段的强大工具。
在sgRNA活性预测方面,传统的基于序列启发式和有限数据集的算法往往难以跨物种推广。而基于大规模CRISPR数据集训练的AI模型,如DeepCRISPR、CRISPRon和CNN-SVR,利用卷积神经网络(CNN)自动从序列中提取复杂特征(如核苷酸组成、表观遗传背景),能够以更高的准确性和普适性预测sgRNA活性。这些模型可以为候选sgRNA分配活性分数,帮助研究者优先选择具有高编辑潜力的向导。例如,在黄瓜中为赋予白粉病抗性而靶向庞大的MLO基因家族时,AI辅助方法对于从13个同源基因中高效筛选和优先选择特异性高活性sgRNA至关重要。
脱靶效应是CRISPR应用中的主要顾虑之一。AI工具通过从实验数据集中学习并结合序列及表观遗传特征,显著改善了对潜在脱靶位点的预测。例如CRISPR-Net、Elevation等模型,利用循环神经网络(RNN)、注意力机制或支持向量机(SVM)来评估错配、PAM兼容性、DNA二级结构甚至染色质可及性。其中,RNN特别适合处理sgRNA-DNA双链体序列,能根据错配的位置和背景权衡其影响。新近的创新如PICRISPR,将DNA生物物理学特征(如螺旋扭转和沟宽)整合到脱靶风险评估中,在富含GC或重复区域显示出更高的准确性。这些工具被集成到sgRNA设计平台,使研究者能够基于活性和特异性双重标准筛选向导,这对于存在多基因家族同源序列的瓜类作物尤为重要。
此外,机器学习模型也被用于预测Cas9切割后的DNA修复结果,包括移码突变与框内编辑的概率,从而在目标是基因敲除或精确等位基因调控时实现更理性的设计。图形神经网络(GNN)等新兴框架通过将sgRNA-靶点对建模为图形结构,以考虑三维基因组架构和复杂的核苷酸相互作用,为在植物基因组中识别增强子-启动子环等调控元件提供了新思路。
CRISPR/Cas在瓜类作物中的应用
CRISPR/Cas系统已在多种瓜类作物中成功部署,用于探索基因功能和改良农艺性状。
在黄瓜中,针对转录因子CsWIP1的CRISPR/Cas9敲除,实现了向完全雌性花的转化,显著提高了杂交制种效率。另一个重要应用涉及病毒易感因子eIF4E基因,其编辑后的缺陷型品系赋予了针对ZYMV和PRSV等病毒的广谱抗性。最近,CRISPR被用于剖析果实表皮性状的遗传决定因素,并同时敲除CsMLO基因家族的13个成员,实现了持久白粉病抗性且无适应度代价。
在西瓜中,编辑其CsWIP1的同源基因ClWIP1,同样产生了雌性或两性花,为西瓜这种传统上需要人工授粉的作物开辟了高效杂交制种途径。CRISPR还实现了对糖分积累通路的功能解析,编辑转录因子ClNAC68的突变体果实糖含量显著降低,揭示了其在决定甜度中的核心作用。此外,对涉及褪黑素合成的咖啡酸O-甲基转移酶基因(ClCOMT1)的敲除,为解析代谢与胁迫性状关联提供了功能证据。
甜瓜曾是稳定转化和基因编辑最困难的瓜类之一,但近期CRISPR/Cas9和碱基编辑的进展正在突破这些限制。最初的验证性研究通过编辑CmPDS基因获得白化表型。更具影响力的研究是使用胞嘧啶碱基编辑器精准修改eIF4E基因中的单个核苷酸,在不引入双链断裂的情况下产生了抗病毒甜瓜品系。这为在难转化瓜类中应用更精确、非转基因的编辑方法提供了路径。
多组学与功能基因筛选方法
CRISPR/Cas技术的全部潜力,关键在于选择正确的靶点。对于瓜类这类具有庞大复杂基因组的作物,许多农艺性状由涉及编码区和调控元件的多基因网络控制。因此,功能基因发现需要整合基因组、转录组、表观组和蛋白质组数据的综合方法。
共表达网络分析(如WGCNA)通过将基因聚类为共表达模块,并将模块与表型性状关联,可用于识别具有广泛调控控制的“枢纽基因”。例如,在黄瓜盐胁迫转录组数据构建的共表达网络中,钾转运蛋白基因CsAKT1被鉴定为盐响应模块的核心枢纽,后续的CRISPR敲除验证了其在耐盐性中的关键作用。
表观基因组学见解,如ATAC-seq,允许绘制开放染色质区域图,这些区域通常对应活跃的启动子、增强子和转录因子结合位点。在黄瓜中,病原体攻击下的叶片组织在防御相关基因座显示染色质开放,这些区域成为CRISPR干扰(CRISPRi)或碱基编辑以微调基因表达的优选候选。同样,DNA甲基化谱分析揭示了甜瓜果实成熟和贮藏期性状相关的区域,为精准表观遗传调控提供了新途径。
单细胞RNA测序(scRNA-seq)和空间组学提供了细胞水平基因活性的前所未有的分辨率。在拟南芥和番茄中,scRNA-seq已被用于表征根和果实的发育轨迹,识别出新的调控基因。尽管受限于组织可及性和原生质体分离难度,瓜类正进入单细胞时代。将单细胞数据整合到基因编辑工作流中,允许进行更具针对性的操作。
真正的力量在于整合。对于果实香气、抗病性或胁迫耐受性等复杂性状,没有任何单一数据层是足够的。人工智能模型越来越多地用于执行这种整合。例如,基于知识图的方法和图神经网络可以从多组学数据中预测调控层次,为编辑建议最优靶点。同时,高通量基因组编辑平台的兴起,使得能够快速验证多组学衍生的假设。这种协同——组学预测,CRISPR验证——代表了瓜类功能基因组学的未来。
挑战与未来展望
尽管在瓜类作物中应用CRISPR/Cas系统和AI辅助基因组技术取得了显著进展,但仍存在一些技术、生物学和转化方面的挑战。瓜类基因组编辑的主要限制之一是低转化和再生效率,特别是在西瓜和甜瓜的优良栽培品种中。虽然黄瓜已受益于相对稳健的规程,但其他瓜类的许多商业品系在农杆菌介导的转化过程中表现出强烈的基因型依赖性、组织坏死或愈伤组织诱导不良。尽管形态发生调节因子(如WUS、BBM)的加入在其他作物中显示出前景,但这些技术在瓜类中仍在优化中。
另一个挑战是编辑精度。嵌合体、脱靶效应和不可预测的插入缺失模式——特别是在非编码或调控靶点中——可能阻碍表型解读。虽然碱基编辑和先导编辑提供了更精细的替代方案,但其在瓜类中的效率仍然相对低于模式作物。此外,将CRISPR试剂递送到特定细胞类型或发育阶段仍然不精确,限制了编辑的空间控制。
随着多组学数据集的激增,挑战日益从数据生成转向数据整合与解读。识别多基因性状(如耐旱性或果实风味)的致病基因,需要综合异质数据类型:转录组谱、代谢流、染色质可及性和序列变异。整合此类数据的工具——特别是在具有可变倍性和复杂基因家族的作物中——仍在成熟中。
全球对基因组编辑作物的监管环境仍然分散且动态变化。在诸如美国、日本和巴西等国家,不含外源DNA的CRISPR编辑植物通常不受转基因法规约束。然而,在许多司法管辖区——包括欧盟——法规仍在审查中,不确定性阻碍了商业开发和农民采用。公众认知是另一个关键因素。尽管基因编辑通常比转基因修饰更受青睐,特别是在编辑模拟自然突变时,但对食品安全、环境影响和伦理问题的担忧依然存在。
展望未来,基因组编辑与AI和多组学的整合,可能在未来十年重新定义植物育种的方式。愿景是建立智能育种管道,其中高通量基因分型和表型分析输入机器学习模型,以预测最优基因靶点、编辑策略和性状组合。在这种场景下,CRISPR系统——特别是碱基编辑器和先导编辑器——不仅用于敲除有害等位基因,还用于安装通过关联作图和深度学习识别出的有利等位变异。同时,全基因组调控图谱将允许通过靶向编辑启动子、增强子和表观遗传标记来调节基因表达。
这种精确性将得到基于图的泛基因组的支持,这些基因组捕捉了不同栽培品种间的结构变异和基因存在/缺失变异。这在瓜类中尤其相关,因为结构变异常常是果实性状和抗病基因座的基础。此外,AI设计的多重编辑策略可能允许同时微调多个性状。最后,新型平台,如植物体内CRISPR递送、RNA引导的表观基因组调控和细胞游离生物传感器,可能有助于绕过当前的转化瓶颈,并实现编辑后的实时性状监测。
总之,CRISPR/Cas技术、人工智能和多组学分析的融合正在重塑瓜类作物改良的格局。尽管技术和监管挑战依然存在,但创新速度的加快——尤其在中国——预示着一个未来,即智能基因组编辑不仅变得可行,而且将成为可持续高效育种的基础。随着数据生成、算法开发和生物学洞察力继续齐头并进,瓜类作物将受益于满足21世纪农业需求的精准、可预测且公众可接受的编辑策略。