综述:整合机器学习与功能基因组学,研究跨物种基因调控的进化机制

《Current Opinion in Genetics & Development》:Integrating machine learning and functional genomics to study cross-species gene regulatory evolution

【字体: 时间:2025年12月23日 来源:Current Opinion in Genetics & Development 3.6

编辑推荐:

  基因调控进化研究需整合比较基因组学、高通量实验及机器学习模型,重点解析顺式调控元件(CREs)的序列差异与功能关联。目前通过跨物种RNA测序和报告基因阵列(MPRA)等技术已揭示部分表达差异及调控元件变异规律,但复杂的多调控元件协同作用仍难以解析,未来需发展更高预测精度的AI模型以应对海量进化数据挑战。

  
Erin N Gilbertson | Steven K Reilly
耶鲁大学医学院遗传学系,美国康涅狄格州纽黑文市
自达尔文时代以来,理解物种间表型差异的遗传基础一直是进化生物学的长远目标。尽管最近哺乳动物基因组的测序工作提供了前所未有的物种间序列差异清单,但绝大多数差异存在于非编码区域,在这些区域将遗传变化与具体功能联系起来仍然具有挑战性。顺式调控元件(CREs)通过组合性、冗余性和依赖于上下文的相互作用来控制基因表达,这些特性使得它们容易发生进化变化,同时也使得其基因调控逻辑难以解读。比较基因组学、跨物种功能分析以及高通量干扰实验的最新进展已经开始揭示基因表达和CRE功能的物种间差异。与此同时,基于这些数据训练的机器学习方法也开始能够仅从DNA序列预测顺式调控活性的差异。本文重点介绍了在实验和计算策略方面的最新进展,以研究基因调控的进化过程。

引言

非编码顺式调控元件(CREs)由于其模块化、冗余性和功能灵活性,在进化适应中起着核心作用,这使它们能够响应选择压力而进化1, 2••, 3, 4。尽管不同物种间的序列差异很多,但由于单个CRE的调控逻辑具有组合性和依赖性,且多个CRE可以共同调控同一基因1, 5,因此这些差异往往难以进行明确的功能解释。
本文综述了最近的研究进展,并强调了实验方法和计算方法之间的关键互动,认为两者的结合为更深入理解基因组调控的进化提供了重要机会。首先,我们探讨了比较基因组学在识别潜在功能位点方面所起的作用;其次,讨论了研究基因表达变异的方法;最后,分析了调控元件及其变异效应的直接表征(图1)。我们强调了基于跨物种数据训练的计算和机器学习(ML)方法在揭示CRE调控规则及其进化变异功能影响方面的作用。

利用系统发育信息进行比较调控基因组学研究

通过对不同物种基因组的测序和比较,我们获得了关于基因组进化的重要见解,包括保守和差异序列的识别6••, 7••。最近的比较基因组学研究主要集中在基因组的非编码区域,以揭示进化模式。例如,尽管人类和黑猩猩的序列同源性约为99%,但这两种物种之间仍存在数千万个碱基对的差异[8]。通过这些研究,

跨物种基因表达和CRE的谱系分析

由于相对容易操作,比较RNA测序技术已经绘制出了跨物种、组织和细胞类型的功能差异图谱2••, 30。例如,在人类、恒河猴、小鼠和大鼠的肝脏中进行的大规模RNA-seq分析显示,灵长类动物的表达模式相对保守,这突显了不同谱系在转录分化方面所面临的特定进化压力[31]。然而,这类方法可能会掩盖细胞

用于比较调控基因组学的高通量功能分析

大规模并行报告基因组分析(MPRA)和基于CRISPR的筛选技术能够直接实验性地分析CRE及其内部变异的功能效应57, 58。这些方法主要用于研究人类调控序列及其变异,而涉及跨物种或进化背景的研究相对较少(图1c)。
MPRA可以同时测量数千个DNA序列的功能影响,包括

面临的挑战与未来方向

在未来,当每个物种都拥有高质量的基因组,并且任何CRE突变的功能影响都能被预测时,需要解答的进化问题将变得非常多。目前已有数百个物种的基因组数据可供研究;挑战在于识别众多的调控差异并预测序列变异的功能影响。

结论

总体而言,要理解调控进化对表型的影响,需要将高通量功能分析与可扩展的计算模型相结合。能够预测进化序列变化在细胞类型、发育过程和物种间功能影响的先进模型,可能带来革命性的影响,甚至超过这些模型所基于的高通量实验研究本身对该领域产生的影响。

关于写作过程中使用生成式AI和AI辅助技术的声明

在撰写本综述时,作者使用了耶鲁大学内部的ChatGPT(OpenAI,GPT-4o模型)来辅助语言编辑、整理审稿人的反馈以及优化段落结构。该工具在人类监督下使用,旨在提高文章的清晰度和流畅性,而非生成原创的科学内容。所有事实陈述、参考文献和解释都经过作者的严格审查、编辑和验证,以确保准确性。

利益冲突声明

作者声明他们没有已知的可能影响本文研究的财务利益或个人关系。

致谢

由于篇幅限制,我们遗憾无法介绍该研究领域的其他相关工作。我们感谢Catherine McGuinness和Elise Root对本文的修改建议,这些建议极大地提升了手稿的质量。
相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号