
-
生物通官微
陪你抓住生命科技
跳动的脉搏
PAL-AI揭示卵母细胞成熟过程中调控多聚腺苷酸尾长度的遗传决定因素及其对人类生育力的影响
【字体: 大 中 小 】 时间:2025年08月03日 来源:Nature Communications 15.7
编辑推荐:
这篇研究通过开发集成神经网络模型PAL-AI(Poly(A)-tail Length AI),精准预测了蛙类和哺乳动物卵母细胞成熟过程中多聚腺苷酸尾(poly(A)-tail)长度的动态变化。该模型不仅识别了已知的调控序列元件(如CPE和PAS),还发现了新型辅助基序(如UGU/GUU),并通过实验验证了单核苷酸突变对尾长的影响。研究进一步将预测结果与人类基因组数据库(All of Us和gnomAD)关联,证实破坏尾长调控的遗传变异在人群中受到负向选择,揭示了mRNA尾长调控与女性生育力的直接关联。
脊椎动物卵母细胞在减数分裂前期I停滞时,染色体高度凝集导致转录活性极低,此时基因表达主要依赖转录后调控,尤其是翻译控制。多聚腺苷酸尾(poly(A)-tail)长度变化通过影响mRNA与多聚腺苷酸结合蛋白(PABP)的结合能力,进而调控翻译起始因子的招募,成为卵母细胞成熟和早期胚胎发育的核心机制。例如,母源沉积的MOS和CCNB1等mRNA需通过尾长延伸激活翻译,以支持减数分裂和合子基因组激活。
PAL-AI模型的构建与验证
研究团队首先开发了基于k-mer线性回归的预测模型,发现其可解释40%的尾长变化方差,但无法准确预测尾长延伸>30 nt的mRNA。随后构建的集成神经网络PAL-AI通过卷积和循环神经网络组件,将预测精度提升至Rp=0.82。模型输入分析显示,3′ UTR末端2000 nt区域对预测贡献最大,而编码区或RNA二级结构特征影响有限。
序列元件与上下文特征解析
通过体外突变实验和N60(LC)-PASmos文库验证,PAL-AI不仅识别了经典调控元件——细胞质多聚腺苷酸化元件(CPE, UUUUA)和多聚腺苷酸化信号(PAS, AAUAAA),还发现UGU/GUU基序通过辅助CPEB1结合或招募DAZL蛋白,微弱但显著促进尾长延伸(平均增加0.6-1.8 nt)。此外,模型精准捕捉到CPE与PAS的最优间距(非重叠且距离>2 nt)以及PAS旁侧核苷酸偏好性(如+1位G增强效应)。
跨物种适用性与功能关联
PAL-AI在蛙、小鼠和人类卵母细胞数据中均表现良好(Rp=0.64-0.82)。通过预测人类基因组变异,发现破坏尾长延伸的变异在人群中显著稀缺(如严重破坏型变异在常见等位基因中 depletion 10倍),且与脊椎动物保守位点高度重叠(phyloP评分P<1.7×10?10)。这些变异可能导致关键基因(如细胞周期调控因子)翻译激活失败,进而引发发育停滞。
PAL-AI的创新性在于将深度学习与生物学机制深度融合:其预测的尾长变化与翻译效率变化高度一致(Rp=0.91),并鉴定出264个跨物种保守的尾长延伸基因,富集于减数分裂和胚胎早期分裂通路。尽管模型对RNA二级结构影响的解析存在局限,但其为不孕症遗传诊断提供了新工具——例如,可筛查3′ UTR中未被重视的功能性变异。未来结合体内RNA结构探测数据,或将进一步提升预测精度。
这项研究不仅阐明了卵母细胞中mRNA尾长调控的复杂网络,更为生殖医学领域提供了从序列到表型的精准预测框架。
生物通微信公众号
知名企业招聘