氨基酸理化性质趋同(CAAP)揭示生物适应性趋同进化的分子机制
【字体:
大
中
小
】
时间:2025年09月27日
来源:Molecular Ecology Resources 5.5
编辑推荐:
本研究创新性地提出氨基酸理化性质趋同(CAAP)概念,通过开发计算流程检测三种典型生物趋同案例(回声定位哺乳动物、海洋哺乳动物和红树林),发现CAAP基因显著富集于功能适应性相关通路(GO/KEGG),并经正选择分析和正交证据验证,为分子水平适应性进化研究提供了超越氨基酸状态的新维度。
在进化生物学中,趋同进化指不同物种谱系独立演化出相似或相同性状的现象。生物水平的功能趋通常被视为适应性进化的重要证据,例如蝙蝠与齿鲸类独立演化出的回声定位能力被认为是对昏暗水生或夜间环境的适应。近年来研究重点逐渐转向分子序列水平的趋同分析,旨在识别支撑不同生物适应性功能趋同的关键位点或基因。传统方法主要聚焦于氨基酸状态趋同的检测,即不同谱系在正交同源蛋白序列特定位点上独立出现相同氨基酸残基的现象。
然而,具有相似理化性质的不同氨基酸可能在特定位点共同贡献蛋白质功能的相似性。理化性质迥异的氨基酸替换(激进变化)可能引入更强的适应性效应,而同一性质类别内的氨基酸变化(保守变化)对蛋白质功能干扰较小。传统方法存在两大局限:其一未能明确区分激进变化与保守变化在引发适应性功能改变方面的不同潜力;其二忽略了不同氨基酸因理化性质相似而实现功能趋同的可能性。因此,研究提出新假设:氨基酸理化性质的趋同(Convergence of Amino Acid Properties, CAAP)是否可能成为生物功能适应性趋同的分子基础?
研究团队建立了系统化的分析流程,从数据采集、性质定义到验证分析层层推进。
从OrthoMaM v10c数据库获取116个物种14,509个基因的一对一正交同源蛋白序列。针对回声定位哺乳动物案例,分析涵盖回声定位蝙蝠(包括阴翼手目物种 Hipposideros armiger、Rhinolophus sinicus、Rousettus aegyptiacus 和阳翼手目物种 Eptesicus fuscus、Miniopterus natalensis、Myotis brandtii 等)以及齿鲸类(Physeter catodon、Lipotes vexillifer、Orcinus orca 等)。海洋哺乳动物案例包括Odobenus rosmarus、Trichechus manatus latirostris 和齿鲸类。红树林案例则分析三种红树物种(Avicennia marina、Rhizophora apiculata、Sonneratia alba)与三种非红树物种的对比。所有序列经过严格过滤,剔除含空位和模糊氨基酸的位点。
GS1-GS3基于极性和体积将20种氨基酸分为6-7类(如GS1分组:GWDC、PM、K、IQLS、EATVYF、NHR)
GS4采用更精细分类,仅将侧链高度相似的氨基酸归为一组
另设随机分组方案GS0(随机分配氨基酸到六类)和未分组方案(US)作为对照
通过修改现有状态趋同检测方法实现性质趋同检测。对回声定位哺乳动物案例,复制R统计量方法(Zou and Zhang 2015a),计算观测趋同数(O)与中性进化期望值(E)的比值R=O/E。使用PAML 4.9j基于LG替代模型进行祖先序列重建(ASR),识别各分支氨基酸变化。通过Poisson检验判断R>1的显著性(p<0.05)。
海洋哺乳动物案例采用Foote等(2015)方法,比较焦点物种与其最近非海洋姐妹物种的最晚共同祖先(MRCA)的氨基酸状态。红树林案例采用保守位点趋同(CCS)方法(Xu et al. 2017),要求外类群和非红树物种氨基酸状态一致,寻找至少两个红树物种具有相同氨基酸性质类别且与非红树不同的位点。
对检测到的CAAP基因进行GO功能富集分析和KEGG通路富集分析(使用clusterProfiler R包)。对回声定位哺乳动物案例中还进行了分支位点正选择检验(PAML codeml程序)。此外,通过广泛的文献调研为CAAP基因的功能相关性提供正交证据。
每个案例均设计负对照分析:回声定位案例中将齿鲸基部分支替换为牛科基部分支;海洋哺乳动物案例使用相应陆生姐妹分类群;红树林案例通过保留外类群与所有红树物种氨基酸状态一致的保守位点,检测非红树物种中的趋同位点。
基于116种哺乳动物8,925个基因(总计4,669,357位点)的分析发现,所有分组方案均能检测到显著超额的性质趋同(R>1)。虽然未分组方案(US)检测到的R>1基因数量最多(BP1:197个,BP2:154个),但每个性质分组方案都能发现US未检测到的额外基因。
随机分组方案GS0虽然检测到最多O>0基因,但R>1基因数量最少,表明随机分组虽增加观测趋同数,但也提高了中性期望值。而基于实际物化性质的GS1-GS4检测到更多R(GS)>R(US)的基因,说明CAAP检测不能仅用分组效应解释。
通过分支位点正选择检验,发现12个基因在回声定位谱系中经历显著正选择(FDR<0.05),其中11个含有CAAP位点。WNK3和JPH3基因仅含一个CAAP位点而无状态趋同位点,显示性质趋同检测的独特价值。这些基因功能多与听觉相关:JPH3在小鼠初级听觉皮层成熟过程中表达增加;WNK3动态调节Na-K-2Cl协同转运蛋白(NKCCs)与K-Cl协同转运蛋白(KCCs)活性平衡,这些蛋白的失活与耳聋相关;TEX14在小鼠即将听力丧失的耳蜗中表达升高14.5倍。
GO富集分析发现51个CAAP特异性功能术语,涉及109个基因。例如PIEZO2基因显示性质趋同位点(回声定位蝙蝠多为甘氨酸,齿鲸为丙氨酸,均为小氨基酸,而其他哺乳动物使用较大的缬氨酸),该基因编码机械敏感离子通道,对小鼠通过耳蜗外毛细胞进行超声波听觉至关重要。
在22种哺乳动物12,727个正交同源基因中,三谱系趋同分析发现38个基因具有专属性质趋同,63个基因同时具有性质和状态趋同。GO富集分析显示,US方案无显著富集术语,而GS1-GS3下"胶原包含的细胞外基质"术语显著富集(12个基因)。
这12个基因中,SERPINC1曾在海洋哺乳动物研究中被报道,5个基因具有专属性质趋同位点。这些基因多为肺核心基质组(core matrisome)组成部分:ACAN、LTBP1、LTBP2、COL16A1、TINAG、SPARC和LAMA1参与肺细胞外基质(ECM)形成,ITIH1、S100A8和MMP2也与基质组相关。ECM作为细胞的结构支持,对肺发育、稳态和损伤修复至关重要,表明海洋哺乳动物在肺ECM方面存在广泛的水下呼吸适应性趋同。
基于7物种5,353个正交同源基因的分析显示,性质分组方案下红树林中检测到的趋同位点数量普遍多于非红树林。GS1和GS4下,红树林中CAAP基因显著富集于ATP结合、转移酶活性、蛋白磷酸化等GO术语以及"磷脂酰肌醇信号系统"KEGG通路(FDR<0.05)。
这些功能与植物非生物胁迫响应密切相关:蛋白磷酸化在植物响应盐、热和风胁迫中起重要作用;磷脂酰肌醇(PI)信号在渗透胁迫期间被诱导发挥功能。WNK1、CDKE1、DGK5和PLC2等基因可能在此类胁迫响应中发挥关键作用。例如LOC_Os03g48300(OsVIP2)是InsP6合成的下游基因,在红树林中第617位点存在CAAP(碱性K变为酸性D或E),可能与盐环境适应相关,因研究发现嗜盐菌偏好酸性氨基酸残基以使蛋白质结合水和盐。
本研究通过多案例验证表明,氨基酸理化性质趋同(CAAP)确实可能成为生物功能适应性趋同的分子基础。与传统状态趋同相比,CAAP方法既能捕捉激进序列变化的适应性信号,又能减少中性保守变化的噪声干扰,可能更适用于检测适应性序列趋同。
研究采用的四种分组方案考虑了氨基酸物化性质的不同方面和粒度:GS1-GS3基于极性和体积;GS4采用更精细分类;GS3将"中性小氨基酸"(A、G、P、S、T)归为一组,混合极性和非极性小氨基酸,可能降低某些趋同信号的检测灵敏度。不同分组方案的结果差异表明,在实际分析中尝试多种分组方案有助于全面探索功能相关的性质趋同。
与现有方法(如PCOC、Pelican等)相比,CAAP方法明确建模了氨基酸间的理化相似性和差异性,而前者主要检测氨基酸偏好性变化而不显式考虑理化相似性。本研究的一个潜在局限是CAAP定义基于经验性、离散的氨基酸分类,未来可整合氨基酸理化性质的连续定量变化,这已被证明是序列进化的普遍组成部分。
分子趋同可能存在于从位点特异性氨基酸状态到蛋白质结构乃至基因表达调控的多层次中,这种复杂性要求我们进一步开发测量不同序列特征水平趋同的方法,最终全面表征生物适应性趋同的机制。
本研究成功开发了CAAP检测流程,并在三种典型生物趋同案例中验证了其有效性。研究发现CAAP基因显著富集于与生物适应性相关的功能和通路,并经正选择分析和文献证据支持。研究结果为分子水平适应性进化研究提供了新维度,强调了在研究生
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号