贝加尔湖是世界上最深的湖泊之一,也是最古老的湖泊(约2500万年的历史),由贝加尔裂谷带的构造活动形成。该湖长度达636公里,宽度从塞伦加河三角洲附近的25公里到巴尔古津河口的80公里不等。位于中亚,海拔455.6米,表面积为31,500平方公里,海岸线长约2000公里。湖中央的深度达到1637米,而南部和北部盆地的深度分别为1432米和889米(Galaziy, 1993)。作为最大的淡水储库,贝加尔湖含有地球上20%的地表淡水,体积为23,000立方公里。其深层水体全年温度稳定在约4°C。该湖还以其高氧饱和度(>80%)、低营养水平和极低的有机碳含量而闻名(Khodzher等人,2018)。这些独特的地质和水文特征促进了其极高的生物多样性和特有性(Kozhova和Izmest’eva,1998)。
病毒是专性细胞内寄生虫,可能感染所有类型的细胞生命(Simmonds等人,2017)。与传统方法不同,宏基因组学可以识别在实验室条件下难以或无法获得的病毒。此前,宏基因组学已经在各种水生环境中鉴定出许多双链DNA(dsDNA)病毒(Gregory等人,2019;Palermo等人,2019;Watkins等人,2015),但在某些情况下,分析显示单链DNA(ssDNA)病毒占主导地位(Aguirre de Cárcer等人,2015;Zeigler Allen等人,2017)。
Circoviridae成员感染动物;Bacilladnaviridae感染硅藻;Genomoviridae感染真菌;Nanoviridae和Geminiviridae感染植物。Smacoviridae成员以及最近描述的Redondoviridae家族成员是通过宏基因组学发现的,据推测也感染动物,尽管有人提出Smacoviridae可能与产甲烷的古菌有关(Krupovic等人,2020)。
大多数ssDNA病毒拥有一个小的环状基因组,通过滚环机制进行复制(Zhao等人,2019),而细小病毒和双链病毒则具有线性的单链DNA基因组(Cotmore和Tattersall,2014;Krupovic和Koonin,2014)。Zhao等人(2019)将编码复制起始蛋白(Rep)的环状单链DNA病毒称为环状复制编码单链(CRESS)DNA病毒。
所有真核CRESS-DNA病毒都编码超家族3解旋酶(S3H),这些解旋酶通常与HUH内切酶融合形成双域Rep蛋白。相比之下,原核ssDNA病毒编码单一的HUH内切酶。此外,ssDNA病毒Rep蛋白的N端内切酶结构域包含称为滚环复制(RCR)基序I、II和III的保守基序(Rosario等人,2012)。此外,在超家族3的C端解旋酶结构域中,所有感染真核生物的环状ssDNA病毒的主要家族的Rep蛋白都表现出四个保守的基序:Walker A、B和C(Rosario等人,2012)以及一个“精氨酸指”基序(Kazlauskas等人,2017)。大多数CRESS DNA基因组的另一个特征是保守的复制起始位点(ori),该位点由预测的茎环结构顶部的非九核苷酸基序标记,滚环复制在此处开始(Rosario等人,2012)。
先前的研究揭示了多种CRESS病毒的多样性,其中大多数尚未培养和分类(Kazlauskas等人,2018)。与衣壳蛋白不同,Rep蛋白在不同CRESS DNA病毒群体之间表现出显著的相似性,并具有保守的结构域组织,包括N端核酸酶和C端解旋酶结构域。因此,Rep蛋白被提议作为CRESS DNA病毒的大分类标记(Koonin等人,2020)。在未分类的CRESS病毒中,71%具有嵌合Rep蛋白。这种嵌合性表明未分类的CRESS病毒构成了一个动态的群体。去除嵌合序列后,发现了六个单系Rep群体(Kazlauskas等人,2018)。CRESS-DNA病毒的Rep蛋白与小型细菌滚环复制质粒的同源Rep蛋白最为接近,这些质粒也编码HUH和S3H(Kazlauskas等人,2019)。
根据Rosario等人(2012)的研究,CRESS病毒的基因组分为八种类型。I型基因组的开放阅读框(ORFs)方向相反,并在主要ORFs的5′端具有潜在的茎环结构。II型基因组的ORFs具有环状病毒的特征,即双义组织和5′端的茎环结构。然而,在II型基因组的Rep编码链中未检测到保守的非九核苷酸序列。
III型和IV型基因组具有双义组织,但包含茎环结构的基因间区域位于主要ORFs的3′端。V型和VI型基因组的主要ORFs方向相同。VII型和VIII型基因组仅编码一个主要ORF,这些基因组可能代表多组分病毒或亚病毒元件。
先前的研究在贝加尔湖的浮游生物宏基因组(Butina等人,2021)、水转录组(Potapov等人,2023)以及本地淡水腹足类Benedictia baicalensis的转录组(Butina等人,2023)中检测到了类似CRESS DNA病毒的序列。然而,这些序列尚未进行详细分析。尽管宏基因组学研究揭示了水生环境中双链DNA病毒的高度多样性,但据我们所知,CRESS DNA病毒在淡水生态系统中的研究仍然不足,尤其是在古老的湖泊中。
本研究的目的是从贝加尔湖<0.2 μm浮游生物样本中鉴定和表征CRESS DNA病毒序列。研究计划评估这些病毒在贝加尔湖水域的空间分布,确定它们在冰下季节(0–50米)上层水域的垂直分布,并分析它们出现的季节性和年际动态,以识别其分布的生态模式。