
-
生物通官微
陪你抓住生命科技
跳动的脉搏
蜜蜂卵黄原蛋白DNA结合能力的证据及其在基因调控与健康中的进化保守性
【字体: 大 中 小 】 时间:2025年09月14日 来源:Protein Science 5.2
编辑推荐:
本文综述了蜜蜂卵黄原蛋白(Vg)作为多功能蛋白的最新研究进展,重点探讨其β-桶状结构域通过保守氨基酸介导DNA结合的能力。研究结合结构分析(ChIP-seq、RNA-seq和质谱技术)揭示了Vg在启动子区域的结合偏好及其对能量代谢、行为与信号通路相关基因的调控潜力。Vg的DNA结合机制在多种动物(包括人类心血管健康相关蛋白如ApoB)中高度保守,为理解基因调控提供了新视角。
DNA结合蛋白在DNA复制、修复、组织以及基因调控的多个方面发挥关键作用。卵黄原蛋白(Vitellogenin, Vg)作为一种高度保守的蛋白,在大多数动物类群的卵黄形成中起核心作用。传统上Vg被视为运输蛋白,但研究也记录了其对免疫和行为的影响。蜜蜂(Apis mellifera)实验进一步提示Vg在基因调控中可能发挥作用。Vg-DNA结合的可能性具有广泛的相关性,因为Vg在系统发育上广泛分布,且其衍生物蛋白与人类心血管健康相关。先前研究发现Vg亚基可转运至蜜蜂细胞核并与DNA相互作用。本研究通过识别与已知DNA结合蛋白相似结构区域中的保守DNA结合氨基酸,为Vg的DNA结合潜力提供了结构解释。进一步研究了Vg-DNA结合如何引起蜜蜂工蜂基因表达变化,并鉴定了可能与Vg-DNA复合物结合的其他核蛋白。数据表明Vg-DNA结合与数十个基因的表达变化相关,且Vg-DNA复合物与更多核蛋白相互作用。研究提出Vg-DNA结合可调控蜜蜂工蜂的多个重要过程,包括能量代谢、行为和信号传导。由于Vg及其衍生物蛋白的保守性,这些功能可能存在于多种动物包括人类中。
蛋白质的功能源于其分子结构,使其能够特异性结合并与各种配体(包括其他蛋白质、脂质和核酸)相互作用。许多蛋白质(即使不是大多数)是多功能的:它们根据多种情境执行不同任务,包括细胞外或亚细胞定位、相对于结合伙伴的浓度以及它们经历的翻译后修饰。
卵黄原蛋白(Vg)是一种多功能蛋白。这种古老且高度保守的蛋白主要在卵生物种的卵黄形成中起作用,负责将脂质和其他营养物质运输到发育中的卵子中,并作为卵黄蛋白前体。此外,Vg充当病原体模式识别受体、抗氧化剂和营养储存蛋白,并在行为、寿命等表型中起关键作用。这些功能在许多不同的动物类群中共享,包括珊瑚、鱼类和昆虫。
Vg在细胞内和细胞外均有定位,主要在肝脏、脂肪组织或肝胰腺(取决于生物体)合成后分泌到血液或血淋巴中。随后可通过受体介导的内吞作用被卵巢和其他组织摄取。Vg的多种功能已被广泛研究,目前对其分子结构如何使其与特定配体相互作用以促进离散功能(如脂质运输、病原体识别和氧化应激缓解)有了较好的理解。蜜蜂Vg的天然结构最近也通过实验解析,显示了Vg如何容纳这些功能。
一个较少探索的Vg潜在功能是调节基因表达。先前,蜜蜂Vg编码基因实验性下调后出现的大规模基因表达变化被归因于Vg与昆虫保幼激素轴之间的协同调节关系。然而,最近我们发现Vg的一个高度保守的结构亚基(通常称为β-桶状结构域)可被切割并转运到蜜蜂脂肪体细胞的细胞核中,似乎在数百个位点与DNA结合。我们提出Vg可能是一种转录因子或转录共调节因子,但Vg-DNA结合的机制及其在蜜蜂或其他物种中的后果迄今未知。
Vg β-桶状结构域由12条β-链折叠成一个近乎完整的桶状结构。由β-链介导的DNA结合较为少见,但仍有来自转录因子家族和蛋白质结构域的例子,这些例子存在于从细菌到人类的多种物种中。这些包括植物中的WRKY转录因子家族,以及THAP锌指和GCM结构域。在每个例子中,DNA结合仅由外向β-链上的氨基酸介导,但这些β-链与DNA相互作用的方式不同。有趣的是,蜜蜂β-桶状结构域有多个外向β-链、一个中央α-螺旋和两个推定的锌结合位点。此外,跨物种的Vg以及人类衍生物蛋白(如载脂蛋白B100)显示在多个位点被糖基化,且一致发生在β-桶状结构域上,而糖基化已被证明是DNA结合的支持特征。
本研究将Vg-DNA结合的理解提升到了新的水平。我们首先比较了蜜蜂Vg β-桶状结构域的保守序列和结构特征与已建立的β-片层DNA结合蛋白的特征。在序列和结构分析之后,我们研究了Vg-DNA结合和基因表达变化如何在具有不同Vg水平的蜜蜂之间变化,这些差异是由于它们社会分工中独特的等级形成所致。这种方法之所以可行,是因为Vg影响工蜂的行为发育:年轻的工蜂(1-2周龄)具有高滴度的Vg并执行育幼任务(即护理),而随后Vg的自然下降和保幼激素的伴随增加促使工蜂成为为蜂群收集资源的采集蜂。在本研究中,我们通过比较从单群队列殖民地采集的年龄匹配的护理蜂和采集蜂(见方法)来控制年龄(工蜂行为的自然混淆因素),然后使用染色质免疫沉淀测序(ChIP-seq)绘制Vg-DNA结合位点并确定其与启动子区域的接近程度。接下来,我们使用RNA-seq研究Vg-DNA结合如何对应基因表达差异,并进行基因本体(GO)术语分析以评估特定生物学功能的富集情况。最后,我们使用共免疫沉淀结合质谱法鉴定可能与Vg-DNA复合物结合的其他核蛋白。
我们的序列和结构分析表明,蜜蜂Vg在高度相关的蛋白区域具有功能位点,支持其β-桶状结构域直接结合DNA的可行性。基于我们从ChIP-seq、RNA-seq和共免疫沉淀中获得的累积发现,我们推测Vg-DNA结合可以调节许多参与能量代谢、行为和信号转导通路的基因。总之,我们的结果代表了对Vg直接基因调控潜力的首次全面研究。鉴于Vg在后生动物中的普遍性及其保守的序列和结构,我们希望我们的工作能激发在各种生物中进行新的研究。
我们使用基于Transformer的元预测器hybridDBRpred来识别蜜蜂Vg β-桶状结构域中预测的DNA结合氨基酸(数据输入:UniProt ID: Q868N5的氨基酸序列20-323)。为了识别对β-桶状结构域结构和功能重要的保守残基,我们以严格阈值(>e-20)搜索UniProt,以识别可能具有相似结构或功能的同源物。使用Jackhmmer(3次迭代,v.2021_04)识别所有相关序列(2733个序列),并应用20%长度过滤器仅包括长度相似的蛋白质。接下来,我们使用FunFHMMER将序列分类为功能家族,其中一个分组代表可能具有相同功能的蛋白质结构域。两次迭代产生53个功能家族。蜜蜂Vg的功能家族包括261个序列,并具有高多样性得分(DOPS)0.873(范围0-1)。DOPS得分>0.80意味着多序列比对(MSA)具有高多样性,高度保守的残基可能具有功能作用。我们使用ScoreCons计算残基的保守得分,并在得分>=0.70时认为氨基酸保守。我们使用hybridDBRpred识别人类微粒体甘油三酯转移蛋白(MTP)和载脂蛋白B100(ApoB)中的DNA结合氨基酸(MTP数据输入:UniProt ID: P55157的氨基酸序列29-273;ApoB数据输入:UniProt ID: P04114的氨基酸序列46-298)。我们使用CATH超家族2.30.230.10的比对,特别是功能家族1(MTP)和3(ApoB),来识别保守残基。结果呈现在补充图S2中。
我们使用了三种结构比对工具:TM-align、FoldMason和SSAP,它们都使用不同的特征:TM-align直接比较结构以获得最佳全局比对。FoldMason的范围与TM-align相似,但使用结构字母(3Di)。SSAP则使用残基之间的空间关系来比较结构。每种方法提供不同的输出。TM-align计算均方根偏差(RMSD,两个蛋白质之间对应原子之间的距离)和TM得分(0-1,其中0.0-0.3表示随机结构相似性,>0.5表示相似折叠),以及序列同一性。FoldMason计算局部距离差异测试(LDDT,从1到0,1表示最大相似性)。SSAP计算SSAP得分(0-100,得分>80表示高度相似的结构,>60表示常见的结构 motif),以及比对残基的数量、结构之间重叠的百分比、序列同一性和RMSD。使用这套评估工具,我们将蜜蜂β-桶状结构域的实验解析结构(Leipart et al., 2025; Montserrat-Canals et al., 2025)与所有可用的三个β-片层DNA结合域家族(包括锌结合位点)的实验结构进行比对:WRKY、GCM和THAP锌指。蛋白质数据库(PDB)ID为5w3x、2ayd、2lex、1wj2、1odh、3kde、2jm3和2lau。使用PyMol和ProteoVision创建可视化图。
蜂群维持在美国亚利桑那州梅萨的亚利桑那州立大学蜜蜂研究设施。昆虫研究不需要委员会批准,但本研究中的所有蜜蜂均被人道地处理和安乐死。我们建立了3个单群队列殖民地,并将每个视为独立的生物学重复,因为巢友之间具有高度亲缘关系。我们遵循既定程序,因为单群队列殖民地是控制工蜂实验年龄的金标准。简而言之:将来自已建立蜂群的育雏框放置在34°C和50%湿度的培养箱中过夜,第二天早上将大约2000-3000只新出现的工蜂转移到3个核(小)蜂群中,同时放入一个笼中蜂王和蜂蜜、花粉及空巢脾的框架。这些蜂群密封3天以巩固,之后打开,蜂王从笼中释放。在单群队列殖民地中,一些工蜂会过早转变为采集蜂以便为蜂群收集资源,在建立殖民地后的第7天,我们用油漆标记返回蜂巢的花粉采集蜂。在第14天,我们从每个殖民地收集N=50只油漆标记的采集蜂和相同数量的护理蜂,意味着所有采集蜂和护理蜂执行各自任务至少7天。护理蜂在进入育雏细胞喂养幼虫时被识别。收集的蜜蜂在冰上麻醉,然后解剖其脂肪体,在液氮中快速冷冻,并存储在-80°C。从三个单群队列殖民地中的每一个,我们将25只护理蜂或25只采集蜂的脂肪体样本合并。合并的样本在液氮中用研钵和研杵均质化, resulting homogenate分为三个工作流程用于ChIP-seq、RNA-seq和共免疫沉淀与质谱分析。
对于ChIP-seq流程,我们遵循先前建立的协议。简而言之,将均质物转移到冰上的15 mL dounce匀浆管中,加入4 mL 1%甲醛的1×磷酸盐缓冲盐水(PBS)以交联样本中的DNA和蛋白质。20分钟后通过添加甘氨酸(终浓度125 mM)淬灭交联。将均质物转移到15 mL管中,在4°C下以1500g离心3分钟, resulting pellet用1× PBS和蛋白酶抑制剂混合物(Roche cOmplete?)洗涤3次。然后我们用细胞裂解缓冲液(NaCl 100 mM, HEPES [pH 7.6] 5 mM, EDTA 1 mM, NP-40 0.5%)和蛋白酶抑制剂洗涤pellet一次,并在4°C下以1500g离心5分钟。丢弃上清液后,我们将pellet重悬于600 μL核裂解缓冲液(HEPES [pH 7.6] 50 mM, EDTA 10 mM, Na-脱氧胆酸盐0.1%, N-月桂酰肌氨酸0.5%)中,并使用QSonica Q800R2超声仪对样本进行超声处理,总共5分钟(15秒开,20秒关,振幅=20%)。我们在琼脂糖凝胶上检查超声处理后的样本,以确认DNA被剪切至300-500 bp的大小。
使用对 whole 蜜蜂Vg蛋白特异的抗体(Pacific Immunology, Ramona, CA)沉淀Vg-DNA复合物,其特异性已在多项研究中得到验证。我们首先将这些抗体与磁性Dynabeads?(Invitrogen? #10001D, Protein A)偶联。为此,我们将磁性珠子从其缓冲液中取出,用1 mL封闭缓冲液(1× PBS with 5%牛血清白蛋白[BSA, Jackson ImmunoResearch #001-000-161])洗涤4次,然后向珠子中加入500 μL封闭溶液和20 μL抗体,并在4°C下旋转过夜。然后我们用封闭缓冲液洗涤抗体-珠子复合物5次,然后加入500 μL染色质提取物和500 μL带有蛋白酶抑制剂的稀释缓冲液(SDS 0.01%, Triton x100 1%, EDTA 1.2 mM, Tris–HCl [pH 8.0] 16.7 mM, NaCl 167 mM),并在4°C下旋转过夜。 separately, 我们使用50 μL染色质提取物+稀释缓冲液作为输入DNA。这些样本与经过相同洗涤步骤的磁性珠子一起孵育, except 它们没有与抗体偶联。第二天,所有样本用低盐缓冲液(SDS 0.01%, Triton x100 1%, EDTA 2 mM, Tris–HCl [pH 8.0] 20 mM, NaCl 150 mM)、高盐缓冲液(SDS 0.01%, Triton x100 1%, EDTA 2 mM, Tris–HCl [pH 8.0] 20 mM, NaCl 500 mM)、LiCl缓冲液(LiCl 0.25 M, NP40 1%, Na-脱氧胆酸盐1%, EDTA 1 mM, Tris–HCl [pH 8.0] 10 mM)和TE缓冲液(EDTA 1 mM, Tris–HCl 10 mM)洗涤。然后通过将珠子悬浮在200 μL洗脱缓冲液(EDTA 10 mM, Tris–HCl [pH 8.0] 50 mM, SDS 1%)中并在65°C水浴中加热15分钟来洗脱样本。丢弃磁性珠子, remaining solution通过在65°C加热架上孵育过夜进行反向交联。为了纯化样本中的DNA,我们加入200 μL TE缓冲液和8 μL RNase A(LifeTech #12091021),并在37°C孵育30分钟,然后加入8 μL Proteinase K(LifeTech #25530049)并在55°C孵育1小时。然后我们使用苯酚:氯仿:异戊醇(LifeTech #15593-031)和一个重相锁凝胶管(5 PRIME #2302810)将水性DNA与任何污染物分离。最后,我们使用16 μL糖原(LifeTech #AM9510)、40 μL乙酸钠(LifeTech #R1181)和800 μL 100%乙醇(Fisher #04355222)在-80°C沉淀DNA 1小时,然后在4°C下以16,000g离心30分钟。 resulting pellet用70%乙醇洗涤并风干,然后用50 μL TE缓冲液重悬。我们在Invitrogen Qubit? Fluorometer 2.0上测量DNA浓度。
DNA样本(ChIP DNA + Input DNA)提交给亚利桑那州立大学的Biodesign DNASU测序核心。使用KAPA Biosystem的LTP文库制备试剂盒(KAPA KK8232)在Apollo 384液体处理机上生成Illumina兼容文库。使用Covaris M220超声仪将基因组DNA剪切至约400-600 bp片段,然后所有样本按照KAPA协议进行末端修复和A尾处理。将带有独特索引(IDT #00989130v2)的Illumina兼容接头逐个连接到每个样本上。使用Kapa pure beads(Kapa Biosciences, KK8002)清洁接头连接的分子,并用Kapa的HIFI酶(KK2502)扩增。每个文库然后在Agilent的Tapestation上分析片段大小,并通过qPCR(KAPA Library Quantification Kit, KK4835)在Thermo Fisher Scientific的Quantstudio 5上进行定量。然后将文库 multiplexed 并在Illumina的NextSeq500平台上使用2×75流动池进行测序,测序在ASU的Genomics Core facility进行。
原始Illumina 2×75 bp paired-end reads使用FastQC v0.10.1进行质量检查,然后使用Trimmomatic 0.35进行接头修剪和质量裁剪。任何 reads 的开始、结束或4 bp窗口内的平均质量低于质量得分18的都被修剪。 clean reads 通过Bowtie 2 version 2.2.9与参考基因组Apis mellifera Amel_HAv3.1(https://www.ncbi.nlm.nih.gov/assembly/GCF_003254395.2/)比对。使用Picard Tool(https://broadinstitute.github.io/picard/)检查文库插入大小。通过非冗余分数(NRF)检查文库复杂性,定义为唯一可映射 reads 的唯一起始位置数量除以唯一可映射 reads 的数量。使用IGVtools和deepTools中的bamCompare基于映射 reads 的数量比较两个BAM文件。首先,将基因组划分为相等大小的bin,然后计算每个bin中的 reads 数量。报告每个样本每个bin的 reads 数量的log2值用于IGV可视化,并在每对之间进行比较。在95%相关性下,将三个生物学重复合并用于peak识别。使用MACS2进行peak calling,错误发现率(FDR)截止值为0.05。
MACS2输出的每个单独重复和合并样本的Narrowpeak文件由HOMER注释。它首先确定到最近转录起始位点(TSS)的距离,并将peak分配给该基因。然后确定peak中心覆盖区域的基因组注释,包括启动子(TSS上游1 kb至下游100 bp)、转录终止位点(TTS)、外显子(编码)、5' UTR外显子、3' UTR外显子、内含子或基因间区域。
为了确定Vg-DNA结合位点是否比偶然更可能位于启动子区域,以及哪些位点在护理蜂和采集蜂之间共享或独特,我们首先创建了ChIP位点的零分布。为此,我们取1000个假设的200 bp长的ChIP peak,并使用HOMER将它们随机分布在整个基因组中,然后重复此过程1000次。然后使用与上述相同的HOMER默认分类检查这些peak中心的基因组区域类型。然后使用卡方检验将此零分布与我们的ChIP-seq数据中找到的分布进行比较。
使用与ChIP程序相同的均质样本,一部分均质物进入RNA提取工作流程。这里,我们遵循标准的酚RNA提取协议,使用TRIzol? Reagent(Invitrogen? #15596026)、氯仿(Alfa Aesar #32614)和异丙醇(LabChem #LC157501)。 resulting RNA pellets风干,用无核酸酶水重悬,并进行DNAse处理(Invitrogen? Turbo DNA-free? #AM1907)。我们使用NanoDrop测量RNA浓度,然后将每个样本稀释至200 ng/μL的工作浓度。
使用KAPA的mRNA HyperPrep Kit(KAPA #KK8580)从总RNA生成mRNA测序文库。使用磁性 oligo-dT 珠子特异性捕获mRNA,并使用热和镁将mRNA剪切至约150-200 bp长度。使用随机引物对mRNA片段的第一链进行逆转录。第二链通过掺入dUTP分子生成,并将dAMP添加到双链cDNA分子的3'末端。将带有独特索引(IDT #00989130v2)的Illumina兼容接头逐个连接到每个样本上。使用KAPA Pure beads(KAPA #KK8002)清洁接头连接的分子,并用Kapa的HIFI酶(KAPA KK2502)扩增。用dUTP标记的链不被扩增,允许链特异性。每个文库然后在Agilent Tapestation上分析片段大小,并通过qPCR(KAPA KK4835)在Thermo Fisher Scientific的Quantstudio 5上进行定量,然后在Illumina的NextSeq500平台上使用1×75流动池进行 multiplex pooling 和测序,测序在ASU Genomics Core facility进行。
使用来自NCBI的A. mellifera转录组和Annotation Release 104(源自基因组Amel_HAv3.1)进行准映射和计数生成。使用FASTQC1(version 0.11.8)对每个样本进行质量检查。所有样本中每个碱基的平均读取质量得分超过30,并且未发现接头序列,表明 reads 质量高。我们使用Salmon3 version 0.13.1将 reads 准映射到转录组并量化每个转录本的丰度。首先索引转录组,然后使用附加参数--seqBias和--gcBias纠正序列特异性和GC含量偏差,并使用--numBootstraps=30计算 bootstrap 转录本丰度估计值。然后使用tximport包中的“bias corrected counts without an offset”方法基于转录本水平计数估计基因水平计数。84%–90%的 reads 映射到转录组(每个样本41.1–62.2百万),并保留用于统计分析。我们使用edgeR包中的修剪均值M值(TMM)归一化来调整RNA组成中可能的偏差,例如映射到病毒基因组的 reads。归一化因子范围从0.52到1.35,但变异存在于个体之间,而非等级或蜂群之间,表明RNA组成没有组水平差异。映射到病毒基因的 reads 比例较高的样本往往具有较低的TMM归一化因子,以解释映射到A. mellifera转录组的 reads 数量较少。NCBI Amel_v3.1 Annotation Release 104包含12,090个基因,但并非所有基因在我们的样本中都以可检测水平表达。我们在每个样本中设置0.5 CPM(每百万计数)的检测阈值, resulting 在9134个检测到的基因,占所有 reads 的99.95%。过滤后,再次执行TMM归一化,并使用edgeR的cpm()函数计算归一化的log2-based CPM值,其中prior.count=3以帮助稳定极低表达基因的 fold-changes。使用limma7包中的多维缩放来识别更高水平的潜在处理效应。使用Limma-trend方法测试差异表达基因(DEGs)。我们使用(Benjamini–Hochberg [BH])FDR <0.05作为截止值,识别了护理蜂和采集蜂之间的468个DEGs。
鉴于转录调控可能涉及转录因子、共调节因子、酶、信号分子等之间的复杂相互作用,此处的目的是阐明可能有助于Vg-DNA结合和 subsequent 基因表达变化的调控通路。为了 pull down 与Vg和DNA相互作用的其他蛋白质,我们将ChIP程序与染色质相互作用蛋白质复合物免疫沉淀方案整合。与ChIP协议一样,来自每个工蜂等级的25只合并蜜蜂脂肪体的均质物用1% PFA交联。我们淬灭均质物,洗涤它,裂解细胞膜,裂解核膜,然后通过超声处理剪切样本。我们将抗Vg抗体(20 μL)与100 μL磁性Dynabeads?(Protein A)结合,然后与我们的样本一起孵育。作为对照,我们将样本与未与抗Vg抗体结合的Dynabeads?一起孵育,因此这些样本中沉淀的任何蛋白质都将是由于与Dynabeads?直接相互作用的蛋白质。程序的其余部分遵循Mohammed等人的方案,其中珠子样本首先用RIPA缓冲液(HEPES [pH 7.6] 50 mM, EDTA 1 mM, Na-脱氧胆酸盐0.7%, NP-40 1%, and LiCl 0.5 M)洗涤,然后用碳酸氢铵洗涤,然后进行胰蛋白酶消化、固相萃取和洗涤,最后加载到AB Sciex 4800质谱仪上进行MALDI-TOF/TOF-MS(基质辅助激光解吸/电离-串联飞行时间-质谱)分析。
使用Orbitrap Fusion Lumos Tribrid质谱仪与Ultimate 3000 nano-LC和nanoelectrospray ionization进行蛋白质组学分析。使用150分钟缓冲液梯度在300 nL/min的低流速下,使用nC18分析柱(C18 Pepmap 100, 3 μm particle, 100 ? pore, 75 μm i.d. ×150 mm)分离肽。在正模式下进行数据依赖性采集以收集数据。使用Proteome Discoverer 2.2与SEQUEST搜索引擎和 label-free 定量工作流程对获得的数据进行搜索,针对A. mellifera的UniProt数据库(http://www.uniprot.org; Proteome ID: UP000005203)。搜索参数为胰蛋白酶切割位点,允许两个 missed cleavage site,前体和碎片质量公差设置为±10 ppm和0.6 Da。半胱氨酸的Carbamidomethyl设置为固定修饰,蛋氨酸的氧化设置为可变修饰。在生成可视化之前,通过每次沉淀分析的肽总数对蛋白质丰度水平进行归一化。为了优先考虑潜在的Vg相互作用蛋白质,我们移除了未映射到A. mellifera蛋白质的肽,并使用DESeq2包(v.1.32.0)进行比较对照和处理(即抗Vg+)沉淀的差异丰度分析,过滤出在处理条件下富集且FDR <0.05的蛋白质。我们尝试通过使用NCBI BLAST webtool查询其序列 against the ClusteredNR数据库(accessed July 11, 2025)来注释未表征的蛋白质。
来自ChIP-seq和RNA-seq的基因列表在HymenopteraMine(v1.4)中搜索特定GO术语的富集,使用Official Gene Set 3.2(OGSv3.2)作为背景。 specifically, 我们寻找 biological processes, molecular functions, and KEGG pathways 的富集。我们使用BH-adjusted p <0.05来确定显著富集的术语。在我们的分析中,我们仅包括每个工蜂等级的3个生物学重复中至少2个共享的基因或蛋白质。
我们在Vg β-桶状结构域中发现了38个预测的DNA结合氨基酸(图1a中的黑线)。38个预测的DNA结合氨基酸中有34个位于4条β-链上(图1b)。通过为Vg β-桶状结构域构建功能家族(详见方法),我们识别出38个位点中有15个是保守的(计算的保守得分从0到1,其中1是最大保守性,保守的阈值在0.7,图1a, c)。在15个位点中,11个暴露于表面(图S1A),3个是带正电荷的氨基酸(R35、K215和R251,图1d, e),2个是芳香族(Y30和F219,图1
生物通微信公众号
知名企业招聘