《BioMed Research International》:Functional and Structure Prediction of Hypothetical Proteins From Listeria aquatica FSL S10-1188: Bioinformatics Approaches
编辑推荐:
本研究采用综合生物信息学方法,对水生李斯特菌(Listeria aquatica)FSL S10-1188菌株中的两个假设蛋白(HPs)EUJ18943.1和EUJ18676.1进行了首次计算机(in silico)结构与功能表征。通过序列比对、理化性质分析(ProtParam)、亚细胞定位预测(CELLO、PSORTb、PSLpred)、三维结构建模(AlphaFold3)、质量评估(SAVES v6.0、PROCHECK、ERRAT、Verify3D、QMEANDisCo)、毒力因子预测(VICMpred、VirulentPred、DeepVF)、蛋白质-蛋白质相互作用(PPI)分析(STRING)以及分子对接(AutoDock)等,揭示了这两个蛋白分别与Imm48免疫蛋白家族和GyrI-like解毒蛋白同源,具有潜在的毒力因子功能和与抗生素(如卡那霉素A、链霉素)的结合能力,为理解其在水生环境适应性及潜在抗菌素耐药性(AMR)基因水平转移中的作用提供了新见解,并展示了计算注释对未来实验验证的指导价值。
摘要
本研究聚焦于水生李斯特菌(Listeria aquatica)FSL S10-1188,这是一种具有独特代谢特性的淡水细菌,其基因组富含大量功能未知的假设蛋白(HPs)。尽管该菌不被认为是致病菌,但其基因组特征和水生栖息地引发了对其可能参与水平抗菌素耐药性(AMR)基因转移的担忧。研究采用生物信息学方法,从2789个预测蛋白中筛选出919个HPs,并最终选定两个稳定的胞质蛋白EUJ18943.1和EUJ18676.1进行深入表征。
1. 引言
水生李斯特菌是革兰氏阳性、兼性厌氧、无运动性、不产孢的杆状细菌,其独特之处在于它是李斯特菌属中唯一能够发酵麦芽糖和D-塔格糖的物种,且不能在低温下生长,这些生理变异表明其存在生态位特异性适应。该菌株基因组大小约3.1 Mb,GC含量高,包含许多注释为HPs的基因。HPs是指预测的蛋白质编码基因,但功能未知。对水生李斯特菌HPs进行功能注释,有助于理解细菌生理学,并可能识别新的治疗靶点或诊断指标。
2. 材料与方法
2.1. 序列检索与假设蛋白筛选
从NCBI获取水生李斯特菌FSL S10-1188(GenBank登录号:GCA_000525795.1)的基因组数据,包含2789个基因,其中919个为HPs。经过序列长度(>50个氨基酸)、理化稳定性(ProtParam评估)和亚细胞定位(CELLO、PSORTb、PSLpred一致性预测)过滤后,最终选定两个稳定的胞质蛋白EUJ18943.1(136个氨基酸)和EUJ18676.1(206个氨基酸)进行深入研究。
2.2. 理化性质与亚细胞定位分析
使用ProtParam工具分析HPs的理化性质,包括分子量、等电点(pI)、不稳定指数(II)、脂肪族指数和总平均亲水性(GRAVY)。利用CELLO、PSORTb和PSLpred预测亚细胞定位,结果均表明两个蛋白定位于细胞质。
2.3. 同源物鉴定与系统发育分析
通过BLASTp在NCBI非冗余(nr)数据库中进行同源性搜索。对高置信度同源序列进行多序列比对(MSA)并构建系统发育树,以评估进化关系。
2.4. 假设蛋白的功能注释
使用CDD、Pfam、InterProScan、HMMER和MOTIF等工具进行保守结构域和功能注释。
2.5. 蛋白质结构预测与质量评估
使用SOPMA和PSIPRED预测二级结构。利用AlphaFold3服务器预测三维结构,并通过SAVES v6.0集成的PROCHECK、Verify3D、ERRAT和QMEAN等工具评估模型质量。
2.6. 毒力因子分析
使用VICMpred、VirulentPred 2.0和DeepVF三种工具评估HPs的毒力潜力。
2.7. 蛋白质-蛋白质相互作用(PPI)
使用STRING数据库分析HPs的潜在功能相互作用网络。
2.8. 活性与配体结合位点预测
使用PrankWeb(基于P2Rank算法)预测蛋白质的配体结合口袋。使用ProBiS web服务器预测潜在配体,配体结构从PubChem数据库获取。
2.9. 分子对接研究
使用AutoDock v4.5.6进行蛋白质-配体对接,以确定能量有利的结合构象。使用PyMOL和LigPlot v.2.3可视化蛋白质-配体相互作用。
3. 结果
3.1. 理化性质和亚细胞定位
EUJ18943.1分子量为15,423.48 Da,理论pI为5.35,GRAVY值为-0.300,不稳定指数(II)为35.16,表明其稳定。EUJ18676.1分子量为24,095.61 Da,理论pI为5.79,GRAVY值为-0.717,II为39.15,同样稳定。亚细胞定位预测均指向细胞质。
3.2. 相似性检测与系统发育分析
BLASTp分析显示,EUJ18943.1与多种李斯特菌的Imm48家族免疫蛋白具有高度同源性(一致性高达100%)。EUJ18676.1与李斯特菌的GyrI-like结构域蛋白高度同源(一致性高达99%)。系统发育分析支持了这些进化关系。
3.3. 假设蛋白的功能注释
功能域分析表明,EUJ18943.1包含一个Imm48结构域,该结构域具有全螺旋折叠和保守的HRG基序,通常与参与多态性毒素系统的异源多免疫位点相关。EUJ18676.1包含一个环丙烷环丙基水解酶(CCH)结构域,属于GyrI-like超家族,已知可催化如yatakemycin(YTM)和CC-1065等DNA烷化剂的水解,从而赋予细胞保护作用。
3.4. 蛋白质结构预测与质量评估
二级结构预测显示两个蛋白均富含α-螺旋。AlphaFold3预测的三维结构具有高置信度(pTM分数:EUJ18943.1为0.87,EUJ18676.1为0.94)。模型质量验证通过PROCHECK(EUJ18943.1和EUJ18676.1分别有95.2%和97.2%的残基位于拉曼图最允许区)、ERRAT(质量因子分别为94.56和91.41)和Verify3D等证实模型质量可靠。
3.5. 毒力因子预测
三种毒力预测工具(VICMpred, VirulentPred, DeepVF)均将EUJ18943.1和EUJ18676.1分类为潜在毒力因子,支持它们可能在细菌致病性中发挥作用。
3.6. 假设蛋白的活性位点预测
PrankWeb活性位点预测显示,EUJ18943.1有4个预测结合口袋,其中口袋1置信度最高(口袋得分4.98)。EUJ18676.1有2个预测结合口袋,其中口袋1置信度非常高(口袋得分31.82,概率0.926),表明可能存在生物学相关的活性位点。
3.7. 蛋白质-蛋白质相互作用(PPI)
STRING分析显示,EUJ18943.1的互作网络包含5个节点和8条边,PPI富集p值为0.049。EUJ18676.1的互作网络包含9个节点和22条边,PPI富集p值为3.86e-05,表明其具有更强的功能连通性。
3.8. 配体结合相互作用与分子对接
ProBiS预测EUJ18943.1的顶级配体为卡那霉素A(得分2.32),EUJ18676.1的顶级配体为链霉素(得分2.10)。AutoDock分子对接显示,EUJ18943.1与卡那霉素A的结合自由能(ΔG)为-7.17 kcal/mol,EUJ18676.1与链霉素的结合自由能为-4.30 kcal/mol,表明结合稳定。相互作用残基分析揭示了潜在的氢键和疏水相互作用。
4. 讨论
水生李斯特菌的独特特性反映了其对淡水栖息地的进化适应。本研究通过多层次生物信息学管道,对两个高置信度HPs进行了表征。EUJ18943.1被鉴定为Imm48免疫蛋白同源物,而EUJ18676.1被鉴定为GyrI-like解毒蛋白同源物。它们的稳定结构、预测的毒力因子特性、明确的活性位点以及与抗生素(卡那霉素A和链霉素)的强结合亲和力,表明它们可能在应激反应、毒力以及潜在的抗生素识别或耐药机制中发挥作用。这些计算预测为未来的实验验证(如体外结合测定或基因敲除研究)提供了坚实的基础,对于理解水生李斯特菌的生物学及其在AMR传播中的潜在作用具有重要意义。
5. 结论
本研究首次对水生李斯特菌FSL S10-1188中的两个HPs EUJ18943.1和EUJ18676.1进行了全面的计算机结构和功能表征。生物信息学分析表明,它们分别是Imm48免疫蛋白家族和GyrI-like解毒蛋白家族的成员,具有稳定的结构、潜在的毒力因子功能以及和抗生素结合的能力。这些发现突出了它们在应激反应和毒力中的潜在作用,并强调了计算注释对于指导未来实验验证的重要性。对这些蛋白质功能的进一步阐明可能为开发新的治疗策略或诊断工具提供见解。