
-
生物通官微
陪你抓住生命科技
跳动的脉搏
IncF质粒多等位基因变异共存对计算机pMLST分型准确性的挑战及临床意义
【字体: 大 中 小 】 时间:2025年04月09日 来源:mSystems 5.0
编辑推荐:
本研究揭示了CGE中心pMLST工具在分析含多IncF等位基因变异的细菌基因组时存在随机选择性报告问题,导致8.01%的72,469个肠杆菌科基因组出现分型错误。通过长读长测序验证,发现同一质粒上FII/FIC等位基因重叠或细胞内存多个IncF质粒是主要干扰因素,强调需结合手动核查与长读长数据以提升流行病学关联分析的准确性。
当前pMLST工具无法一致分配多IncF复制子
研究团队在分析898个大肠杆菌ST131基因组时,发现CGE的pMLST工具(包括网页版和Python版)对同一基因组中多个IncF等位基因变异(如FII、FIA、FIB家族)存在随机选择性报告问题。工具虽能检测到多等位基因,但仅随机选取一个生成FAB公式(如F31:A4:B1或F36:A4:B1),导致5,804例(8.01%)分型错误。长读长测序证实,这种误差源于同一质粒携带多等位基因(如F31/F36共存)或细胞内存多个IncF质粒。
同一质粒上的双FII等位基因干扰分型
典型案例如F31/F36:A4:B1质粒,短读长数据中pMLST随机报告F31或F36,而长读长测序显示两者共存于单一质粒。此类组合占误差样本的6.20%(360/5,804),且F18等位基因(与禽致病性大肠杆菌相关)的漏报可能掩盖重要毒力基因关联。
单细胞多质粒导致分型遗漏
短读长数据无法区分细胞内的多个IncF质粒。例如,分离株OV_CH_97实际携带F1:A2:B20和F2:A-:B-两个质粒,但pMLST仅输出合并公式F1/F2:A2:B20。类似案例中,F29:A-:B10(与pUTI89样质粒相关)的漏报可能影响尿路感染菌株的溯源。
FII与FIC等位基因重叠引发漏检
在C4/F18:A-:B1质粒中,F18(155 bp)与C4(200 bp)有43 bp重叠区域。网页版工具可检测两者,但Python版完全忽略F18。此类重叠导致5.48%(318/5,804)的分型错误,且F18的缺失可能低估ColV质粒的流行病学风险。
环状质粒基因组断裂致FIB等位基因误判
长读长数据中,质粒环状结构在复制起点处断裂,导致FIB等位基因(如B1/B58)的5'端29 bp序列丢失。单核苷酸差异(第11位点)因此被忽略,使B1被误报为B58,凸显线性序列分析对环状基因组的局限性。
高频等位基因组合与临床关联
F31/F36(6.20%)、C4/F18(5.48%)、F1/F2(4.72%)和F2/F29(3.84%)为最常见组合。其中F29与pUTI89样质粒的关联若被漏报,可能影响耐药基因传播链的追踪。在7,441个完整IncF质粒中,3.52%存在多等位基因,但长读长数据揭示部分案例实为多质粒共存。
结论与建议
研究强调需结合pMLST详细输出(如“Multiple perfect hits”警告)与长读长测序以准确解析IncF质粒结构。针对工具缺陷,建议手动核查多等位基因,并开发兼容环状基因组的分型算法,以提升质粒流行病学研究的可靠性。
生物通微信公众号
知名企业招聘