
-
生物通官微
陪你抓住生命科技
跳动的脉搏
疟疾媒介按蚊Anopheles albimanus染色体水平基因组组装:地理差异株的进化与防控新视角
【字体: 大 中 小 】 时间:2025年06月04日 来源:Scientific Reports 3.8
编辑推荐:
本研究通过PacBio长读长与Illumina短读长测序技术,对源自萨尔瓦多和哥伦比亚的两种疟疾媒介按蚊Anopheles albimanus地理株(Stecla和Cartagena)进行高质量基因组杂交组装,获得N50达88 Mbp的染色体级别参考基因组,揭示98.12%的基因组保守性与关键转座元件差异。该成果为疟疾媒介比较基因组学、杀虫剂抗性机制及种群控制策略提供重要资源。
疟疾作为全球重大公共卫生问题,其传播效率高度依赖按蚊媒介的生物学特性。Anopheles albimanus作为美洲地区主要疟疾传播媒介,其种群表现出显著的生态表型异质性,包括幼虫形态变异、宿主偏好差异及杀虫剂抗性分化。然而,现有基因组资源局限于单一实验室株(Stecla),且早期基于Illumina短读长的组装(如AalbS2)存在高度碎片化问题,难以解析地理种群间的遗传差异。这种数据缺口严重制约了针对该媒介的精准防控策略开发,例如杀虫剂靶点筛选或种群特异性基因流分析。
为突破这一瓶颈,美国疾病控制与预防中心(CDC)联合利物浦约翰摩尔大学等机构的研究团队,首次采用PacBio长读长与Illumina短读长杂交测序策略,对源自萨尔瓦多(Stecla株)和哥伦比亚(Cartagena株)的两大地理差异株进行染色体水平基因组组装。研究通过MaSuRCA混合组装算法整合测序数据,结合BUSCO评估(完整度>97%)、RNA-Seq辅助注释及转座元件(TE)分析,系统比较了株系间基因组结构差异。成果发表于《Scientific Reports》,为疟疾媒介进化研究与防控工具开发奠定基础。
关键技术方法包括:1)PacBio RSII平台生成20-kb长读长(50×覆盖度)与Illumina HiSeq 2500双端短读长(300×覆盖度);2)MaSuRCA混合组装结合POLCA纠错;3)基于AalbS3参考基因组的染色体支架构建;4)Braker2整合RNA-Seq与同源蛋白数据的基因预测;5)RepeatModeler转座元件注释;6)SNP/Indel变异检测与功能预测(SnpEff)。
基因组组装质量显著提升
杂交组装使Stecla和Cartagena株分别获得109和149条支架,N50达88 Mbp,较旧版AalbS2(N50=37.9 Mbp)提升132%。组装完整性验证显示:1)BUSCO评估中995个(98.2%)保守基因被完整检出;2)Illumina重比对率>92%;3)RNA-Seq映射率(98.44%)显著高于旧版(71.26%)。值得注意的是,新组装每100 kbp仅含76-130个缺口(Ns),远低于AalbS2的5,679个,证实长读长数据有效填补复杂重复区域。
地理株间高度保守的基因组结构
全基因组比对揭示两株系共享98.12%序列一致性,且共线性分析(MCscan)未检测到大规模染色体重排。仅0.05%(Stecla)和0.1%(Cartagena)的支架为株系特异性,其中Cartagena株13个特有基因涉及代谢通路调控,可能反映哥伦比亚种群对局部生态压力的适应。线粒体基因组比较显示15,448 bp(Stecla)与14,023 bp(Cartagena)的相似度达99.96%,且均编码13个保守蛋白(如COX1-3、ND1-6),进一步支持两株系属同一物种。
转座元件捕获能力突破
长读长数据使TE检出量较短读长组装(AalbS2)提升2倍,占基因组2.8-3.2%。DNA转座子(如TcMariner)占比最高(51/115家族),其次为未分类元件(35家族)和LINEs(20家族)。K2P分歧度分析表明近期活跃的TE插入(<10%分歧)在短读长数据中易被低估,这一发现为理解基因组可塑性(如杀虫剂抗性相关扩增)提供新视角。
讨论与意义
该研究首次实现An. albimanus地理差异株的高精度基因组比较,揭示尽管表型异质性显著,两株系仍保持高度基因组保守性。其意义体现在:1)为美洲疟疾媒介的种群遗传学(如抗性基因扩散)建立黄金标准参考;2)鉴定Cartagena株特有基因可能成为区域性防控靶点;3)长读长TE分析框架为其他病媒基因组研究提供范式。未来需扩大样本量验证特有变异的功能意义,并探索转座元件驱动表型可塑性的分子机制。
生物通微信公众号
知名企业招聘