
-
生物通官微
陪你抓住生命科技
跳动的脉搏
真菌蚋染色体尺度基因组组装揭示兆碱基级染色体折叠互作、着丝粒区逆转录转座子富集及端粒候选序列
【字体: 大 中 小 】 时间:2025年05月06日 来源:BMC Genomics 3.5
编辑推荐:
本研究通过Hi-C技术首次构建了真菌蚋(Bradysia coprophila)染色体尺度基因组模型,解决了该模式生物因动态染色体行为(如父源染色体消除、X染色体非分离等)而缺乏完整染色体序列的难题。研究不仅确认了水平转移基因的染色体定位,揭示了逆转录转座子在着丝粒区的特异性富集模式,更发现了与多线染色体"折叠回环"区域对应的兆碱基级物理互作位点,为研究非常规染色体动力学提供了关键分子基础。
在昆虫染色体生物学研究领域,真菌蚋(Bradysia coprophila)因其独特的染色体行为长期备受关注。这种低等双翅目昆虫展现了一系列令人费解的染色体现象:雄性减数分裂I期间父本染色体被选择性消除、减数分裂II期间母本X染色体姐妹染色单体异常保留,以及胚胎发育过程中X染色体拷贝数的动态调整。更引人注目的是,其幼虫唾液腺多线染色体存在自发折叠现象——X染色体上三个相隔数十兆碱基的位点会物理互连,形成独特的"三环结"结构。然而,这些现象背后的分子机制长期未被阐明,核心障碍在于缺乏完整的染色体参考序列。
为突破这一技术瓶颈,来自卡内基科学研究所和布朗大学的研究团队John M.Urban、Susan A.Gerbi和Allan C.Spradling合作完成了真菌蚋首个染色体尺度的基因组组装。他们整合PacBio和Nanopore长读长测序、BioNano光学图谱以及Hi-C染色体构象捕获技术,成功将先前碎片化的Bcop_v1基因组升级为包含X、II、III、IV四条完整染色体的Bcop_v2版本,相关成果发表于《BMC Genomics》。
研究采用多组学验证策略:通过已知染色体标记序列定位确认支架身份;利用X染色体在雄性中的单拷贝特性验证单倍型区域;结合多技术平台测序深度分析排除污染假说;基于进化距离与基因共线性关系评估染色体分组准确性。特别值得注意的是,研究团队开发了SCOPE算法从Hi-C数据中精确识别长程互作位点,并通过比较基因组学构建了EGGS熵值模型量化染色体演化关系。
研究首先证实了染色体支架的结构准确性。四条染色体支架长度(X:70.5 Mb、II:58.3 Mb、III:71.0 Mb、IV:97.1 Mb)与经典多线染色体分区预测完全吻合。着丝粒位置通过保守的Sciara coprophila centromeric repeat(Sccr)序列精确定位,其中X、II、III为近端着丝粒(位于支架5'端),IV为中间着丝粒(44.7-45.0 Mb),与细胞遗传学研究一致。通过分析不同性别测序数据,研究人员确认X染色体支架在雄性中呈现严格的单拷贝覆盖模式,而常染色体均为二倍体覆盖。
在重复序列分析中,研究揭示了家族特异性分布偏好。逆转录转座子(特别是LINE/RTE超家族)显著富集于着丝粒周边区域,与已知的ScRTE元件探针F4杂交信号共定位。相比之下,DNA转座子更倾向分布于支架末端区域。端粒候选序列的鉴定取得突破性发现:常染色体左端存在1.7-3.3 kb的逆转录转座子相关序列(RTRS)阵列,右端则富含175-191 bp的核小体长度卫星重复(如5'-ACTAAACTCGAA...-3'),与摇蚊中发现的LCTTRs(long complex terminal tandem repeats)结构相似。值得注意的是,这些端粒候选序列在着丝粒区也有分布,暗示着丝粒与端粒序列可能存在进化关联。
X染色体的三维结构解析是本研究的重要突破。Hi-C数据不仅重现了多线染色体中观察到的三个"折叠回环区域"(FBR1-3)的物理互作,还首次在分子层面定位了这些位点:FBR1(距着丝粒3.49 Mb)、FBR2(距FBR1 10.3 Mb)和FBR3(距FBR2 42.7 Mb)。虽然早期研究推测这三个区域存在序列相似性,但基因组分析显示它们仅共享短片段同源序列(<200 bp),且未发现跨区域的保守基因家族。引人注目的是,X'染色体长臂倒位的断点区域(分别位于FBR1上游620 kb和FBR3下游4.65 Mb)也表现出类似的兆碱基级互作特征,提示染色体折叠可能促进结构重排的发生。
研究还解决了水平转移基因(HGT)的争议问题。通过多组学数据验证,确认28个"外来"P450基因和5个萜烯合酶基因确实整合在核染色体上,排除了组装污染的可能性。这些基因在Hi-C互作图谱、多平台测序覆盖以及光学图谱中均表现正常,且与保守的双翅目基因存在物理连锁。
这项研究建立的染色体尺度基因组为真菌蚋染色体生物学研究提供了关键工具。其科学价值主要体现在三方面:技术层面,展示了Hi-C在非模式生物基因组组装中的应用潜力;理论层面,为理解非常规染色体行为(如选择性消除、非分离)提供了序列基础;进化层面,揭示了双翅目端粒系统的多样性。特别值得关注的是,FBRs的分子鉴定为研究染色体长程互作与基因调控开辟了新方向,而端粒候选序列的发现则填补了低等双翅目端粒进化研究的空白。研究数据已通过NCBI(GCA_014529535.2)公开,包含完整的染色体支架、基因注释和重复元件分析结果,将极大促进后续功能研究。
生物通微信公众号
知名企业招聘