利用原位DNA条形码技术解码秘鲁亚马逊地区脊椎动物与植物类群:填补生物多样性基因数据的空白

《Scientific Data》:Decoding the Peruvian Amazon with in situ DNA barcoding of vertebrate and plant taxa

【字体: 时间:2025年10月02日 来源:Scientific Data 6.9

编辑推荐:

  为解决热带地区物种灭绝加速与基因数据严重偏倚的问题,研究人员在秘鲁亚马逊地区建立了三个分散式实验室,利用便携式纳米孔测序仪开展原位DNA条形码研究。该研究对1,097个脊椎动物和76个植物样本进行了六种遗传标记的测序,生成了1,858条条形码,首次报道了30种哺乳动物和196种鸟类的遗传条形码,显著提升了秘鲁物种在BOLD数据库中的代表性。此项工作避免了样本出口,提升了本地分子生物多样性研究能力,为全球生物多样性监测提供了可推广的低成本、高效率模式。

  
在地球上生物多样性最丰富的热带地区,物种正以前所未有的速度走向灭绝,其速度甚至超过了科学家对其进行记录和描述的能力。与此同时,DNA条形码(DNA barcoding)作为一种强大的物种鉴定工具,却在基础设施完善的北半球国家蓬勃发展。这种技术允许非分类学专家通过非致命性、微创或环境样本对物种进行快速识别。然而,像秘鲁这样的超多样性地区,在全球生命条形码数据库(Barcode of Life Database, BOLD)中的记录仅占微不足道的0.52%(n=93,246),这凸显了全球生物多样性基因数据存在的严重地理偏倚。为了应对这一挑战,一个研究团队在秘鲁亚马逊地区进行了一项开创性的研究,相关成果发表在《Scientific Data》上。
这项研究致力于解决几个核心问题:如何在不将宝贵生物样本运输出国的情况下,对生物多样性热点地区的物种进行基因测序?如何在高多样性但科研基础设施相对薄弱的国家建立本地的DNA条形码能力?以及如何快速填补全球基因参考数据库中关键区域的空白?研究人员给出的答案是:建立分散式的、低成本的本地化实验室网络。
为了回答这些问题,Pamela Sanchez-Vendizú等研究人员从2018年至2023年,在秘鲁建立了三个分散式实验室,配备了低成本、便携式的牛津纳米孔(Oxford Nanopore Technologies)测序仪。这些实验室并非位于现代化的大都市,而是扎根于亚马逊雨林深处和首都的博物馆中,是真正意义上的“原位”实验室。研究团队利用这一网络,对来自秘鲁亚马逊地区12个部门的样本进行了高通量DNA条形码分析。样本来源多样,包括野外调查(主要在马德雷德迪奥斯省)、野生动物救援中心以及圣马科斯大学自然历史博物馆(MHN-UNMSM)的生物样本库。该研究的一个突出特点是其“端到端”的解决方案,即从新鲜或博物馆保存的样本到最终生成条形码序列,全部在秘鲁境内完成,避免了样本出口的繁琐程序和潜在风险,极大地促进了本地科研能力的建设。
在技术方法上,本研究核心是建立了一套完整的原位样本处理、DNA条形码分析和纳米孔测序流程。关键技术点包括:从多种样本(血液、羽毛、组织等)中提取DNA;使用六种通用遗传标记(针对脊椎动物的COI、cyt b、18S;针对植物的matK、rbcL、trnH-psbA)进行PCR扩增;并演化出三种索引策略(最终优选双索引法Method C)用于在纳米孔测仪上高通量混合测序。测序数据通过定制生物信息学流程进行基序识别、质量过滤、解复用,并利用NGSpeciesID流程生成一致性序列,最后通过比对BOLD和GenBank数据库进行物种鉴定。
研究结果
数据记录与物种贡献
本研究成功生成了1,830条条形码,覆盖了来自35个目、81个科、303个属的430个物种,涉及1,169个个体。其中,835个标本的至少一条条形码的遗传鉴定结果与野外形态学鉴定相匹配。该数据集显著增加了秘鲁物种在BOLD数据库中的代表性:使秘鲁鸟类的公共条形码数量增加了26.55%,哺乳动物增加了52.16%,两栖动物增加了12.7%,爬行动物增加了21.7%,木兰纲植物增加了3.10%。总体而言,这项研究使BOLD中来自秘鲁的公共条形码总数增加了1.92%,达到95,076条。尤为重要的是,研究团队首次为30种秘鲁哺乳动物和196种秘鲁鸟类生成了遗传条形码,分别使BOLD中秘鲁哺乳动物和鸟类的物种覆盖度提升了110%和36.5%。
新分布记录与分类学发现
数据分析还带来了分类学上的惊喜。研究首次报告了负鼠Marmosops ocellatus和蝙蝠Sturnira lilium在秘鲁的分布记录,扩展了这两种物种的已知分布范围。此外,对某些样本的遗传鉴定揭示了潜在的分类学复杂性,例如,一个Eptesicus属的样本与一个非正式命名为“Eptesicus sp. Peru”的潜在新物种匹配度很高,而两个Callicebus属的样本则指向一个不同于已知物种的遗传谱系,这些都提示了未来需要进一步研究的分类学问题。
技术验证与数据质量
为确保数据的可靠性,研究团队实施了严格的技术验证。这包括在每批实验中设置提取空白和PCR空白对照,所有空白对照都经过全程测序和严格筛选。对原始测序数据进行质量过滤(质量值Q>7,长度>150 bp),并要求每个一致性序列至少有30条测序读长(reads)的支持。对于蛋白质编码基因,通过视觉检查和手动校正来避免出现终止密码子,从而保证序列的准确性。为了检测和纠正可能由实验室操作(如移液误差导致的样本交叉污染)引起的错误,研究人员构建了系统发育树进行视觉检查,确保同一属的物种形成单系群,将任何嵌套在不预期分类阶元中的序列剔除。
讨论与意义
本研究成功地展示了利用便携式纳米孔测序技术在生物多样性热点地区进行大规模、原位DNA条形码工作的可行性。它不仅仅是一个数据描述,更是一个可复制的模式,证明了在资源有限的环境中建立分子生物学研究能力是可能且高效的。通过完全在境内完成从样本到序列的全过程,该研究为其他生物多样性丰富但科研能力不足的国家和地区提供了宝贵的范例,有助于减少全球生物多样性基因数据的地理偏倚。
更重要的是,这项工作产生的数据具有立竿见影的应用价值。新生成的DNA条形码为秘鲁亚马逊地区的物种提供了可靠的遗传参考,将直接应用于野生动物法医鉴定、环境DNA(eDNA)监测、生态系统评估以及保护优先区的划定。例如,研究中发现的一些遗传鉴定与形态鉴定不匹配的情况,可能指向了隐存种(cryptic species)的存在或分类学修订的必要性,为后续的分类学研究提供了重要线索。
尽管纳米孔测序技术在测序准确度上相较于传统的桑格测序(Sanger sequencing)曾有不足,但本研究通过高覆盖度测序和严谨的生物信息学共识序列生成流程,有效地保障了数据的可靠性。随着纳米孔测序化学(如R10.4.1)和算法的不断进步,其单读长准确率已显著提高,使其在DNA条形码等应用中更加可靠。
总之,这项研究不仅极大地丰富了秘鲁亚马逊地区的遗传参考数据库,更重要的是,它探索并验证了一条在生物多样性热点地区实现科研能力本地化、数据生产民主化的可行路径。它为在全球范围内更公平、更快速、更高效地记录和监测生物多样性开辟了新的道路,对于应对当前严峻的生物多样性丧失危机具有深远的意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号