编辑推荐:
研究人员为明确啮目昆虫(Zoraptera)全球分布,汇编数据集,为后续研究提供关键资源。
# 全球啮目昆虫分布数据集:解锁昆虫学研究新密码
在昆虫的神秘世界里,啮目昆虫(Zoraptera)就像一群 “小透明”,一直以来鲜为人知。它们体型微小,仅有 2 - 4 毫米,常隐匿在热带森林树木潮湿树皮下方特定阶段分解的木材中,悄无声息地生活着。目前,已知的啮目昆虫仅有 47 种,大多分布在热带地区。但由于其体型小、不易被发现,且收集难度大,全球博物馆里关于它们的样本材料也少之又少。
不仅如此,啮目昆虫相关的数据也极为分散,散布在大量老旧、难以获取的文献中。而且,该目昆虫超种分类近期变化显著,新物种不断被发现,却缺乏现代综合目录,这使得研究人员想要梳理清楚啮目昆虫的分布情况变得难上加难。
为了攻克这些难题,来自捷克共和国奥斯特拉瓦大学、帕拉茨基大学的研究人员 Oto Kaláb、Johana Hoffmannova、Gabriela Packova、Ivona Ko?árková、Robin Kundrata 和 Petr Ko?árek 等开展了一项重要研究。他们汇编了 “啮目昆虫分布数据集(Zoraptera Occurrence Dataset)”,为全球啮目昆虫分布的研究提供了最新、最全面的信息资源,这一成果发表在《Scientific Data》上。
在研究过程中,研究人员运用了多种关键技术方法。首先,他们利用最新的综合目录确定物种范围,将随后描述的分类单元添加进来,同时剔除不属于啮目昆虫的分类单元。在获取地理分布数据时,他们广泛收集已发表资料、博物馆藏品、研究人员自采样本,还整合了 iNaturalist 和 GBIF 的数据 。对于地理坐标的处理,若原始记录有坐标,就转换格式并确定不确定性;若缺少坐标,则通过数字化区域获取,利用 Nominatim 工具和 QGIS 软件,结合多种地图数据,最终确定坐标和位置不确定性。此外,数据集还能通过直接编辑或从 iNaturalist 和 GBIF 半自动更新。
下面来看看具体的研究结果:
数据来源广泛且全面
研究人员从多个渠道收集数据,包括已发表的文献、博物馆收藏的标本,以及来自 iNaturalist 和 GBIF 等数据库的数据。为确保数据的全面性,他们进行了系统的文献检索,涵盖了所有与啮目昆虫相关的分类学、生物学、形态学和系统发育学研究,甚至包括一些用其他语言撰写的研究。对于从 iNaturalist 和 GBIF 获取的数据,研究人员进行了仔细的筛选和验证,剔除了错误或不可靠的数据。
数字化处理精准定位
由于原始数据中地理坐标信息的记录方式和质量参差不齐,研究人员通过一系列复杂的数字化处理流程,将各种来源的地理信息转化为精确的坐标,并确定了位置的不确定性。对于没有坐标的记录,他们利用地图和地理信息系统(GIS)工具,根据文字描述来确定其可能的地理位置。例如,对于只提到城市或地区名称的记录,他们使用 Nominatim 地理编码工具在 OpenStreetMap 数据中查找对应的位置,并进行数字化处理。处理完成后,将多边形简化并存储为 GeoPackage 文件和 WKT 格式,方便用户查看和编辑。
数据集持续更新与维护
为了保证数据集的时效性和准确性,研究人员建立了一套完善的更新机制。数据集可以通过直接编辑 CSV 文件或从 iNaturalist 和 GBIF 半自动更新。从 iNaturalist 更新时,研究人员先在网站上修订识别信息,然后使用 rinat R 包检查新记录或更新;从 GBIF 更新时,通过 rgbif R 包下载数据并与之前版本对比,新记录需手动审核后添加到数据集中。研究人员还欢迎同行提供数据和建议,共同完善这个数据集。
研究人员汇编的啮目昆虫分布数据集具有重要意义。它整合了全球啮目昆虫的分布信息,为后续的分类学研究、生物多样性评估和系统发育分析提供了坚实的数据基础。有了这个数据集,研究人员可以更准确地了解啮目昆虫的分布模式和演化历史,从而更好地保护和管理这些神秘的昆虫。不过,在使用该数据集时也有一些注意事项。比如,由于 iNaturalist 和 GBIF 的数据存在一定的不确定性,在使用时需要谨慎审查,尤其是对于那些没有经过专家鉴定或来自研究较少地区的数据。此外,由于啮目昆虫的分类和系统学仍在不断发展,数据集也需要持续更新,以反映最新的研究成果。
总的来说,这项研究成果为啮目昆虫的研究开辟了新的道路,让我们对这些神秘的小昆虫有了更深入的了解。随着数据集的不断完善和更新,相信未来会有更多关于啮目昆虫的奥秘被揭开,为昆虫学研究领域注入新的活力。