编辑推荐:
在医学节肢动物研究中,传统成像方法难以满足机器学习模型对大量高质量图像的需求。研究人员开展 “ScannerVision” 技术研究,用该技术扫描节肢动物样本并构建数据集训练模型。结果显示,扫描图像训练的模型性能与显微镜图像相当。这为节肢动物研究提供新方法,助力疾病防控。
在奇妙的自然界中,节肢动物作为动物界中种类最多、分布最广的一个类群,它们的身影无处不在。在生态系统里,节肢动物扮演着至关重要的角色,像蜜蜂等昆虫作为传粉者,帮助无数植物繁衍后代;还有一些节肢动物作为分解者,参与物质循环,维持生态平衡。然而,节肢动物中也有不少成员和人类健康息息相关,例如蚊子、蜱虫等,它们是多种疾病的传播媒介,像疟疾、登革热等疾病,都是通过这些节肢动物传播给人类的。
随着科技的发展,利用计算机视觉和深度学习模型对节肢动物进行自动识别和计数,成为了研究它们的新方向。这样不仅能提高研究效率,还能更精准地掌握节肢动物的动态变化,为疾病防控提供有力支持。但目前这个领域却面临着诸多难题。一方面,传统的成像方法,如使用立体显微镜或微距镜头搭配相机进行成像,在处理大量样本时困难重重。因为它们的视野狭窄,一次能观察和拍摄的节肢动物数量有限。要是遇到像在蚊虫密集地区,一个 CDC 诱蚊灯一天就能捕获上千只蚊子的情况,靠传统方法去处理这些样本,简直是一项 “不可能完成的任务”。另一方面,深度学习模型的性能和泛化能力很大程度上依赖于训练数据集的规模和质量。而要获取大量高质量、能满足模型训练需求的节肢动物图像,难度极大。这就好比盖高楼却没有足够好的建筑材料,严重阻碍了节肢动物自动识别技术的发展。
为了解决这些问题,来自多个研究机构的研究人员携手开展了一项极具意义的研究。研究人员提出了一种名为 “ScannerVision” 的技术,利用消费级高分辨率电荷耦合器件(CCD)平板扫描仪,对医学节肢动物进行成像。这项研究成果发表在《Current Research in Parasitology 》上,为该领域带来了新的曙光。
在研究过程中,研究人员主要运用了以下关键技术方法:首先,在样本采集方面,他们选择了多个具有代表性的采样地点,采用不同的采样方法收集节肢动物样本,像丹麦奥胡斯大学校园使用粘虫板,马来西亚沙巴州的原始森林用诱蚊灯,新加坡的城市环境则用带粘性垫的紫外线诱捕器。其次,在成像环节,选用 Epson Perfection V850 Pro 平板扫描仪,并通过专业软件校准,设置合适的扫描参数,如专业模式、48 位颜色、1200dpi 分辨率等。同时,针对不同来源的样本,研究人员还设计了不同的样本放置策略,确保扫描效果。最后,构建数据集时,从扫描图像和立体显微镜图像中选取样本,标注蚊子种类,构建两个数据集用于训练和评估深度学习模型。
下面来看看具体的研究结果:
- 数据集:研究人员从立体显微镜和扫描仪获取的原始图像中,裁剪出了大量蚊子的个体图像。经过旋转等数据增强操作后,立体显微镜图像数据集达到 1788 张,扫描仪图像数据集有 1744 张。从图像效果上看,立体显微镜虽然能放大视野,但一次成像的蚊子数量有限;而扫描仪则可以一次性捕获一个诱捕样本中的所有蚊子。并且对比放大后的图像,扫描仪图像在展示节肢动物形态细节上,与立体显微镜图像效果相当。
- 模型性能比较:研究人员用扫描图像和立体显微镜图像分别训练了 InceptionV3、MobileNetV2 和 ResNet 三种深度学习模型,并对比它们的性能。结果发现,尽管使用了不同的模型,但两组图像训练出的模型性能相似。通过 Mann-Whitney U 检验也表明,两组数据集训练出的模型性能没有显著差异。这就意味着,用扫描仪获取的图像完全可以和立体显微镜获取的图像相媲美,用于深度学习模型的训练。
在研究结论和讨论部分,“ScannerVision” 技术展现出了诸多优势。它能够在单一步骤中捕获大量节肢动物的高分辨率图像,用这些图像训练的模型可以将诱蚊灯采集的节肢动物样本分类到三个蚊子属,扫描图像训练的模型平均准确率达到 70.74%,立体显微镜图像训练的模型为 73.65%,这和之前的研究结果相符,也证明了该技术的可行性。而且,该技术使用的扫描仪成本较低,便于广泛应用,还能兼容现有的各种节肢动物采样方法。在实际应用中,它可以为博物馆节肢动物标本数字化提供更高效的解决方案,还能助力构建大型数据集,训练更强大的深度学习算法用于物种分类。
不过,“ScannerVision” 技术也存在一些局限性。它获取的是二维(2D)图像,无法完整呈现节肢动物三维(3D)的形态特征,一些重要结构可能会被遮挡或变形。而且样本必须是静止的,不能用于活体样本成像,并且高分辨率图像文件体积大,给图像处理和模型训练带来困难。但随着多角度成像技术、数据处理技术的不断进步,以及自动化设备的发展,这些问题有望得到解决。
总的来说,“ScannerVision” 技术为医学节肢动物研究和深度学习模型训练提供了一种高效、实用的新方法。它推动了昆虫学研究方法的标准化进程,为生物多样性研究和疾病防控领域带来了新的思路和可能性,具有重要的科学意义和应用价值。