
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于无人机影像与神经辐射场的果园三维重建及果树语义分割方法研究
【字体: 大 中 小 】 时间:2025年06月11日 来源:Computers and Electronics in Agriculture 7.7
编辑推荐:
针对大尺度果园场景下传统三维重建方法存在精度低、效率差的问题,研究人员提出UAVO-NeRF框架,通过非线性场景参数化压缩、多分辨率哈希编码和深度-语义联合优化策略,实现PSNR 23.82的逼真重建与mIoU 0.891的果树分割,为农业数字孪生提供创新技术方案。
在精准农业领域,果园环境的数字化建模是作物健康监测和农业自动化任务的基础。然而,传统三维重建技术如多视图立体视觉(MVS)和激光雷达(LiDAR)存在成本高、对光照敏感等局限,而新兴的神经辐射场(Neural Radiance Fields, NeRF)技术在大尺度果园应用中面临重建质量下降、处理速度慢等挑战。针对这些问题,广州科研团队在《Computers and Electronics in Agriculture》发表研究,提出UAVO-NeRF创新框架。
研究采用无人机(UAV)采集的果园RGB图像、深度图和语义图作为输入数据,核心方法包含五大技术创新:通过场景收缩模块将无界场景压缩至立方体空间;采用多分辨率哈希编码加速训练;引入Depth Anything模型生成深度先验;构建并行辐射/语义分支网络;设计融合深度、语义和透射率的混合损失函数。
Acquisition and processing of UAV image dataset
研究使用Vélez等提供的2.03公顷开心果园数据集,通过倾斜摄影获取162张5472×3078分辨率图像用于训练,垂直摄影86张图像用于测试。采用Segment Anything Model(SAM)生成语义标签,Depth Anything模型预测深度图,解决原始数据缺失问题。
Experimental Setup
在NVIDIA RTX 3090硬件环境下,比较UAVO-NeRF与Instant-NGP、Mip-NeRF 360等模型的性能。倾斜图像提供更丰富的三维结构信息,垂直图像验证新视角合成能力。训练采用Adam优化器,学习率5×10-4
,batch size 4096。
Discussion
实验结果显着:PSNR 23.82超越基线模型7.47 dB,语义分割mIoU达0.891。场景收缩策略使远处采样点密度提升3.2倍,哈希编码加速训练达22 FPS。深度正则化减少42%的几何伪影,动态外观嵌入有效缓解光照差异影响。
Conclusion
该研究实现三大突破:首次将NeRF应用于大尺度果园重建;创新性融合深度先验与语义信息;开发农业专用的混合损失函数。相比传统方法,重建速度提升8倍,内存占用减少67%,为果园数字孪生、无人机精准作业提供可靠技术支撑。研究获得广州市科技计划项目(2023B01J0046)和国家自然科学基金(61863011)资助。
生物通微信公众号
知名企业招聘