融合八叉树加速采样与形态学增强的梅花鹿点云分割及体尺测量方法SikaPointNet++
【字体:
大
中
小
】
时间:2025年10月15日
来源:Computers and Electronics in Agriculture 8.9
编辑推荐:
本研究创新性地提出SikaPointNet++方法,通过八叉树加速采样优化点云处理效率,结合形态学增强技术提升分割精度,实现了梅花鹿点云数据的自动化分割与体尺测量。该方法为野生动物三维数字化建模提供了新思路,在畜牧监测与生物力学研究领域具有重要应用价值。
• 本研究提出自动化文本生成流程,应用大规模多模态模型(LMM)与结构化零样本思维链(Zero-shot CoT)提示技术,从纯图像数据集生成植物病理学图像的详细描述,构建高保真图像-文本对,显著降低对人工标注的依赖。
• 开发了融合视觉特征与自动生成文本的多模态识别架构,系统分析了文本生成模型(LLaVA/CogAgent)与视觉特征提取器(ResNet50+LSTM/CLIP+PVD)的融合适配机制,首次实现植物病害诊断中文本自动合成与多模态融合策略的联合优化。
• 在PlantDoc数据集上的实验表明,CogAgent结合CLIP(ViT-L/14)与投影视觉-文本判别器(PVD)模块达成70.76%的F1值,LLaVA与ResNet50+LSTM组合达到66.38%的F1值,验证了自动化管道在多模态分类中的有效性。
本研究提出了一种基于纯图像样本的多模态学习框架,通过自动图像描述生成(AIDG)技术产生文本输入,并与视觉模态进行融合。该框架首次实现了对农作物病害样本的自动化文本描述增强,通过全自动流程弥合模态差异,为资源受限的农业场景提供了可扩展的多模态诊断方案。
通过系列实验验证了所提多模态框架的有效性与鲁棒性。该框架利用自动生成的文本描述增强纯图像样本,构建多模态输入。本节详细介绍了数据集、评估指标、基线模型及实验配置,通过对比分析探究了不同特征编码器、文本生成模型与融合策略的影响。
本研究提出的自动化多模态框架通过融合视觉与文本信息,显著提升了田间环境下的作物病害识别性能。利用大型视觉语言模型生成具有语义上下文的病害症状描述,结合定制化的多模态分类管道,为实现轻量化、可解释的农业病害诊断系统提供了技术支撑。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号