通过田口设计（Taguchi design）和基于语言模型的差分进化（differential evolution）方法进行智能神经架构搜索，以应用于农业图像识别

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

《Expert Systems with Applications》：Intelligent neural architecture search via Taguchi design and language model-based differential evolution for agricultural image recognition

【字体：大中小】 时间：2026年01月19日 来源：Expert Systems with Applications 7.5

编辑推荐：

　　提出两阶段神经架构搜索（NAS）框架，结合Taguchi方法筛选超参数与LLM增强的差分进化优化ViT架构，在番茄、芒果等四类作物病害检测数据集上验证，实现98%以上准确率，优于传统CNN模型。

Debtanu Ghosh|Subhayu Ghosh|Nanda Dulal Jana|Rammohan Mallipeddi

印度西孟加拉邦Durgapur国家技术学院数学系

摘要

视觉变换器（ViTs）因其在各种计算机视觉任务中实现先进性能的能力而受到广泛关注。然而，设计一个最优的ViT架构需要丰富的领域专业知识和计算资源，这对研究人员来说更具挑战性。超参数的选择对模型性能至关重要，但确定最具影响力的参数仍然是一项复杂的任务。为了解决这个问题，我们提出了一种两阶段的神经架构搜索（NAS）框架，该框架结合了基于Taguchi方法的设计实验（DoE）和通过大型语言模型（LLM）增强的差分进化（DE）交叉策略。DoE-Taguchi方法用于系统地分析超参数的重要性，并根据它们对模型性能的影响对其进行排名。然后使用这些排名参数来指导DE过程，其中LLM辅助的交叉机制增强了探索能力和收敛速度，从而发现了接近最优的架构。所提出的方法在三个不同的农业图像数据集上进行了训练和测试。实验结果证明了基于DoE和DE-LLM优化的ViT模型的有效性，它们能够在处理农业数据集的独特复杂性时表现出优异的准确性和可靠性。

引言

农业对于粮食安全、经济稳定和原材料供应至关重要（Rusdiyana, Sutrisno, & Harsono, 2024）。随着人工智能（AI）的进步，现代农业实践有了显著改进（Elbasi, Mostafa, AlArnaout, Zreikat, Cina, Varghese, Shdefat, Topcu, Abdelbaki, Mathew, et al., 2022, Javaid, Haleem, Khan, Suman, 2023, Jha, Doshi, Patel, Shah, 2019, Liu, Ma, Shu, Hancke, Abu-Mahfouz, 2020, Mahmood, Matin, Goudos, Karagiannidis, 2023），特别是在植物病害检测方面。早期和准确的病害识别对于减少损失和确保高质量的产品至关重要。然而，由于气候、土壤条件和害虫侵扰等多种因素，这仍然具有挑战性。传统方法难以在不同地区推广，因此需要能够检测微妙视觉模式的AI驱动模型（Oliveira & de Souza e, 2023）。尽管机器学习和深度学习增强了农业分析能力，但为动态环境开发稳健的模型仍然是一个持续的研究挑战。

计算机视觉的进步带来了视觉变换器（ViTs）（Dosovitskiy, Han, Wang, Chen, Chen, Guo, Liu, Tang, Xiao, Xu, Xu, et al., 2022, Liu, Zhang, Wang, Hou, Yuan, Tian, Zhang, Shi, Fan, He, 2023）的引入，这些模型在处理农业图像分析相关挑战方面显示出巨大潜力（Agarwal, Singh, Arjaria, Sinha, Gupta, 2020, Albahar, 2023）。与传统方法不同，ViTs利用自注意力机制捕捉长距离依赖关系并从图像中提取全局上下文信息。这种能力显著改变了各种计算机视觉任务，包括图像分类、对象检测和分割，使模型能够分析整个图像的空间关系，而不仅仅是依赖局部特征。与卷积神经网络（CNNs）（Geetharamani & Pandian, 2019）不同，后者依赖于通过卷积层提取局部特征，ViTs（Maurício, Domingues, & Bernardino, 2023）将图像分割成一系列补丁，并像处理文本序列中的单词一样处理它们。这种基于补丁的表示方式使ViTs能够有效地建模图像不同区域之间的关系，使其在全局上下文起关键作用的复杂数据集中特别有用。在农业成像中，作物模式、病害症状和环境条件在图像的不同区域差异很大，这种全局注意力机制使ViTs（Barman, Sarma, Rahman, Deka, Lahkar, Sharma, Saikia, 2024, Ghosh, Sarkar, Ghosh, Zalkow, Jana, 2024, Hossain, Tanzim Reza, Chakrabarty, Jung, 2023）在植物病害检测、作物分类和产量估计等任务中表现出优异的性能。尽管有这些优势，设计特定任务的ViT架构仍然是一个复杂的过程，需要大量的实验和领域专业知识，因此需要自动化优化技术，如神经架构搜索（NAS）（Liu, Sun, Xue, Zhang, Yen, Tan, 2021, Wistuba, Rawat, & Pedapati, Zhou, Qin, Sun, Tan, 2021）。图1展示了NAS的一般工作原理。

NAS（Ren, Xiao, Chang, Huang, Li, Chen, Wang, 2021, White, Safari, Sukthanker, Ru, Elsken, Zela, Dey, & Hutter）已成为自动化设计优化神经网络架构的强大技术。它系统地探索定义的搜索空间，以发现适用于特定任务的高性能架构。在各种NAS策略中，差分进化（DE）（Awad, Mallik, & Hutter, Das, Suganthan, 2010, Dhar, Anuvab, Bandyopadhyay, Jana, Ghosh, & Sarayloo, Mallipeddi, Suganthan, Pan, Tasgetiren, 2011, Si, Hazra, Jana, 2012, Wang, Sun, Xue, Zhang, 2018）因其简单性、可扩展性和处理高维搜索空间的有效性而受到广泛关注。DE作为一种基于种群的优化算法，通过结合种群中的不同解决方案来迭代改进候选解决方案，从而生成新的解决方案。这种方法特别适合NAS，因为它能有效地导航复杂的搜索空间，是优化深度学习模型的有效工具。

大型语言模型（LLMs）（Custode, Caraffini, Yaman, Iacca, 2024, Hu, Liu, Zhao, Hou, Nie, Li, 2023）通过从大量数据中学习复杂模式，改变了AI应用。它们提高了自然语言处理（NLP）、代码生成和决策等任务的性能。在NAS中，LLMs通过智能选择架构组件来优化搜索过程。本研究将LLMs与DE算法结合，以提高模型效率和适应性。

本研究提出了一种两阶段的NAS框架，该框架结合了设计实验（DoE）-Taguchi方法（Karna, Sahai et al., 2012）和通过LLM增强的交叉策略，以优化农业成像的ViT架构。主要目标是通过系统地识别有影响力的超参数并高效自动化地改进模型架构，从而促进叶病害的早期检测。我们的方法分为两个阶段：在第一阶段，我们使用Taguchi方法和正交阵列（OA）及方差分析（ANOVA）来评估超参数的重要性，以在优化之前缩小搜索空间。在第二阶段，在识别出关键超参数后，我们进一步探索搜索空间。基于LLM的交叉策略提高了探索效率，使得ViT架构具有更高的准确性和更低的成本。

我们工作的主要贡献总结如下：•

本研究提出了一种NAS框架，该框架结合了DoE-Taguchi方法进行超参数排序，并使用DE和基于LLM的交叉策略来优化ViT架构的搜索。

•

通过使用Taguchi方法和ANOVA，系统地评估和排名超参数，降低了搜索空间的复杂性。

•

通过结合基于LLM的细化机制，改进了DE中的交叉策略，使得架构探索和收敛更加高效。

•

本研究专注于叶病害的早期检测，证明了所提出方法在现实农业应用中的有效性。

本文的其余部分结构如下：第2节涵盖背景和相关工作，第3节详细介绍数据集，第4节解释方法论，第5节展示结果和讨论，第7节概述局限性，第8节总结未来研究方向。DoE和基于LLM的DE-NAS框架的数据集和源代码可在github公开获取。

部分摘录

实验设计（DoE）：Taguchi方法

DoE是一个系统化的框架，用于规划、执行、分析和解释控制测试，以评估影响响应变量的因素。它由Ronald A. Fisher在20世纪30年代提出，提供了一种统计方法来优化流程、提高效率并识别影响结果的关键变量。

传统的一次一个因素（OFAT）方法效率低下，因为它们忽略了变量之间的相互作用。DoE使用Taguchi方法来解决这个问题

数据集描述

在这项研究中，我们使用了四个不同的数据集来检测番茄、芒果、香蕉和苹果叶子上的病害。番茄叶病数据集包含18,346张图像，分为10个类别，包括细菌性斑点（1702）、早疫病（1921）、晚疫病（1851）、叶霉病（1882）、壳针孢病（1745）、红蜘蛛（1741）、靶斑病（1827）、黄曲病毒（1961）、花叶病毒（1790）和健康叶子（1926）。图2展示了10张样本图像，每张代表一个不同的类别

方法论

由于环境因素的影响，农业数据集具有高度变异性，手动调整ViT模型的超参数非常耗时。为了高效优化性能，我们使用带有突变和基于LLM的交叉策略的DE，而不是传统的交叉策略，从而能够识别接近最优的超参数设置。这种方法加速了向高性能架构的收敛过程，如图5所示。

我们将过程分为两个阶段。

结果与讨论

所提出的两阶段ViT方法在代表健康和病态条件的农业数据集上进行了评估。在第一阶段，我们尝试确定超参数的重要性，然后根据这些重要性重新定义超参数搜索空间，并应用LLM引导的DE来寻找最佳的ViT架构，最终结果在分类指标、混淆矩阵和其他重要指标上进行了讨论。

我们使用Taguchi的L18 OA进行了

比较研究

表5展示了用于检测番茄叶病的各种深度学习模型的比较评估。在这里，我们比较了一些现有的CNN模型和我们提出的模型在准确性、F1分数、精确度、召回率、Cohen’s kappa和推理时间等关键指标上的表现。

与基线模型相比，所提出的方法在所有评估指标上都表现出更好的性能，实现了最高的准确性（98.06%）、F1分数（98.0535）、精确度

研究的局限性

尽管我们的两阶段框架——结合了Taguchi方法和基于LLM的交叉策略——表现出强大的性能，但它也存在一些局限性。首先，超参数优化是针对特定数据集定制的，这引发了关于其在不同农业环境中普遍适用性的担忧。其次，由于我们使用了L18正交阵列，计算成本较高，可能排除了更优的配置。此外，Taguchi方法主要

结论与未来工作

总之，本文提出了一种用于农业图像的ViT的两阶段框架，结合了Taguchi的实验设计与基于LLM的DE。第一阶段使用L18正交阵列分析超参数的重要性，以识别有影响力的超参数；在第二阶段，根据这一排名重新定义搜索空间，并应用基于LLM的交叉策略来高效搜索接近最优的配置。所提出的方法自动化了

利益冲突声明

作者声明他们没有已知的竞争性财务利益或个人关系可能会影响本文报告的工作。

联系信箱：

粤ICP备09063491号

摘要

引言