《Agronomy Journal》:Strengthening farmer-led experiments through agronomic and causal inference frameworks
1 引言
“务农即适应”,全球农民网络成员John Rigolizzo Jr.如是说。面对气候变化、环境目标、法规、新技术和消费者期望的转变,农业正变得日益复杂。农民通过自主实验来适应这些变化。这种内生性实验过程虽然为管理决策提供了实用知识,但由于对有限观察的误读,往往是一个缓慢且容易出错的过程。
数字农业技术,包括施用地图、产量监测和遥感,生成了大量数据,有助于解读无重复的田间试验。然而,这需要开发能够处理无重复实验数据的新分析方法。与试图通过随机对照试验(RCT)控制外部因素和空间变异性不同,数字技术允许在解读中考虑外部因素。这为农民和科学家之间的分散式研究和伙伴关系开辟了新的可能性。
生物刺激素是农民正在试验的新产品之一,旨在评估其是否适合其作物管理。一些生物刺激素含有固氮细菌,如Klebsiella variicola(Kv)和Kosakonia sacchari(Ks),据称可为玉米(Zea mays L.)提供生物固定的氮(N)。这些细菌定殖在根际或植物组织中,将大气中的氮转化为植物可利用的形式,潜在地替代了原本通过合成肥料供应的部分氮。这一新产品类别被视为农民提高氮利用效率、维持生产力和增加盈利能力的一种方式。
尽管固氮菌剂(NFI)被广泛商业化,但实验室、温室和田间试验对其效率的结果并不一致。一种特定的NFI产品据称可为玉米作物提供约40 kg N ha?1,允许农民在使用该产品时将其氮肥施用量减少相同数量。基于2024年尿素硝酸铵(32-0-0)肥料价格(40 kg N为62.25美元)和NFI产品的成本(49.50美元 ha?1),这代表了约12.75美元 ha?1的节省,这促使许多农民在自己的农场试验该产品并评估其效率。
然而,考虑到氮肥施用量通常超过作物实际需求作为一种风险管理策略,农民可能难以将处理和对照之间观察到的产量差异归因于NFI或充足的氮。数字农学可能为科学家与农民合作创造价值提供新途径,支持他们的田间试验(OFE)过程。环境分型或环境组学可用于更好地背景化田间试验,并利用数据层中捕获的景观属性帮助农民学习。产量图可以通过应用适应空间可变田间数据的分析方法,增强缺乏传统实验设计的田间试验推论的可靠性。
然而,许多农民,如纽约州的许多农民,无法获得产量图,并且收集、处理和学习数据的能力有限。这促使需要探索替代方法来支持农民进行可持续农业的实验。此外,在自己农场进行实验的农民不一定会在时间和空间上重复他们的实验,他们更倾向于在季末寻找一个结果(即一个可以从中学习到东西的结论)。虽然农学家在空间和时间上重复实验设计,但农民通常会迭代他们的实验设计,直到找到一个可行的解决方案。这表明,为了对农民主导的实验做出有价值的贡献,科学家可能需要提供一个能够处理单季和无重复地点数据的分析框架,这些数据可能不一定包括产量图。
因果图为表示田间试验中管理决策背后的因果逻辑提供了一种结构化的方式。它们有助于组织关于处理(如NFI)如何通过中间步骤(如生物定殖或作物氮状况)影响产量结果的思考。这些图表与许多农民通过农艺问题推理的方式一致,同时也为系统的数据收集和解读提供了基础。因此,它们为寻求支持农民主导实验而无需复杂重新设计试验布局或协议的科学家提供了一个有前景的工具。
本研究假设,应用结构因果模型框架可以提高解读无重复农民主导田间试验的可靠性,而无需改变农民现有的、自我指导的实验实践。具体目标是:(1)开发简化的因果图来表示NFI施用与玉米产量之间假设的因果效应路径;(2)评估并比较从该因果框架得出的结论与从产量图数据的定量空间分析中得出的结论,并对每个地点-年份进行独立评估。
2 材料与方法
2.1 田间试验背景与农民招募
2022年氮肥价格上涨促使农民探索玉米的替代氮管理策略。其中一种方法是在播种时施用固氮生物添加剂,同时减少追肥氮施用量(例如,根据制造商文献减少20–45 kg N ha?1)。几位纽约州农民在2022年和2023年生长季独立测试了这一策略,以降低氮成本。本研究中使用的生物产品含有Ks和Kv微生物,能够为作物提供约40 kg N ha?1。通过康奈尔合作推广人员和两个私人农学服务团体确定了农民。共有9个农场参与了本研究,在2022年和2023年生长季期间,在纽约州北部贡献了总共24个地点-年份。从这24个地点-年份中,有14个使用产量监测器进行了收获,其中4个产量数据集因收获期间的错误而丢失,因此本研究共有10个完整的数据集(每个地点-年份一个)。
2.2 农民主导的实验设计与地点特征
农民被邀请记录他们的实验过程、动机和研究问题。没有进行外部干预来影响他们的实验设计,这些设计在不同地点各不相同,包括以下方法:并排比较、条带试验、交替条带、相邻田块和牺牲性小区。尽管实验设计存在变异性,但所有试验都对照了对照(农民的标准氮施用量,因地点而异)与处理,其中在播种时施用NFI,同时追肥氮施用量减少0–44 kg N ha?1。所有其他管理措施在处理区和对照区之间相似。
2.3 数据收集
在所有地点-年份收集了四种类型的数据:实验设计信息、管理实践、辅助背景层和农艺田间测量。农民使用NFI和减少的追肥氮实施了他们自己的处理和对照比较,采用了多种布局,如交替条带和并排比较。通过访谈和数字农场记录收集了管理数据,包括播种日期和肥料使用情况。
辅助数据包括土壤和地形变量,来自公共数据存储库。这些图层用于背景化田间变异性并为空间模型提供信息。在每个地点-年份的四个采样点收集农艺数据,组织为跨越处理和对照区的两个配对比较。每个采样点包括用于通过qPCR检测NFI生物的土壤收集,以及用于基于干生物量和组织氮含量计算氮营养指数(NNI)的植物采样。
在每个地点-年份的四个采样点,在接种NFI约2周后从五株玉米植株收集根际土壤。样品在冷链条件下处理并储存在-70°C。使用DNeasy PowerLyzer PowerSoil Kit(Qiagen)提取DNA,并使用针对生物工程Ks和Kv菌株特有的专有合成DNA连接点的菌株特异性TaqMan qPCR测定法进行扩增。在Bio-Rad CFX热循环仪上进行扩增,基于合成靶DNA的标准曲线进行定量。基因拷贝数归一化为每克土壤,并使用1.5 × 104基因拷贝 g?1的检测阈值来区分定殖与背景水平。
NNI用于评估作物的氮状况,并推断接种剂提供的氮是否导致生理益处。NNI将植物生物量中的实际氮浓度(Ns)与给定生物量水平预期的临界氮浓度(Nc)进行比较。测量了每个采样点五株植物的干生物量和总氮(%),并记录植物群体以将生物量缩放到每公顷基础。Nc计算为地上部生物量的幂函数(Nc = 34.0 × W?0.37)。然后计算NNI作为测量的Ns与Nc的比率。NNI接近1表示最佳氮状况,低于1的值表明缺乏,高于1的值表明奢侈吸收而没有预期的产量增益。
从农民的产量监测器检索产量数据,并使用三步清理协议进行处理,以去除空间噪声和异常值。然后提取产量值,既用于空间建模,也用于采样点的特定地点解读。考虑到产量价值、处理小区节省的氮肥价值以及NFI处理的成本,产量数据也被转换为部分净收益。
2.4 数据分析
产量数据最初使用每个地点-年份内处理和对照区之间的简单描述性比较进行分析。处理后,产量观测值保留在约10 m × 10 m的空间分辨率下。对于简单分析,处理和对照区内的产量值在所有保留点上取平均值,以估计每个地点-年份的平均差异。计算平均产量差异时未调整田间异质性,反映了实践中常用的解读类型。使用Wilcoxon秩和检验评估产量差异的统计显著性。如果处理区的产量等于或高于(即比对照区高5%以上)对照区,则认为处理成功;如果处理区的产量低于(即比对照区低5%以上)对照区,则认为处理不成功。尽管缺乏无偏的产量阈值(与净收益阈值相比),但在解读方案中保留了产量,因为它是一个农艺参数而不是经济参数。计算部分净收入以支持结果解读。
对相同的数据进行了定量分析,作为与上述简单Wilcoxon秩和检验的比较,以确定考虑产量的空间变异性是否能为结论提供更高的确定性。对于每个地点,在空间回归之前和之后计算产量的Moran's I,以验证空间自相关性。为了解释空间结构和协变量不平衡,为每个地点-年份拟合了一个空间误差模型(SEM)。SEM解释了回归模型残差中的空间自相关性,当相关空间协变量被忽略或空间结构无法被预测变量解释时,这种情况就会出现。SEM特别适用于协变量解释后残差中仍存在空间依赖性的情况——这是农艺田间试验中常见的情况,其中未测量的空间因素(如微地形或土壤变异性)可能仍会影响产量。处理效应报告为处理和对照之间产量的平均差异以及p值。与简单分析类似,如果处理区的产量等于或高于对照区,则认为处理成功;如果处理区的产量显著低于对照区,则认为处理不成功。
与定量分析并行,实施了因果路径分析,以基于机制推理而非统计相关性评估处理效应。该方法建立在正式的因果推断原则和机制推理之上,旨在为无重复试验提供结构化和可复制的解读框架,在这些试验中,传统统计因样本量或设计限制而受限。
通过专家咨询开发了一个因果图,概述了从NFI应用到谷物产量的假设事件链。它包括三个中间机制:(1)根际中的NFI定殖,(2)由NNI反映的改善的氮状况,以及(3)由此产生的产量响应。该图经过简化,仅保留基本、非冗余和可测量的组成部分。
使用围绕四个顺序二元“门”构建的因果过程追踪框架评估处理效应。这些门由上述开发的因果图决定,按顺序测试:
门0:是否施用NFI处理(是,根据设计);
门1:是否使用qPCR在根际检测到接种剂DNA,阈值≥1.5 × 104基因拷贝 g?1土壤(基于对照区观察值);
门2:处理区的NNI是否比对照区高≥ -0.15个单位;在对照和处理之间氮施用量相等的站点,NNI是否比对照高> 0.15;
门3:处理区的产量是否比对照区高≥ -5%;在对照和处理之间氮施用量相等的站点,产量是否比对照高> 5%。
所有门都必须满足才能支持积极的因果主张。与从聚合的田间尺度数据推断关联的回归模型不同,该方法在因果机制层面评估证据,强调内部有效性。虽然多元回归模型估计平均处理效应,但路径方法通过将生物活性和生理响应与观察到的产量结果联系起来,提供结构化的、逐个案例的解读。这种跨独立证据线的三角测量旨在减少来自噪声产量数据的过度自信,并在实验重复不可行的情况下加强推断。
统计元素包括每个门的二元评分、基于文献或经验对照定义的阈值,以及通过确定性逻辑而非显著性检验进行的解读。虽然用户定义的阈值引入了主观性,但这些决策被记录、专家知情,并基于已发布的基准或田间对照,以确保透明度和一致性。
对于农民来说,这种方法反映了直观的农艺推理:产品是否影响了作物氮状况并促进了产量?通过可视化和系统地评估这些步骤,该方法支持从现实世界、无重复的田间试验中更自信地学习。当在多个农场实施时,因果图和过程追踪有助于识别模式、产品成功的背景条件,并支持集体决策。
3 结果与讨论
3.1 农民主导的NFI田间试验
本项目共记录了24个地点-年份,其中10个被纳入本研究,因为它们包含完整的数据集。虽然因果路径数据可用于所有24个地点-年份,但先前描述的分析结果仅报告了10个地点-年份的子集,这些地点-年份也有可用的产量数据,允许在因果方法和定量方法之间进行直接比较。这种过滤突显了使用产量监测器数据的一个关键局限性:尽管许多农民拥有产量监测设备,但本研究中不到一半的地点-年份(24个中的10个)包含允许完整分析的产量图。在某些情况下,收获期间的硬件或软件问题导致数据丢失或地图无法使用。相比之下,因果路径方法——依赖于计划的田间访问、采样和观察——允许在所有地点收集完整的数据集。它不需要专门的设备,并为农民和农学家提供了灵活性和控制权。
结果还强调了农民使用的实验设计的多样性,这直接影响数据质量和可解读性。例如,在一个地点-年份(SY1)中,农民沿着田边实施了对照处理(即牺牲性小区),该区域通常受到边缘效应的影响,如压实、遮荫、来自周围区域的杂草压力或改变的养分动态。这种布置引入了混淆因素,使解读复杂化,并且长期以来在农艺最佳实践中被劝阻。这些例子表明,虽然农民主导的实验可以产生有价值的见解,但实验设计方面的额外支持可能会提高严谨性并减少偏差。使农民能够使用自己的数据观察和反思其设计选择的后果,对于加强田间研究能力可能至关重要。
在2024年咨询参与农民以获取他们对结果的解读时,除一位农民(SY 9和10)外,所有农民都提到他们认为添加NFI是有益的,并且他们会再次使用它。其余九位农民得出结论,NFI处理没有产生有意义的结果。根据他们研究的原始假设,这表明他们认为处理区的产量低于对照区,因为他们设计实验是为了将无产量损失解读为成功结果(即,将他们预期NFI提供的氮肥施用量削减)。这里特意选择了“认为”这个词,因为即使其中两位农民(SY 3, 4, 5, 6, 7, 8)表示使用他们的运营中心查看处理间的平均产量,但没有一位农民或他们的农学家表示对数据进行了统计分析。SY 6、7和8属于同一位农民(即农场C),正如表1所示,两个地点-年份(SY6和SY7)处理区的产量确实较低,另一个地点-年份(SY8)的产量几乎相同。这强调了农学家和科学家在农民主导的田间试验中可以发挥的关键作用,即通过进行进一步的数据分析来提高观察的确定性。这也突显了一个未来研究的问题:尽管农民设计实验时认为无产量差异表明成功结果,但当产品未能达到他们的期望时,许多人仍然认为该产品无效。SY 3、4和5的农民甚至看到SY3和SY5的显著增长,但仍然不相信他们尝试的产品。与这位农民的对话显示,他们怀疑田间的空间变异性对实验结果的影响比产品本身更重要。虽然他们对SY5的看法是正确的(考虑空间变异性后产量差异变小),但对SY3来说情况恰恰相反。这表明,尽管农民意识到空间变异性对其实验结果的影响,但这些现象可能很难仅通过思维过程来掌握,因此再次突显了农民与数据科学家合作以更好地捕捉其实验结果的好处。
3.2 定量产量分析结果
3.2.1 简单分析
产量数据首先在不考虑协变量空间模式对产量影响的情况下进行分析。根据比较对照区与处理区产量的Wilcoxon秩和检验,SY 2、3、5和9的处理区产量似乎更高。对于其他田块,处理和对照区的产量之间没有显著差异。SY 6、7和8的分析结果为负(0),符合这些地点-年份对照和处理之间氮肥差异为0或4 kg N ha?1的情况。积极结果需要产量差异大于5%。5%的差异截止值似乎低估了净收益的差异,例如在SY 2中,4%的差异转化为114.59美元的净收益差异。在这里,它不影响结果;然而,如果这种差异是负的,如此大的每公顷收益差异不容忽视。尽管如此,虽然净收益包含多个组成部分,包括节省的氮,但产量仍然是一个在农艺基础上更具可解读性的指标。简单的平均比较可能会受到协变量空间效应的偏差,因此需要本节中展示的更彻底的定量分析。然而,重要的是要注意,在没有额外支持和数据的情况下,农民很可能依赖表2中显示的信息(平均产量的简单比较)进行决策,因此这成为与进一步分析进行比较的参考。
3.2.2 协变量解读
可用协变量(例如,土壤图、地形导数)的解读支持定量分析,其中产量被建模为处理和田间属性的函数,空间相关的残差变异性通过空间误差结构捕获。这种方法调整了潜在的空间异质性,并能够在观察性、无重复的田间试验中更可靠地估计处理效应。在这种情况下,生成了每个协变量的对照和处理田间区域的经验分布函数图,用于视觉评估处理和对照区之间的可比性。最引人注目的观察结果是,协变量分布在对照和处理区之间的重叠度最高的是SY 6、7和8,它们都使用了覆盖大部分田间表面的“交替条带”实验设计。另一方面,图1显示,单一条带试验应谨慎解读,因为对照和处理区之间外部因素可能存在差异(在本例中为沙粉比)。这是一个强有力的迹象,表明在可行且没有协变量可用于指导定量分析的情况下,交替条带是更好的田间布局。这也是一个强有力的指标,表明对于更简单的实验设计,如单一条带或并排比较,在分析中考虑外部因素很重要,因为实验设计没有“控制”这些外部因素。尽管如此,表2显示,当查看SY4的非显著平均产量差异0.06 Mg ha?1与校正后的显著产量差异0.86 Mg ha?1相比时,条带之间仍然存在一些需要校正的空间差异。这也暗示,对于具有单一处理条带的田块,最可取的是定义一个单一的相邻条带,或处理条带两侧的一对条带,作为对照参考,而不是处理条带之外的整个田间区域。当使用单一对照条带时,同样的逻辑也适用。
另一个需要考虑的重要方面是分析中使用的协变量之间的相关性。对于描述土壤的变量,容重、有机质含量和两个与土壤质地相关的变量,情况更为复杂。SY7和SY8都显示出这四个变量之间强相关性的清晰模式。其他田块也可见类似的相关模式,但相关系数较低。对于其他田块,存在反向或弱相关。容重取决于颗粒大小分布、有机质含量以及其他结构因素,如深度。在这个数据集中,深度是标准化的,因此,田块中容重的变化很大程度上是由于土壤质地和有机质含量造成的。这证明了从容重从因变量列表中剔除是合理的。
地形特征由四个变量表示:高程、坡向、坡度、TPI和alpha。一般来说,高程和坡向是不相关的,尽管在特定地点可能存在一些相关性。在给定点,坡度源自该点的高程与周围区域高程的线性组合之间的差异。因此,不应期望坡度和高程之间存在相关性,因为相同的坡度可以在变化很大的高程上观察到,尽管同样,在特定地点,这种坡度和高程之间的相关性可能存在。例如,在一个田块中,整体高程从一端到另一端下降,随着向田块较低部分的过渡,坡度更平缓,这将导致坡度和高程之间呈正相关,如SY 9的情况。TPI用于识别形成洼地或峰值的区域。它基于高程数据,但与坡度一样,其值源自高程的差异。在协变量之间的相关性解读之后,为后续分析保留的五个协变量是近地表(5–15 cm)的有机质含量、沙粉比的对数(log(沙粉比))、粘粉比的对数(log(粘粉比))、TPI和alpha指数,从而涵盖了土壤物理和化学性质以及地形指数方面。这些属性在时间上是稳定的,并且被认为在田间尺度上与产量显示出相关性。总体而言,选择了五个协变量进行回归分析,三个表征土壤性质,两个表征地形。
3.2.3 空间回归分析
Moran's I检验一致表明所有田块的残差中存在显著的正空间自相关性,表明空间效应违反了OLS模型的假设。由于SEM解释了残差中的空间相关性,因此实施了SEM来解决数据中缺乏空间独立性的问题。尽管与OLS相比,SEM改善了模型拟合度并减少了残差空间自相关性,但所有地点-年份的Moran's I值仍然显著,尽管平均降低了约35%(取决于地点,范围为16%–56%)。这表明SEM能够解释数据中大部分的空间自相关性,因此提高了模型结果的可靠性。此外,在SEM框架下,10个田块中有5个的处理效应具有统计显著性(p ≤ 0.05)。这导致一个地点(SY8)的结果与简单分析不同,在SEM校正后,该地点的产量显示处理区高于田块的对照区(该SY的对照和处理都接受了相同数量的氮)。
这些结果表明,在数据中考虑空间结构比直接对结果变量中的空间依赖性建模更有效地解释了田间尺度的产量空间异质性。因此,SEM被认为是本研究估计处理效应的适当方法,并证实了在分析来自田间试验的非重复、观察性产量数据时考虑空间依赖性的价值。
3.3 设计因果图
在非正式咨询农民和专家直至新信息饱和后,以下是提出的最重要的考虑因素和陷阱:
- 1.
一位农民想知道接种时产品是否确实还活着,考虑到它是一种活的产品,应该相应处理。例如,一位农民提出,如果中午把罐子放在阳光下,下午完成工作,这会影响产品的活力吗?
- 2.
一位农民想知道产品是否在所有植物上定殖均匀,以及它是否渗透到土壤更深处(即,接种区以下)。
- 3.
土壤微生物学家提到,如果在接种后两周检测到NFI生物的DNA,这将表明该生物在接种时是活的,因为它必须有效地定殖根部才能被检测到;否则,其DNA在那时被降解的可能性要大得多。
- 4.
土壤微生物学家提到,检测到产品并不能最终证明它正在为作物固定大量的氮,并且固氮可能随时间不稳定。
- 5.
土壤科学家和氮肥施用专家提到,农民为了确保最大产量而过度施用氮肥是很常见的,如果氮供应过量,对照和处理之间相似的产量可能归因于两个区域作物都有足够的氮,而不是NFI补偿了氮肥的少量减少(例如,40 kg N ha?1)。
这些输入被用来更好地为本项目的完整因果图设计提供信息。然后按照前面提到的四个步骤简化了完整的因果图。没有因素被确定为不重要。这是因为该图包含高级变量而不是细节,并且包含的少数细节被认为是重要的。为了冗余,变量天气、土壤、管理和压力被合并到变量“地点效应”中,所有这些变量在不同地点之间是可变的,但在实验尺度上在同一地点内是不可变的。土壤空间变异性可能影响NFI存活率和整个田间的氮状况。然而,这种效应是未知的,因此在本研究中被有意忽略。因果图中包含的所有中介对于本研究都很重要,因为它们表征了从添加NFI到谷物产量的步骤,因此,在简化过程中没有移除任何中介。最后,没有实际的方法来测量接种前NFI产品是否处理不当;所有农民都假设他们按照标签说明正确处理了它。假设这将在“土壤中NFI存活”变量中被捕获,前提是如果NFI在接种前处理不当死亡,则不会通过qPCR分析在土壤中检测到。由于这些原因,尽管“接种前NFI处理”变量可能对土壤中的存活有重要影响,但认为将其包含在最终图中是无关紧要的。因此,在考虑地点水平评估时,最终的因果图(图2)由NFI在播种时添加到玉米谷物产量效应之间的两个中介组成。
3.4 因果路径结果
虽然简单和定量分析产生了有些相似的结果,表明NFI似乎在所有测试的SY上都有效(处理区产量等于或高于对照区),但因果路径分析产生了显著不同的结果,只有三个SY被认为处理有效(即通过了所有三个门;表3)。这很可能是由于因果路径分析在确定处理何时产生积极结果时更为保守。事实上,这三个门中的每一个都由不同的数据源提供信息,每个数据源都包含其自身的不确定性来源。虽然向较高值的偏差不会对结果产生影响,但向较低值的偏差可能导致低于阈值,当三个不同的指标都经历这个过程时,这种影响会被放大。这意味着要可靠地通过所有三个门,值必须足够高于阈值才能持续通过所有三个门,这在一定程度上解释了为什么这种方法比仅基于产量结果的方法更为保守。因果路径返回的多数负面结果(10个中的7个)与过去使用随机对照试验评估选定的市售NFI性能并观察到结果好坏参半的研究更为一致。
每个田间仅使用两个位置(A和B)是由采样分析的成本驱动的,尤其是qPCR分析。不幸的是,配对的样本数量和如此少的观察次数使得难以清楚地评估每个门的结果(例如,SY4两个位置的对比产量),因此容易出错或误读。奇数或更多的观察次数将有助于更好地澄清每个门的裁决。仅采样两个位置的原理是基于这样的假设:对于给定位置,这种农艺因果过程不包含不确定性;NFI施用要么与产量相关,要么不相关。例如,如果在土壤中未检测到NFI,它就不能促进产量。然而,当考虑到所有农业田间存在的空间变异性时,从一个位置到另一个位置的结果变异性是必然存在的。因此决定在田间的对比部分采样第二个位置(由农民指示指导),以评估标准是否在一系列条件下得到满足。虽然qPCR和NNI的信号是一致的,但产量的变异性更大,特别是由于使用点测量,这解释了偶尔对比的结果(例如,SY 4、5和10)。这与定量分析中产量图观察到的变异性一致。
总体而言,因果路径分析的实施是直观的,因为它很大程度上模仿了人脑在创建因果联系时的正常本能。然而,在第一次观察结果并不得不重新定义某些阈值时,出现了一些困难。例如,在没有查看数据的情况下,qPCR阈值被设置为高于阵列板上对照读数的任何基因计数。然而,在每个田间的对照区(即未施用NFI的地方)收集了样本,并且在那些位置观察到的基因计数远大于微阵列板对照。这被用来重新定义阈值,从而影响了qPCR门的结果,从几乎所有田间都通过阈值变为表3中显示的结果。因此,建议使用已建立的指标或在分析前测试候选指标,从而预先定义一组阈值,以避免在分析过程中途不得不更改分析过程,这感觉是武断和有偏见的(例如,如果未在对照区收集样本怎么办),尽管使用了充分的咨询和尽职调查来设定新的阈值。总的来说,确定每个门的阈值是一个近似的过程,可能对分析的最终结果产生影响。在统计学中,0.05的alpha水平最初是以某种近似的方式确定的,并成为一种惯例。在因果路径的情况下,必须为每个门确定这个阈值,并且不存在惯例,例如,定义什么构成产量的显著增长。因此,这种方法需要深思熟虑地确定阈值,这些阈值可能会受到无休止的审议,除非基于投资回报率等概念,而这会因农场而异。这种复杂性水平可能不是必需的,因为目的是确定NFI是否确实促进了