编辑推荐:
本文通过无人机获取小麦田间图像,构建 3D 点云与多光谱图像数据集,经分析得到动态数字表型,用于全基因组关联研究(GWAS)定位氮利用效率(NUE)相关基因位点。该研究为小麦 NUE 基因挖掘及高效品种选育提供精准表型数据,助力农业可持续发展。
研究背景
小麦是全球分布广泛、种植普遍且高产的谷类作物。过去 50 年,农业生产发展使全球粮食产量呈上升趋势,矮化基因引入和氮肥广泛使用对小麦增产作用关键。然而,粮食增产伴随农业生产成本增加,提高作物氮利用效率(NUE)成为实现农业可持续发展的关键。每提高 1% 的作物 NUE,每年全球农业生产成本有望节省达 11 亿美元。
氮是小麦生长发育必需的营养元素,培育氮高效小麦品种意义重大。但由于控制 NUE 的遗传网络复杂,寻找和鉴定关键 NUE 相关基因并阐明其作用一直是科学难题。
随着基因组学和测序技术发展,全基因组关联研究(GWAS)广泛应用于多种作物,可精准定位数量性状位点(QTL),鉴定与复杂数量性状相关的候选基因。在小麦研究中,相关研究已鉴定出多个与 NUE 相关的候选基因和 QTL,为小麦 NUE 遗传机制研究提供重要线索。
不过,大规模、高通量的田间氮利用表型分析仍是技术瓶颈,限制了对数量性状遗传基础的剖析。近年来,计算机视觉技术和深度学习算法发展,结合高通量植物表型平台,为植物研究、育种和农业生产开辟新途径。无人机(UAV)植物表型技术发展迅速,可获取高分辨率作物图像,结合图像处理和深度学习算法,能对小麦产量相关表型特征进行自动提取和定量分析。但目前无人机获取的多为静态表型,忽视了小麦生长过程中的 3D 形态变化,因此,持续监测小麦关键生长阶段的表型变化很有必要。
材料与方法
- 小麦种质、田间试验和多尺度表型数据生成:在 2020 - 2021 年南京小麦生长季,对 160 份来自长江中下游和黄淮海平原地区的自然小麦群体进行表型分析实验。设置不同氮梯度处理,包括 3 个氮水平(0、180 和 270 kg N ha-1,即 N0、N180 和 N240),2 次重复。小麦品种按特定规格播种,施肥遵循标准农事操作。
设计 2 种任务计划:用 DJI Mavic 2 Pro 无人机搭载高清 RGB 相机在 10 米高空拍摄小麦田 RGB 图像,通过 PIX4Dmapper 生成正射镶嵌图像和 3D 点云;用 DJI Matrice 600 无人机搭载 MicaSense 多光谱相机在 25 米高空收集多光谱图像,经 PIX4Dmapper 处理生成不同光谱带的正射镶嵌图像。在小麦生长的 8 个阶段进行 12 次飞行,获取 12 组 2D 正射镶嵌图像、12 组 3D 点云数据和 60 幅多光谱图像。2. 小麦 3D 地块表型自动化高通量分析流程:开发田间小麦 3D 地块点云注释工作流程,创建田间小麦 3D 地块分割(W3DPS)数据集。通过基于曲率和统计的滤波算法结合手动去除杂质点云,对目标地块点云进行预处理。采用 3D 语义分割网络 PointNet++ 训练数据集,该模型能有效分割不同氮处理下的 3D 地块点云,对分割后的点云进行 3D 特征提取。3. 多光谱表型分析:选择 4 种植被指数(VIs)评估小麦 NUE 和生长状况,包括冠层叶绿素含量指数(CCCI)、修正土壤调节植被指数(MSAVI)、相对植被指数 1(RVI_1)和相对植被指数 2(RVI_2),依据其公式和相关参数计算。4. 全基因组关联研究:利用 R 语言的 rMVP 包中的 FarmCPU 模型进行 GWAS 分析。计算前 3 个主成分的相关性和群体结构效应作为协变量,降低假阳性。将?log10(P 值)≥3.5 的标记视为显著单核苷酸多态性(SNP),通过 rMVP 自动生成曼哈顿图和分位数 - 分位数图展示结果,并在相关数据库搜索和注释候选基因。5. DNA 提取和基因分型:采用十六烷基三甲基溴化铵法提取基因组 DNA,所有品种在国内机构进行基因分型,使用含有 660,000 个多态性 SNP 标记的小麦 660K SNP 芯片。经过严格的 SNP 质量控制,去除缺失数据点超 10% 和次要等位基因频率低于 5% 的 SNP,最终保留 409,976 个高质量 SNP 用于 GWAS 分析。
研究结果
- 高速动态数字表型生成:动态表型能反映植物生长过程中目标性状随时间的变化,有助于分析遗传变异。通过 3D 地块分割和性状分析,获取小麦全生长周期的 3D 冠层高度时间序列数据,用高斯函数拟合生成不同氮处理下的冠层高度动态变化曲线。分析发现,不同氮处理下小麦高度变化和变化速率不同,N0 处理在特定阶段生长较慢,N180 和 N240 处理下小麦最终高度更高且误差区间更集中。基于高度变化分析,计算出 6 个与高度相关的动态表型。
- 基于高度相关数字动态表型性状的 GWAS 分析:对 160 份小麦地方品种进行 GWAS 分析,利用 6 个高度相关的动态数字表型性状,鉴定出多个与高度和 NUE 相关的显著 SNP。如与最大冠层高度()相关的 SNP 靠近已知影响株高的基因;与快速生长起始数据()等性状相关的 SNP 靠近与植物结构、产量相关的基因,表明这些动态高度表型可用于小麦高度和 NUE 相关基因挖掘。
- VI 动态表型生成:通过 4 种 VIs 的动态变化曲线提取表型,基于计算高度动态数字表型的方法,生成 VIs 的拟合曲线并提取 6 个动态表型性状。
- GWAS 结果支持 VIs 生成的动态表型在 NUE 遗传解析中的有效性:对 VIs 的动态表型进行 GWAS 分析,共鉴定出 298 个与生长发育相关的 SNP,9 个与 NUE 相关的位点。部分位点与已知 NUE 相关基因共定位,表明基于 NUE 相关光谱指数的动态表型能定位候选位点,数字表型在一定程度上可替代手动评分表型数据辅助 SNP 定位。
讨论
- W3DPS:田间小麦 3D 地块分割的开放数据集:随着开源深度学习数据集增多,植物 3D 点云数据集仍较少。创建 W3DPS 开放数据集,包含 160 个小麦品种 9600 个小麦地块点云和地面点云,覆盖长江中下游和黄淮海平原小麦品种生育期。希望通过添加全球不同小麦品种点云数据进一步扩展该数据集,助力小麦田间 3D 地块分割算法开发和相关育种研究。
- 基于无人机的数据采集方法实现田间小麦 3D 地块高通量动态表型分析:利用无人机获取田间 RGB 图像并重建 3D 点云,通过 PointNet++ 算法分割点云获取小麦 3D 静态表型,如 3D 高度。基于不同生育期高度数据拟合得到高度变化曲线,进而提取动态表型。同时,对无人机获取的多光谱图像进行处理,计算与氮利用相关的 VIs 并获取其动态表型。基于无人机图像的表型分析方法可替代手动测量,提高田间小麦表型分析效率和准确性,支持大规模商业育种。
- 高通量、多尺度数字表型和基因分型相结合提高遗传研究的准确性、统计效力和分辨率:动态或长期性状结合分子标记可揭示基因表达调控。本研究利用数字表型和基于静态数字表型生成的动态表型进行 GWAS 分析,定位到与小麦高度、NUE、生长和开花相关的基因位点,证明了动态表型在遗传多样性研究中的价值。高标记密度芯片弥补了小麦群体规模不足的问题,精确表型和性状细化对小麦表型遗传学研究至关重要。
- 研究局限与未来发展:本研究虽构建了多尺度数字表型分析流程,用于小麦 NUE 基因挖掘并取得一定成果,但仍存在局限。如点云分类时杂草点云误分类问题,后续计划优化 3D 点云分割模型,探索新的小麦地块分割方法,改进动态表型提取方法,划分不同品种生育期进行分析。还计划利用更大的小麦品种群体和多地点试验进一步挖掘与 NUE 相关的新 SNP,推动小麦田间试验研究发展。