大尺度随机森林作物分类模型的时空可迁移性及温度模式相似性的关键影响
【字体:
大
中
小
】
时间:2025年09月30日
来源:International Journal of Agricultural Sustainability 2.9
编辑推荐:
本刊推荐:本研究系统评估了基于随机森林(RF)和Landsat/Sentinel-2时间序列数据的大尺度作物分类模型在跨洲际(美国至欧洲六国)应用中的时空可迁移性。结果表明,模型迁移可实现高精度(OA:88.1–96.8%)作物制图,且迁移模型与本地模型精度差异≤2.0%。研究首次量化揭示区域间年温度模式相似性是影响模型迁移性能的关键因子(PCC>0.6),为无样本区域作物分类提供了实践方案与理论指导。
准确获取作物类型空间分布对粮食安全、作物轮作和产量预测至关重要。传统基于野外调查的样本采集方式成本高、效率低,难以支撑大区域作物制图需求。模型迁移技术为这一难题提供了可行解决方案——通过在已有充足样本的源区域(如美国)训练分类模型,并将其应用于无样本的目标区域(如欧洲国家)。尽管已有研究证明了机器学习模型在作物分类中具有良好的时空泛化能力,但当前研究仍存在两大局限:一是研究区域通常较小,国家级大尺度作物分类模型的迁移能力有待验证;二是不同训练区域获得的模型存在性能差异,但其驱动因素缺乏定量分析。
本研究以美国三大州(堪萨斯、南达科他、明尼苏达)为训练区,欧洲六国(德国、法国、罗马尼亚、波兰、西班牙、意大利)为制图区,利用Landsat-8和Sentinel-2卫星影像构建月度时间序列数据,结合植被指数和光谱特征,基于随机森林(RF)算法开发作物分类模型,并系统评估其跨区域、跨年份的迁移性能。
研究采用Google Earth Engine(GEE)平台进行数据预处理、时间序列构建和特征提取。选择了Landsat-8和Sentinel-2共有的6个光谱波段,并计算了7种常用植被指数,包括归一化植被指数(NDVI)、增强植被指数(EVI)、绿色叶绿素植被指数(GCVI)、修正土壤调节植被指数(MSAVI)、地表水分指数(LSWI)、归一化衰老植被指数(NDSVI)和归一化耕作指数(NDTI),形成13个特征波段。
为构建高质量时间序列,研究采用月中值合成算法生成月度影像,并对缺失值进行线性插值,最终获得3–10月共8个月份×13个波段=104维特征向量,作为RF模型的输入。
使用2019年堪萨斯州训练的模型对欧洲六国进行作物分类,总体精度(OA)介于88.1%至96.8%之间,其中西班牙精度最高(96.8%),罗马尼亚稍低(88.1%)。单类作物分类中,玉米的生产者精度(PA)为88.3–91.9%,用户精度(UA)为90.1–99.1%;小麦的PA为86.2–99.1%,UA为85.3–97.5%。结果表明,基于美国数据的模型在欧洲仍能保持高精度分类能力,显示出强大的空间可迁移性。
将2019–2023年堪萨斯州不同年份的模型分别应用于同一目标区域,年度间精度变化幅度很小:德国2.0%、法国1.2%、罗马尼亚1.2%、波兰0.8%、西班牙0.6%、意大利0.6%。表明同一训练区域不同年份的模型具有高度稳定的时间迁移性。
比较三大训练区域的模型性能发现,堪萨斯模型表现最佳,明尼苏达次之,南达科他最差。2019年模型中,不同州模型在德国的精度差异高达21.5%,在意大利达11.9%。值得注意的是,西班牙对所有来源模型都表现出较高的精度稳定性,说明该地区作物生长环境可能更具包容性。
研究还发现,合并多个区域或年份的训练样本并不能提高模型迁移性能,反而会导致精度下降。区域合并带来的性能下降比年份合并更为明显,说明空间异质性对模型性能的影响大于时间变异。
与使用本地样本训练的模型相比,迁移模型的总体精度差异不超过2.0%,其中德国差异最大(-2.0%),波兰最小(-0.5%)。在空间分布上,两种模型产生的作物分类图高度一致。表明迁移模型能够达到与本地模型相当的分类效果,为无样本区域作物制图提供了可靠替代方案。
通过定量归因分析,发现训练区与制图区之间的温度模式相似性与模型迁移性能呈显著正相关(PCC>0.6),而降水相似性影响不显著。线性回归分析表明,温度模式相似性可以解释41–68%的精度变异(RMSE:0.18–0.21)。
这一发现可以通过作物物候学解释:温度是作物生长发育的主要驱动因素,温度模式相似的地区,作物物候期和光谱特征也更加接近。例如,堪萨斯与欧洲国家冬季温度较为温和,小麦NDVI峰值出现在5月左右,主要以冬小麦为主;而明尼苏达州冬季寒冷,小麦NDVI峰值出现在7月左右,主要种植春小麦。这种温度驱动的物候同步性显著提高了模型迁移的准确性。
本研究证实了基于美国CDL数据和卫星影像的作物分类模型在欧洲国家的有效迁移性,为大范围无样本作物制图提供了实用技术方案。温度模式相似性作为影响模型迁移性能的关键指标,可用于指导最优训练区域的选择。
研究也存在一定局限:目前仅针对玉米和小麦两种主要粮食作物;验证数据依赖欧洲LUCAS调查数据,限制了更广泛地理环境的测试;未来将扩展更多作物类型,并系统比较深度学习方法在大尺度作物分类中的迁移性能。
本研究发展了一种基于分类模型迁移的国家级作物制图方法,系统评估了大尺度作物分类模型的时空可迁移性。主要发现包括:堪萨斯2019年模型在欧洲六国可实现高精度作物分类(OA:88.1–96.8%),且年份间变异很小(0.6–2.1%);不同训练区域的模型性能差异显著(最高达21.6%),堪萨斯模型表现最佳;迁移模型与本地模型精度相当(差异≤2.0%);区域间温度模式相似性是影响模型迁移性能的关键因素。该研究为无样本区域作物分类提供了实践方案,并为最优训练区域选择提供了理论依据。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号