近年来,我国农业结构不断优化,区域布局趋于合理,粮食生产连年丰收,有力保障了国家粮食安全,为稳定经济社会发展大局提供了坚实保障。同时,部分地区也出现了耕地“非粮化”“非农化”倾向,任其发展势必影响国家粮食安全。随着人工智能的发展,深度学习应用于物体识别技术日臻成熟,将其运用于卫星影像建筑物疑点自动识别,可有力破解当前人工标注质效低的难题。本文以某县基本农田保护审计为例,探讨基于深度学习技术识别县域基本农田建筑物疑点的思路和方法,以期对保障粮食安全工作起到借鉴作用。
一、基于深度学习的建筑物自动识别思路
卫星影像建筑物标注是常用的疑点生成方法,在保护基本农田等方面具有重要作用,当前普遍采用人工标注方式,工作量大,过程机械重复,标注较为粗放。深度学习是人工智能的重要实现方法之一,近年来,在数据挖掘、图像物体识别、自然语言处理等领域都取得了令人瞩目的成果。在计算机视觉领域,深度学习的性能和效果也逐步超越了传统方法,目前已广泛应用于行人检测、人脸识别等领域。根据任务特性,深度学习技术应用于图像特征明显的卫星影像建筑物自动识别具有可行性。
使用深度学习自动识别卫星影像建筑物主要分为两个阶段:一是训练阶段,即学习阶段,人工标注大量建筑物作为训练样本,指导深度神经网络模型迭代学习,当模型不再改进时停止学习。二是预测阶段,即应用阶段,使用训练完成的模型自动提取影像的深度特征,并识别与训练样本中特征类似的建筑物。
二、自动识别基本农田上建筑物疑点步骤
本文以县域基本农田建筑物疑点识别为例,使用内置深度学习PyTorch框架的地理信息软件ArcGISPro2.5。首先,在影像上标注大量建筑物区域,训练深度神经网络模型;然后,使用模型对全县建筑物进行识别,生成县域建筑物覆盖区图层并进行图形处理;最后,将建筑物覆盖区与基本农田矢量图层叠加,生成基本农田建筑物图层,人工剔除非建筑物区域,得到基本农田建筑物疑点。
(一)训练深度学习模型
审计人员使用ArcGISPro分类工具中的“标注样本以供深度学习使用”,将所有建筑物归为一个类别,并在县域卫星影像中标注余处多种类型的建筑物,然后导出标记好的图片作为深度神经网络模型的训练数据。使用训练数据和“训练深度学习模型”工具,选择U-Net语义分割网络进行迭代训练。
需要注意的是,高质量的数据标注是建立深度学习模型的基础。对各种类型和不同面积的建筑物均衡标注可避免模型“偏科”。针对识别效果较差的建筑物类型,对训练数据不断更新,将训练好的模型作为预训练模型,在此基础上继续训练可增强模型性能。此外,通过数据增强、选择合适的训练参数,也能有效提高训练效率,增强模型性能。
(二)生成县域建筑物覆盖区
在预测阶段,利用“使用深度学习对像素进行分类”工具,将全县卫星影像输入模型自动识别建筑物,生成建筑物覆盖区。根据识别效果,可以选择不同的策略进行改善,如调整训练数据、多模型输出合并等。
模型自动标注出建筑物覆盖区存在边缘不规则、噪点干扰、单覆盖面分离的情形,需要进行图形处理。使用“模型构建器”构建模块化、流水线式的图形处理流程,对建筑物覆盖区图层进行多次滤波、栅格转面、面积选择、规则化建筑物覆盖区和聚合面等操作,达到生成边缘规则、噪点较少、区域聚合的规范化建筑物覆盖图层效果。如图1所示。
图1某区域影像原图(左)与建筑物覆盖区(右)
(三)生成基本农田建筑物疑点
使用相交工具将规范化的建筑物图层与基本农田图层叠加,生成基本农田上的建筑物疑点。建筑物覆盖区作为矢量图层,具有可移植性,可根据用途与耕地、高标准农田、基本农田等其他矢量文件进行叠加。
无论是传统方法还是深度学习方法,在复杂的计算机视觉任务上都难以做到完全精准,会不可避免地出现识别错误。在图层相交之后进行简单的人工筛选,可快速剔除识别不准确的区域,提高数据质量。相比人工标注,人工剔除大大降低了时间成本。如图2展示了相交、剔除操作后某区域基本农田被自建房屋蚕食和被蔬菜大棚占用的情形。
图2基本农田上建筑物疑点
三、深度学习在建筑物自动识别中的应用与思考
(一)县域基本农田建筑物疑点分析
审计人员对县域基本农田建筑物疑点进行了可视化分析,图3中色调越暖的镇街,疑点面积越大。县域基本农田建筑物疑点包括“非粮化”疑点如蔬菜大棚,也包括“非农化”疑点如民居、厂房。由于“非农化”疑点对基本农田的破坏程度更严重,审计人员对此重点