摘要
提出一种基于深度学习的图像像素级标注算法。通过数据预处理、数据集建立、全卷积神经网络设计和训练流程,实现水体的水质等级分类及像素级标注。使用上海市嘉定区某区域和上海市宝山区杨行镇某区域的无人机低空遥感影像对该算法进行了验证,平均水质等级分类精度分别达到了87.96%和77.57%。
城市河网水质是城市生态环境的重要评价指标之一,也直接影响着城市民生和经济发展等诸多方面,因此快速和高效的水质监测技术在水环境的保护中起着重要作用。上海市计划至2020年基本消灭劣五类水体,进而整治四类、五类水体,以不断改善城市水环境。截至目前,主要依靠人力摸排和水文站定点监测的方法对河流污染情况进行排
遥感技术的发展为快速、动态、全覆盖的水质监测提供了很好的技术手段。相对于内陆河流水体,海洋和大型湖泊水体更容易被遥感手段观测。随着各国环境监测卫星的不断研发和投入使用,针对海洋和大型湖泊的遥感水质监测技术体系已较为成熟。Mohdhasmadi
将海洋和大型湖泊水体的水质遥感监测技术应用于城市河网,主要面临2个主要问题。首先,城市水质监测常关注易出现污染源头的河网中上游部分,而这些河流的主干部分宽度通常为数十米,支流的宽度则常仅有数米,卫星遥感影像的空间分辨率往往无法达到城市相应水质监测的要求。为这一问题提供解决方案的是空间分辨率可达厘米级的无人机低空多光谱遥感技术,然而高分辨率的无人机低空多光谱遥感影像数据量更大。传统影像分析的统计模型虽然算法简便,能够快速对遥感影像进行处理,但是容易出现模型有偏问题,并且在建立模型时需要进行大量的光谱与水质参数相关性分析、回归模型拟合优度检验等前期工作。基于神经网络可以建立更复杂、更能反映多变水质状况的模型,但计算复杂度往往显著高于传统模型,使遥感影像的处理速度变得很慢,难以在实际工程项目中进行规模化应用。
目前在深度学习和图像模式识别领域中,卷积神经网络(CNN)方法在保留传统神经网络模型复杂度的同时,能够快速针对图像进行运
以城市河流水体为研究对象,建立支持水质反演模型自动化建模和低空遥感图像快速处理的水环境遥感监测数据处理方案。具体地,基于卷积神经网络模型框架,提出一个可以对无人机多光谱遥感影像进行水质等级分类的算法。
为实现基于无人机低空多光谱遥感数据的城市河流全流域水质等级分类,给出了如

图1 水质等级分类算法流程
Fig.1 Flow chart of water quality classification algorithm
无人机低空多光谱遥感影像数据是一类新型数据,是无人机低空遥感获取的、包含红绿蓝三波段和若干定制了中心波长的窄带波段。这类数据现有数据量较小,并且数据结构不同于传统图像语义分割领域使用的可见光图像,因此难以基于现有的成熟网络,如VGG模
设计架构如

图2 水质等级分类神经网络架构
Fig.2 Neural network architecture for water quality classification
所设计的网络架构深度为3,即包含了3次最大池化和3次反卷积上采样。在前期测试网络深度时,深度为3的网络测试精度高于深度为2的网络测试精度,而深度为4和5的网络测试精度与深度为3的网络测试精度基本相同,因此网络深度采用3。
使用了来自2个不同实验区的数据对算法进行稳定性和可行性验证。
实验区1位于上海市嘉定区。实验区范围东西向跨度约800 m,南北向跨度约900 m。实验区内部的河流主要是位于某一校园内部的人工河流,水系总长度约5.0 km,平均水深约0.5 m,水域总面积约0.50 k
实验区2位于上海市宝山区杨行镇。实验区范围东西向跨度约5 500 m,南北向跨度约3 500 m。实验区内部的若干河流在区域内穿过绿地、居民区和工业区,在实验区外部汇入黄浦江。水系总长度约20 km,水域总面积约0.5 k

图3 数据采集区域位置
Fig.3 Experiment area position
数据采集方式为无人机低空遥感。无人机作业时天气晴朗,实验水域在作业前1个月内未发生特殊污染情况,水体水质状况基本稳定。无人机搭载的相机为多光谱相机,5个波段依次为红―绿―蓝可见光波段、675 nm和705 nm 2个窄带多光谱波段,后2个波段与多个两类水体非水色水质参数均有较高的相关
数据预处理包括辐射校正、几何校正和水体提取。辐射校正由自主研发的算法完成。几何校正由无人机测图软件Pix4D完成,同时生成了实验区域的正射影像。实验区1和2的正射影像大小分别约为25 000 ×21 000和21 000×13 000像素,数据存储类型为16位整型。水体提取由自主研发的自动化提取算法辅以人工后处理完成,预处理后正射影像如
要建立用于U型全卷积神经网络训练和验证的数据集,首先需生成正射影像所对应的分类地面真值图像,然后利用两者不断生成用于单次训练的样本,最后将这些样本整合,形成数据集。
所使用的地面真实数据来自笔者团队对同一实验区的前期研究成果。依据国家标准《地表水环境质量标准

图4 实验区1分类结果
Fig.4 Classification results for experiment area 1

图5 实验区2分类结果
Fig.5 Classification results of experiment area 2
使用随机开窗截取的方法生成单个学习样本,以克服正射影像过大、难以基于现有硬件条件直接在U型全卷积神经网络中进行迭代训练的问题。对应实验区1和2的窗口大小分别为300×300和64×64,每次截取时随机选定一个位置,然后在该位置上分别截取窗口大小的正射影像和地面真值图像,生成一个学习样本。在实验区正射影像中,水体部分仅占整个影像像素的小部分,而本实验的目标是水质分类,即主要关注影像的水体部分,因此不均匀的数据分布会给训练带来较大困难。针对此问题,在生成样本时,若随机的样本中不包含任何水体,则该样本无效,需重新生成。以此方法,本实验生成样本数量分别为1 000 (实验区1) 和3 000 (实验区2) 的数据集,下文称这2个数据集分别为数据集1和数据集2。
实验运行硬件环境为:计算机内存16 GB,CPU型号Intel(R) Core(TM) i7‒6700HQ 2.60 GHz,显卡型号NVIDIA GeForce GTX 960M。神经网络训练框架选用Kera
在第1.2节所述U型全卷积神经网络架构的基础上,对U型全卷积神经网络的关键超参数做出如下设置:
选用Adam算
当学习停滞时,适当地减小学习速率可能使网络更好地收敛到极小值点。使用的自适应学习速率调整算法为Keras预定义的学习率衰减(ReduceLROnPlateau)算
对神经网络的训练结果和泛化能力有较明显影响的参数是学习速率,而Adam算法结合自适应学习速率调整是选择该参数的一种优选策
对数据集1采用交叉验证方法来划分训练集和验证集,并用最终交叉验证精度近似测试精度,以评估网络泛化能力。使用的交叉验证方法是k折交叉验证算法,k取10,即为十折交叉验证法。在实验中,每次随机选取900个样本作为训练数据集,其余100个样本作为验证数据集;重复完成10次训练‒验证过程,得到每次的训练精度和验证精度。
为定性描述U型全卷积神经网络模型的分类结果,使用训练精度和验证精度均接近十折交叉验证精度均值的一组网络参数,即
为与所提算法进行对比,借助成熟的遥感图像处理软件ENVI 5.3,使用极大似然法对实验区1的水体进行了分类。对照实验的分类结果如
数据集2的数据量和变化程度更大,更接近水环境遥感检测项目中所使用的实际数据,但分类难度也更高。除前文提及的Dropout参数调整为0.2以适应更复杂的数据之外,实验2沿用在数据集1上使用的U型全卷积神经网络模型及算法,在数据集2上进行训练并对整个正射影像进行分类,结果如
数据集1对比实验中,极大似然法的原理是通过欧式距离划分类别,即待分类样本被划分到与其距离最近的训练样本所属的类别。该方法没有对数据空间进行变换。结果表明,即使在数据的空间分辨率较高、光谱特征较丰富的情况下,对水体按照水质等级进行分类仍然是一个复杂度较高的分类问题,传统自动化分类方法难以进行有效分类。限制分类精度的其他原因主要有以下两点:一是地面真值图像不够精确,因地面真值图像是反演结果而非由全部实测得到的,本身包含的错误和误差阻碍了U型全卷积神经网络模型训练精度的进一步提升;二是在有限的外部条件和优化空间本身复杂度较高的情况下,很可能未找到使U型全卷积神经网络模型分类精度最优的超参数组合。
提出了一个基于全卷积神经网络的城市河流全流域低空遥感影像水质等级分类算法,该算法包括无人机遥感数据的处理、用于网络学习的样本数据集的构建、基于U型全卷积神经网络的水质分类神经网络架构设计和超参数调整以及分类结果的评价与输出。使用上海市嘉定区某区域和上海市宝山区杨行镇某区域的无人机低空遥感影像对该算法进行了验证,分别达到87.96%和77.57%的平均水质分类精度,这一结果可支持该算法的可行性。所设计的全卷积神经网络经交叉验证,过拟合程度低,具有良好的泛化潜力。
基于无人机低空遥感的全流域水质监测工作尚处于起步阶段,若能经过一段时间的数据积累,则由深度学习依赖于大数据驱动的特性,该算法的精度和实际应用表现有望得到进一步提升。水质反演的结果由水体光谱特性决定,而水体光谱特性会受到无人机遥感影像的辐射定标与校正的直接影响,因此一种可靠的无人机遥感影像辐射定标和校正方法也是所提算法可推广性的前提和保障。
参考文献
林荔珊. 上海市中小型河道水环境综合整治思路探讨[J]. 上海水务, 2018, 34(2): 41. [百度学术]
LIN Lishan. Discussion on comprehensive regulation of water environment in small and medium rivers in Shanghai[J]. Shanghai Water, 2018, 34(2): 41. [百度学术]
周伟奇. 内陆水体水质多光谱遥感监测方法和技术研究[D].北京:中国科学院研究生院(遥感应用研究所),2004. [百度学术]
ZHOU Weiqi. Monitoring of water quality parameters for inland waters by multi-spectral remote sensing data[D]. Beijing: Institute of Remote Sensing Applications of Chinese Academy of Sciences, 2004. [百度学术]
MOHDHASMADI I, NORSALIZA U. Analysis of SPOT-5 data for mapping turbidity level of River Klang, Peninsular Malaysia[J]. Applied Remote Sensing Journal, 2010, 1(1): 14. [百度学术]
HELLWEGER F, SCHLOSSER P, LALL U, et al. Use of satellite imagery for water quality studies in New York Harbor[J]. Estuarine, Coastal and Shelf Science, 2004, 61(3): 437. [百度学术]
TEHRANI N C, D’SA E J, OSBURN C L, et al. Chromophoric dissolved organic matter and dissolved organic carbon from sea-viewing wide field-of-view sensor (SeaWiFS), moderate resolution imaging spectroradiometer (MODIS) and MERIS sensors: case study for the northern Gulf of Mexico[J]. Remote Sensing, 2013, 5(3): 1439. [百度学术]
DOERFFER R, SCHILLER H. The MERIS Case 2 water algorithm[J]. International Journal of Remote Sensing, 2007, 28(3): 517. [百度学术]
VILAS L G, SPYRAKOS E, PALENZUELA J M T. Neural network estimation of chlorophyll a from MERIS full resolution data for the coastal waters of Galician rias (NW Spain)[J]. Remote Sensing of Environment, 2011, 115(2): 524. [百度学术]
LECUN Y, BOTTOU L, BENGIO Y, et al. Gradient-based learning applied to document recognition[J]. Proceedings of the IEEE, 1998, 86(11): 2278. [百度学术]
KRIZHEVSKY A, SUTSKEVER I, HINTON G E, et al. ImageNet classification with deep convolutional neural networks[J]. Communications of the ACM, 2017, 60(6): 84. [百度学术]
SIMONYAN K, ZISSERMAN A. Very deep convolutional networks for large-scale image recognition[C]//International Conference on Learning Representations. San Diego: ICLR, 2015: 1-14. [百度学术]
GOODFELLOW I, BENGIO Y, COURVILLE A. Deep learning[M]. Boston: MIT Press, 2016. [百度学术]
RONNEBERGER O, FISCHER P, BROX T. U-net: convolutional networks for biomedical image segmentation[C]//International Conference on Medical Image Computing and Computer-Assisted Intervention. Berlin: Springer, 2015: 234-241. [百度学术]
KESTUR R, FAROOQ S, ABDAL R, et al. UFCN: a fully convolutional neural network for road extraction in RGB imagery acquired by remote sensing from an unmanned aerial vehicle[J]. Journal of Applied Remote Sensing, 2018, 12(1): 016020. [百度学术]
ISIKDOGAN F, BOVIK A C, PASSALACQUA P. Surface water mapping by deep learning[J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2017, 10(11): 4909. [百度学术]
ZEILER M D, TAYLOR G W, FERGUS R. Adaptive deconvolutional networks for mid and high level feature learning[C]/ [百度学术]
/Computer Vision (ICCV), 2011 IEEE International Conference on. [S.l.]:IEEE, 2011: 2018-2025. [百度学术]
地表水环境质量标准:GB 3838―2002[S]. 北京:中国标准出版社, 2002. [百度学术]
Environmental quality standards for surface water:GB 3838―2002[S]. Beijing: Standards Press of China, 2002. [百度学术]
CHOLLET F. Keras [EB/OL]. [2018-12-20]. https://github.com/fchollet/keras. [百度学术]
KINGMA D P, BA J. Adam: a method for stochastic optimization[C]// International Conference on Learning Representations. San Diego: ICLR, 2015: 1-15. [百度学术]
GU J, WANG Z, KUEN J, et al. Recent advances in convolutional neural networks[J]. Pattern Recognition, 2018, 77: 354. [百度学术]
IOFFE S, SZEGEDY C. Batch normalization: accelerating deep network training by reducing internal covariate shift[C]// International Conference on Learning Representations. San Diego: ICLR, 2015: 1-10. [百度学术]