摘要
地下水污染溯源和含水层参数反演问题等地下水逆问题通常面临计算负荷量的制约,考虑使用替代模型作为解决方法,从而降低地下水反演问题的计算成本。借鉴卷积神经网络的图像识别过程,考虑将地下水流运动和污染物运移问题转化为输入场图像(渗透系数场、污染源信息等)与输出场图像(水头场、浓度场等)之间函数关系的图像回归问题,利用基于稠密连接网络的AR-Net-WL构建地下水流运动和污染物运移的替代模型。算例研究表明,针对替代模型的过拟合现象,尽可能选择较大的训练样本可获得约10%的精度提升;当没有条件增加训练样本时,采用最优正则项系数的AR-Net-WL在训练样本较少的情形下(训练样本500)也能够取得良好的性能,能够精确预测地下水流运动和污染物运移。
地下水系统一旦受到污染则很难恢复,并将长期影响地下水水质、地下水系统生态平衡和人体健康。与地表水相比,地下水一旦遭受污染其治理和修复难度更大,往往需要更长的时间(常常持续 30年以上),费用非常昂
替代模型依据其构建方式一般可分为两大类,第一类是数据驱动的模
现有研究在利用各类神经网络构建地下水污染替代模型时,并未结合具体的应用场景对神经网络的函数选择、参数敏感性等进行充分考量。本文借鉴卷积神经网络的图像识别过程,考虑将地下水流运动和污染物运移问题转化为输入场图像(渗透系数场、污染源信息等)与输出场图像(水头场、浓度场等)之间函数关系的图像回归问题,通过数值算例研究稠密连接网络替代模型的有效性以及模型性能的改进策略,主要包括:针对实际应用中样本数量较少的情形提出在神经网络中采用最优正则项系数的改进策略,针对污染源附近区域存在非线性浓度梯度问题采用改进权重的网络损失函数以及神经网络激活函数的选择。
地下水模拟模型是研究地下水流和污染物运移的关键,而地下水模型的输出是通过求解地下水流和溶质运移的偏微分方程获得的,这往往需要较长的计算时间。为充分刻画地下空间的异质性、考虑更多的物理过程、提高数值精确度、扩大模拟区域尺度等,都会导致计算量增大和模型运行时间的增加。单个模型运行时间的增加还会限制其在需要大量调用模拟模型的实际问题中的应用,如地下水逆问题、不确定性分析、敏感性分析等。为了提高计算效率,可以在模型中使用替代模型来替换原始模
目前常用的污染物迁移模拟程序有MOC3D、MT3DMS、RT3D、FEMWATER、FEFLOW等。其中,MT3DMS 是应用最为广泛的污染物迁移模拟程序。本文采用MT3DMS 程序进行地下水污染物迁移模拟,MT3DMS 本身不包括地下水流模拟程序,在模拟计算时,MT3DMS需和MODFLOW 一起使
地下水水流方程如
(1) |
式中:假定渗透系数的主轴方向与坐标轴方向一致,分别为渗透系数在方向上的分量,m·
地下水溶质运移方程如
(2) |
式中:为有效孔隙度;为溶质组分k的浓度,g·
深度卷积神经网络可以有效处理高维输入-输出映射,其适用于处理具有空间结构的图像数
(3) |
式中:为模型的空间剖分网格数(对应于1.1节MODFLOW有限差分网格);和分别表示模型输入和输出的个数。对于二维模型,输入参数包含渗透系数场、污染源信息等,输出状态量包括污染浓度场和水头场。在卷积神经网络中,将输入参数和输出状态量以近似于图像的数据结构表示(高维图像),通过网络训练建立输入场图像与输出场图像之间函数关系的图像回归问题。
在图像回归问题中,全卷积神经网络是用编码网络(encoder)对高维输入图像进行特征提取,然后在解码网络(decoder)根据特征重建输出图像。随着设计越来越深的网络,深刻理解“新添加的层如何提升神经网络的性能”变得至关重要。针对这一问题,He
DenseNet由稠密块(dense block)与过渡层(transition layer)2个重要部分组成。具体地,稠密块的层与层之间的信息传递关系表示如
(4) |
式中:表示0到l-1层的输出特征图的串联操作;Hl (·)包括批归一化(batch normalization, BN)、ReLU激活函数和卷积操作(convolution, Conv)的顺序组合等。稠密块主要由2个参数决定:结构内的网络层数 L和每一层的输出特征面数量 K'。通过整个稠密块的特征图数量为N0+L×K',其中N0为输入特征图的数量。

图1 DenseNet的稠密块结构示
Fig.1 Dense block structure of DenseNet

图 2 图像回归问题的DenseNet网络结构示意
Fig.2 DenseNet network structure for image regression problem

图3 含水层结构平面
Fig.3 Plan view of aquifer structure

图4 基于不同训练样本数量建立的替代模型的RMSE精度比较
Fig. 4 Comparison of RMSE accuracy of surrogate models established based on different numbers of training samples
考虑到实际地下水污染问题中,根据前期场地调查往往能大致确定污染源位置,而对应污染源的释放历史是未知的。本算例中考虑3个污染源,为S1、S2 和S3。污染源参数由30个参数进行量化(3个污染源在10个应力期的污染释放强度),即,其中=1, 2, 3; =1, 2, …, 10。非均质渗透系数场的反演估计通常会导致高维问题,高维参数受制于维度灾难问题,通常需要对渗透系数场进行概化和降
应力期 | 先验区间 | 污染源浓度真实值/(g · | ||
---|---|---|---|---|
S1 | S2 | S3 | ||
SP1 | 5.62 | 1.04 | 5.38 | |
SP2 | 4.34 | 4.55 | 3.26 | |
SP3 | 1.79 | 3.76 | 5.69 | |
SP4 | 5.21 | 0.10 | 4.00 | |
SP5 | 2.54 | 2.70 | 1.68 | |
SP6 | 4.38 | 1.30 | 4.21 | |
SP7 | 5.56 | 6.36 | 5.38 | |
SP8 | 4.69 | 2.49 | 6.23 | |
SP9 | 2.32 | 4.23 | 2.38 | |
SP10 | 5.32 | 1.33 | 5.26 |
在构建替代模型前,将正演模型的输入和输出项以图像的形式表示。输入包括渗透系数场和图像化处理后的污染源参数。输出为利用原始模型(MODFLOW和MT3DMS)得到的水头和多个时刻污染物浓度场。模型输入的污染源强度(S)随时间变化,模型输出的污染物浓度除了受输入参数(渗透系数K)的影响外,还受随时间变化的污染源源强的影响。换言之,任意某一目标时刻污染物浓度场受到该目标时刻j及更早时刻(1, 2,…, j-1)的污染源源强的共同影响。利用自回归模型方法,可以表示为
(5) |
式中:为时刻j的污染浓度场; 分别为当前时刻的渗透系数场和污染源参数;为上一时刻的污染分布。
考虑到地下水污染点源会对释放区域周围产生较大非线性浓度梯度,为了提高替代模型在污染源附近的预测精度,在网络损失函数中分别赋予污染源及周围8个像素点额外权重(见
(6) |
式中:为网络训练的损失函数; 为有污染物释放的时间段数,= 10;为污染点和周边像素点的9个浓度向量;为 的神经网络预测值;,= 5.0
算例所用的网络结构为AR-Net-WL,即考虑
结构 | 卷积核 | Nf × Hf × Wf |
---|---|---|
输入层 | 3 × 51 × 71 | |
初始卷积层 | k'7s2p3 | 48 × 26 × 36 |
稠密块 1 (K'40L5) | k'3s1p1 | 248 × 26 × 36 |
编码层 | k'1s1p0, k'3s2p1 | 124 × 13× 18 |
稠密块 2 (K'40L10) | k'3s1p1 | 524 × 13 × 18 |
解码层 1 | k'1s1p0, k'4s2p1 | 262 × 26 × 36 |
稠密块 3 (K'40L5) | k'3s1p1 | 462 × 26 × 36 |
解码层 2 | k'1s1p0, k'6s2p2 | 2 × 51 × 71 |
在神经网络的激活函数中,sigmoid函数存在计算量大、梯度消失等局限性,ReLU函数具有在O点处梯度不连续、在x < 0时不传播等特点;softplus能够有效克服ReLU和sigmoid函数的上述不足之
研究DenseNet网络(AR-Net-WL)构建得到地下水流与溶质运移替代模型的效果,分别对样本数量、DenseNet网络超参(权重损失函数、正则项系数)等影响进行分析。AR-Net-WL在NVIDIA GeForce RTX2080s GPU上训练。在替代模型训练时,采用决定系数(
(7) |
(8) |
式中:为样本n 的原始模型输出结果;为样本n 的替代模型预测结果;,为样本总数。
为讨论训练样本数量对替代模型近似精度的影响,在AR-Net-WL网络结构下考虑了4个训练样本集合,包含训练样本数量分别500、1 000、2 000和3 000。测试样本集合由=500个随机生成的测试样本组成,包括地下水稳定水位h和10个时刻t = [16, 32, 48, 64, 80, 96, 112, 128, 144, 160] d的污染物浓度观测数据。因此,网络输入图片为3个,即(=1,…,10, 为初始浓度场),输出图片为2个,即。

图5 基于不同训练样本数量建立的替代模型的
Fig. 5
为了量化AR-Net-WL网络中权重损失函数对替代模型精度的影响,分别选择AR-Net-WL和AR-Net网络构建替代模型(训练样本数量为3 000),比较训练样本和测试样本的
网络结构 | 时间/h | RMSE | |||
---|---|---|---|---|---|
测试集 | 训练集 | 测试集 | 训练集 | ||
AR-Net | 4.15 | 0.997 9 | 0.998 2 | 0.042 7 | 0.038 8 |
AR-Net-WL | 4.27 | 0.998 1 | 0.998 7 | 0.040 6 | 0.033 3 |
为了进一步说明权重损失函数的作用,分别统计AR-Net和AR-Net-WL这2种替代模型的污染物浓度场预测误差绝对值的最大值。由

图6 AR-Net和AR-Net-WL的频率
Fig. 6 frequency diagram of AR-Net and AR-Net-WL
构建替代模型时,应该从训练样本中尽可能学出适合所有潜在样本的“普遍规律

图7 不同对应替代模型的测试集合RMSE值(训练样本500)
Fig.7 RMSE value for test set of surrogate model corresponding to different values (training sample=500)

图 8 AR-Net-WL替代模型的预测结果(随机测试样本)
Fig. 8 Prediction results of AR-Net-WL surrogate model (in random test samples)
(1)借鉴卷积神经网络的图像识别过程,将地下水流运动和污染物运移问题转化为输入场图像(渗透系数场、污染源信息等)与输出场图像(水头场、浓度场等)之间函数关系的图像回归问题。针对激活函数进行优化的AR-Net-WL建立的替代模型能够精确预测地下水流运动和污染物运移。
(2)针对替代模型的过拟合现象,在条件允许的情形下应尽可能选择较大的训练样本,算例研究表明训练样本从500增至3 000,替代模型的性能(
(3)后续研究拟利用得到地下水污染替代模型(最优正则项系数的AR-Net-WL)进行地下水污染溯源问题的求解,将更进一步地研究影响替代模型精度及泛化性能的重要因素(包括采样方法、深度神经网络结构等)。
作者贡献声明
江思珉:论文方向指定与指导。
孔维铭:论文主体内容撰写。
吴延浩:论文模型参数调整实验。
刘金炳:指导论文模型代码修改。
张春秋:论文图例设计与修改。
夏学敏:提供论文内容意见与协助修改。
参考文献
吴剑锋, 郑春苗. 地下水污染监测网的设计研究进展[J]. 地球科学进展, 2004, 19(3): 429. [百度学术]
WU Jianfeng, ZHENG Chunmiao. Contaminant monitoring network design: Recent advances and future directions[J]. Advance in Earth Sciences, 2004, 19(3): 429. [百度学术]
LI L, ZHOU H, GÓMEZ-HERNÁNDEZ J J. A comparative study of three-dimensional hydraulic conductivity upscaling at the macro-dispersion experiment (MADE) site, Columbus Air Force Base, Mississippi (USA)[J]. Journal of Hydrology, 2011, 404(3/4): 278. [百度学术]
WHITE J T. A model-independent iterative ensemble smoother for efficient history-matching and uncertainty quantification in very high dimensions[J]. Environmental Modelling & Software, 2018, 109: 191. [百度学术]
MIRGHANI B Y, MAHINTHAKUMAR K G, TRYBY M E, et al. A parallel evolutionary strategy based simulation–optimization approach for solving groundwater source identification problems[J]. Advances in Water Resources, 2009, 32(9): 1373. [百度学术]
YAN S, MINSKER B. Optimal groundwater remediation design using an adaptive neural network genetic algorithm: Optimal groundwater remediation design[J]. Water Resources Research, 2006, 42(5). [百度学术]
XIA X, ZHOU N, WANG L, et al. Identification of transient contaminant sources in aquifers through a surrogate model based on a modified self-organizing-maps algorithm[J]. Hydrogeology Journal, 2019, 27(7): 2535. [百度学术]
ZHENG Q, ZHANG J, XU W, et al. Adaptive multifidelity data assimilation for nonlinear subsurface flow problems[J]. Water Resources Research, 2019, 55(1): 203. [百度学术]
MAN J, ZHENG Q, WU L, et al. Adaptive multi-fidelity probabilistic collocation-based Kalman filter for subsurface flow data assimilation: Numerical modeling and real-world experiment[J]. Stochastic Environmental Research and Risk Assessment, 2020, 34(8): 1135. [百度学术]
LIN G, TARTAKOVSKY A M. An efficient, high-order probabilistic collocation method on sparse grids for three-dimensional flow and solute transport in randomly heterogeneous porous media[J]. Advances in Water Resources, 2009, 32(5): 712. [百度学术]
ASHER M J, CROKE B F W, JAKEMAN A J, et al. A review of surrogate models and their application to groundwater modeling: Surrogates of groundwater models[J]. Water Resources Research, 2015, 51(8): 5957. [百度学术]
LIAO Q, ZHANG D, TCHELEPI H. A two-stage adaptive stochastic collocation method on nested sparse grids for multiphase flow in randomly heterogeneous porous media[J]. Journal of Computational Physics, 2017, 330: 828. [百度学术]
ZHU Y, ZABARAS N, KOUTSOURELAKIS P-S , et al. Physics-constrained deep learning for high-dimensional surrogate modeling and uncertainty quantification without labeled data[J]. Journal of Computational Physics, 2019, 394: 56. [百度学术]
ZHU Y, ZABARAS N. Bayesian deep convolutional encoder–decoder networks for surrogate modeling and uncertainty quantification[J]. Journal of Computational Physics, 2018, 366: 415. [百度学术]
PETERSON T J, WESTERN A W. Nonlinear time-series modeling of unconfined groundwater head[J]. Water Resources Research, 2014, 50(10): 8330. [百度学术]
MO S, ZABARAS N, SHI X, et al. Deep autoregressive neural networks for high‐dimensional inverse problems in groundwater contaminant source identification[J]. Water Resources Research, 2019, 55(5): 3856. [百度学术]
张江江. 地下水污染源解析的贝叶斯监测设计与参数反演方法[D]. 杭州: 浙江大学, 2017. [百度学术]
ZHANG Jiangjiang. Bayesian monitoring design and parameter inversion for groundwater contaminant source identification[D]. Hangzhou: Zhejiang University, 2017. [百度学术]
MGM M, AW H. MODFLOW, A modular three-dimensional finite difference ground-water flow model[M]. Denver: [S.n.], 1988. [百度学术]
ZHENG C, WANG P P. MT3DMS: A modular three-dimensional multispecies transport model for simulation of advection, dispersion, and chemical reactions of contaminants in groundwater systems; documentation and user's guide[R]. Vicksburg: U.S. Army Engineer Research and Development Center, 1999. [百度学术]
JU L, ZHANG J, WU L, et al. Bayesian monitoring design for streambed heat tracing: Numerical simulation and sandbox experiments[J]. Groundwater, 2019, 57(4): 534. [百度学术]
HE K, ZHANG X, REN S, et al. Deep residual learning for image recognition[C]//2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Las Vegas: IEEE, 2016: 770–778. [百度学术]
HUANG G, LIU Z, VAN DER MAATEN L, et al. Densely connected convolutional networks[C]//2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Honolulu: IEEE, 2017: 2261–2269. [百度学术]
ZHANG J, LIN G, LI W, et al. An iterative local updating ensemble smoother for estimation and uncertainty assessment of hydrologic model parameters with multimodal distributions[J]. Water Resources Research, 2018, 54(3): 1716. [百度学术]
ZHANG D, LU Z. An efficient, high-order perturbation approach for flow in random porous media via Karhunen–Loève and polynomial expansions[J]. Journal of Computational Physics, 2004, 194(2): 773. [百度学术]
ZHENG H, YANG Z, LIU W, et al. Improving deep neural networks using softplus units[C]//2015 International Joint Conference on Neural Networks (IJCNN). Killarney: IEEE, 2015: 1–4. [百度学术]