A Multi-Model Coupled Prediction Method for Dam Deformation Based on Interpretable Factor Selection

LIU Cong-cong; ZHANG Feng; HU Chao; ZHANG Qi-ling; GUO Yong-cheng

doi:10.11988/ckyyb.20241019

Journal of Changjiang River Scientific Research Institute >

2026 , Vol. 43 >Issue 1: 144 - 154

DOI: https://doi.org/10.11988/ckyyb.20241019

Engineering Safety and Disaster Prevention

A Multi-Model Coupled Prediction Method for Dam Deformation Based on Interpretable Factor Selection

LIU Cong-cong ^,¹^,² ,
ZHANG Feng ³ ,
HU Chao ^,²^,⁴^,⁵ ,
ZHANG Qi-ling ²^,⁴^,⁵ ,
GUO Yong-cheng ¹

Expand

¹ College of Civil Engineering & Architecture, China Three Gorges University, Yichang 443002, China
² Engineering Safety and Disaster Prevention Department, Changjiang River Scientific Research Institute, Wuhan 430010, China
³ China Three Gorges Construction Engineering Corporation, Chengdu 610000,China
⁴ Research Center on Water Engineering Safety and Disease Prevention of Ministry of Water Resources,Changjiang River Scientific Research Institute,Wuhan 430010, China
⁵ National Research Center for Dam Safety Engineering Technology, Changjiang River Scientific Research Institute, Wuhan 430010, China

Received date: 2024-09-27

Revised date: 2024-11-22

Accepted date: 2024-11-23

Online published: 2025-01-23

Fold

Abstract

[Objective] Dam deformation is comprehensively influenced by multiple components such as water level, temperature, and time-dependent effects, exhibiting characteristics of nonlinear time series. Currently, traditional and single models struggle to fully capture the complexity and diversity of dam deformation data, resulting in limited predictive performance and interpretation ability. To solve the above problems, this study aims to propose an efficient and interpretable dam deformation prediction method through the combination and optimization of multiple prediction models. [Methods] First, the least absolute shrinkage and selection operator (LASSO) was used to efficiently screen numerous environmental variables, both simplifying model input and explaining the reliability of factor selection.Then,the long short-term memory (LSTM) network was employed to predict dam deformation, and the attention mechanism was introduced to enhance the extraction of important information.Finally,the bagging algorithm was used to integrate the prediction results of multiple models, further improving the accuracy, stability, and generalization ability of the overall prediction. By combining the advantages of LASSO regression feature selection, LSTM model with attention mechanism, and bagging ensemble algorithm, a multi-model coupled method was proposed. [Results] To validate the effectiveness and applicability of the coupled model, this study took the deformation monitoring data of a roller-compacted concrete gravity dam as the research object for prediction analysis. When the number of features was relatively large, the LASSO variable selection method reduced model complexity by adding L1 regularization term and selected features with important influence on dam displacement, enhancing the interpretability of factor selection. Combined with this method, multiple LSTM models with attention mechanism were integrated for parallel training and prediction, reducing potential overfitting problems in single models and improving generalization ability and prediction efficiency of the coupled model. The trained model was used to predict and validate the test set data. The residual values of the coupled model were small, and residual distribution had strong randomness, indicating high prediction accuracy. The fitting results of each measurement point were smooth and agreed well with the measured data, and the prediction results were stable without showing any “distortion” phenomenon. Using the same dataset and identical proportion division, LSTM multi-factor model, stepwise regression prediction model, LASSO regression model, LASSO-LSTM model, and the coupled model were compared and analyzed. The results showed that the coupled model proposed in this study significantly outperformed other models in overall prediction trend and the prediction accuracy of partial fluctuations. The average MAE, MSE, and RMSE at each measurement point were 0.052, 0.005,0.067 mm, respectively. The coupled model could more accurately capture the dynamic changes of dam deformation, providing a simple and efficient method for prediction model research. [Conclusion] This study constructs a coupled prediction model with high accuracy, stability, and interpretability. The main innovation lies in the effective selection of key environmental variables through LASSO, simplifying model input and improving its interpretability; the use of LSTM to capture the time-series features of dam displacement data, while the incorporated attention mechanism helps the model focus on important features in time series; and the bagging algorithm that significantly improves the generalization ability of model by training multiple sub-models in parallel. Based on actual case analysis, the coupled model not only demonstrates higher accuracy in dam deformation prediction,but also outperforms commonly used models in interpretability and stability.The coupled model based on interpretable variable selection provides a reference for the optimization of subsequent combined models.Future research directions can shift from single measurement points in different dam sections to multiple measurement points in the same dam section.This will involve analyzing the location of measurement points and the relationships between different points,thereby enabling the construction of a comprehensive multi-point coupled model.

Key words： dam deformation prediction; least absolute shrinkage and selection operator (LASSO); attention mechanism; long short-term memory (LSTM); Bagging algorithm; coupled model

Cite this article

LIU Cong-cong , ZHANG Feng , HU Chao , ZHANG Qi-ling , GUO Yong-cheng . A Multi-Model Coupled Prediction Method for Dam Deformation Based on Interpretable Factor Selection[J]. Journal of Changjiang River Scientific Research Institute, 2026 , 43(1) : 144 -154 . DOI: 10.11988/ckyyb.20241019

0 引言

大坝安全是水利工程中的首要问题。通过对大坝变形的高效合理预测,可以及时发现潜在的问题,防止大坝溃决等灾难性事故的发生,保障下游居民生命财产安全。大坝的变形受到水位、温度、时效等多种分量的综合影响,具有非线性时间序列的特性。因此,有效抓住大坝变形效应量与环境量之间的复杂关系对大坝安全监测具有深远的意义。

目前,诸多研究表明影响大坝变形的众多环境因子之间存在着相关性^[1-2]。若输入因子数过多,冗余信息加入计算,则会导致模型预测效率、质量以及泛化能力的降低。龙江等^[3]利用最大信息系数进行特征的筛选,为模型提供了合理的输入因子集,从而降低模型复杂度。张孟昕等^[4]结合空间关联性选取出最优因子集,辅以交叉验证特征因子的有效性,提高模型的泛化程度。特征的选取对模型预测精度具有重要的影响,但在大坝预测模型中对特征的选取往往表现为“黑盒”模式。虽然可以依据输入量给出预测目标,但很难揭示其可靠性。罗璐等^[5]在面对大量数据时采用最小绝对值收缩和选择算子(Least Absolute Shrinkage And Selection Operation,LASSO)算法剔除部分因子,提高因子选择的可视度。黄海燕等^[6]构建了3种兼顾预测能力和可解释性的模型,全面分析了不同因子对大坝变形的影响程度。陈斯煜等^[7]提出稀疏贝叶斯学习(Sparse Bayesian Learning,SBL)驱动的可解释性模型,准确表征水位、气温和时效因子与大坝变形的非线性映射关系。因此,可解释性变量选择对模型高效预测具有重要的意义,同时也为实际工程决策提供了一种可靠的方式。

常用的可解释性分析方法主要包括传统的逐步回归^[8]、主成分分析(Principal Component Analysis,PCA)^[9]和复杂模型解释工具(如基于SHAP的评价模型^[10])。但上述方法只适用于特定的数据结构,且部分模型操作复杂,在实际应用中难以快速响应。LASSO算法通过对模型中的不重要特征系数进行收缩,甚至将部分系数置为0,从而实现模型输入的简化。输出结果直接展示了各因素对大坝变形的贡献度,使得预测过程更透明、易于解读,为特征优化提供了便捷可靠的依据。

近年来,线性回归^[11]、机器学习算法^[12]等传统模型在处理海量数据时,无法全面捕捉其复杂性和多样性。随着深度学习的加入,神经网络^[13]在大坝变形预测中得到了充分的利用。但仍存在一定的缺陷,如现有模型在传递过程中隐藏层的权重赋值相同,无法针对性地提取有效信息。面对上述问题,研究人员^[14-15]在深度学习的基础上耦合注意力机制为多变量赋予不同的权重,从而捕捉各隐藏层的有效信息,实现了时间和因子权重的量化和可视化。其中,长短期记忆网络(Long Short-term Memory,LSTM)耦合注意力机制可以有效地提取关键信息,提升模型预测精度^[16-17]。

针对单一预测模型参数调整复杂、训练过拟合和预测结果不稳定^[18]等问题,相关学者采用多个模型组合的方法来全面提高预测模型的性能。施彦彤等^[19]采用卷积神经网络(Convolutional Neural Network,CNN)提取特征,耦合含有注意力机制LSTM模型,在深层挖掘特征信息的前提下完成时间序列数据的学习。邓思源等^[20]提出一种XGBoost-LSTM变权组合预测模型实现了组合模型间灵活结合,最大程度上放大各个单独模型的优点。刘丹等^[21]利用遗传算法优化LSTM模型的参数,采用组合的方式有效避免模型陷入局部极值。耦合模型在预测精度提高的同时忽略了各模型交互训练的复杂性。王悦等^[22]提出的分类回归树-Bagging (Classification and Regression Tree-Bagging,CART-Bagging)模型组合了机器学习与集成学习的优势,提高预测性能,也提供了一种简单高效的组合方式。Fan等^[23]利用Bootstrap方法与Bagging算法的耦合模型挖掘了主成分与响应变量之间的联系结构。综上所述,组合模型通过耦合Bagging集成算法,既保留了预测精度,又在模型鲁棒性和简洁性上有所提升,尤其在多模式、复杂和高维数据处理中表现出色。

因此,本文构建了一个兼具高精度、稳定性和可解释性的耦合预测模型。主要创新在于通过LASSO有效筛选关键环境变量,简化了模型输入并提高其解释性;LSTM捕捉大坝位移数据的时序特征,而引入的注意力机制帮助模型关注于时间序列中的重要特征;Bagging算法则通过并行训练多个子模型,显著提高了模型的泛化能力。以实际案例分析,耦合模型不仅在大坝变形预测中表现出更高的准确性,还在解释性和稳定性上优于常用模型。

1 方法原理

1.1 LASSO回归因子选择

由于大坝位移预测涉及许多潜在的输入变量,使用包含大量变量的传统回归模型可能会导致过拟合问题。LASSO回归通过系数收缩完成特征选择,减少了模型的复杂度,降低计算成本,有助于提高模型在新数据上的计算效率。LASSO回归是一种惩罚回归方法,它在传统的最小二乘法的基础上加入了L1正则化项,通过调整正则化强度参数

α

,实现变量选择和系数收缩的功能。其损失函数L(β)的表达式为

(1)

L β = ∑ i = 1 n y i - β 0 - ∑ j = 1 p x i j β j 2 + α ∑ j = 1 p β j 。

式中:y_i为第i个观测值的真实值;β₀为常数项;x_ij为第i个测值在第j个特征上的取值;β_j为第j个特征的系数;n为数据集中的观测数;p为特征的数量。

在LASSO回归中,惩罚项是各个解释变量系数的绝对值之和乘以系数。其系数则需要通过交叉验证等方法进行选择,当达到合适的值时,一些不重要的输入变量的系数会被缩小到0。模型可根据各影响因子对预测目标的重要程度进行筛选,增强各因子选择的可解释性。

1.2 基于注意力机制编解码LSTM模型

1.2.1 LSTM模型

LSTM是一种改进的循环神经网络(Recurrent Neural Network,RNN),它的优点在于避免在处理长序列数据时遇到的梯度消失和爆炸的问题。LSTM通过引入门结构(Gate)来控制信息的流动,同时新加了一个贯穿整个单元的细胞状态(Cell State)作为记忆存储,从而有效地处理和记忆长序列数据中的信息。结构流程主要由激活函数和点乘法完成,具体步骤如下。

(1)遗忘门:遗忘门会查看前一个隐藏状态和当前的输入,通过一个Sigmoid函数决定细胞状态中的哪些信息需要被遗忘。遗忘门

f t

表达式为

(2)

f t = σ W x f x t + W h f h t - 1 + b f 。

(2) 输入门:输入门与遗忘门相似,其区别为Sigmoid函数决定哪些部分的信息需要更新,以及还通过一个tanh函数生成一个新的候选值,这些信息可能会被添加到细胞状态中。输入门

i t

、输入门相关状态值

c t ~

、单元状态值

c t

表达式分别为:

(3)

i t = σ W x i x t + W h i h t - 1 + b i,

(4)

c t ~ = t a n h W x c x t + W h c h t - 1 + b c,

(5)

c t = f t c t - 1 + i t c t ~ 。

式中c_t是LSTM网络中长期记忆的载体,通过遗忘门“过滤旧信息”和输入门“添加新信息”的动态组合,实现信息的长期传递与更新。

(3)输出门:首先,利用Sigmoid函数决定细胞状态中的哪些部分将输出到下一个隐藏状态,然后引用tanh函数处理细胞状态,使其输出值在-1和1之间。最后将这个值与Sigmoid门的输出相乘,得到下一个隐藏状态。输出门o_t、当前隐藏状态的输出

h t

表达式分别为:

(6)

o t = σ W x o x t + W h o h t - 1 + b o,

(7)

h t = o t t a n h c t 。

式(2)—式(7)中:σ和tanh为激活函数;t为当前时间距离起测日的天数;x_t表示当前时刻的输入;h_t_-1表示前一时刻的隐藏状态,σ

x

1 1 + e - x

,tanh

x

1 - e - x 1 + e - x

,W_*为权重矩阵;b_*为偏置项。

1.2.2 注意力机制编解码器

注意力机制(Attention Mechanism)是一种在神经网络中模拟人类注意力方式的技术,在处理时间序列数据时,核心思想为动态地关注输入序列的不同位置。其动态性使得模型更加灵活,能够捕捉到序列中的关键信息,提高了处理数据的性能和效率。注意力机制通常与循环神经网络结合使用。编码器-解码器本质上为循环网络,在实际应用中大多选择RNN、LSTM等。

注意力机制编解码预测模型流程如下:

(1)采用LSTM编码器,输入序列X={x₁,x₂,…,x_t},经过上文所描述的单元过程后输出一系列隐藏状态h={h₁,h₂,…,h_T}。通过注意力得分e_ti来计算解码器隐藏状态s_t和编码器隐藏状态h_i之间的匹配度,即

(8)

e t i = s c o r e s t, h i 。

式中score( )可以是点积、缩放点积及双线性函数。

(2) 采取softmax函数将评分标准化为概率(权重)

a t i

,其表达式为

(9)

a t i = s o f t m a x e t i = e e t i ∑ j = 1 T e e t j 。

(3)计算上下文向量c_t作为编码器隐藏状态h_i的加权和,即

(10)

c t = ∑ i = 1 T a t i h i 。

(4)解码器LSTM接收前一个时间步的输出

s t - 1

作为输入,更新解码器隐藏状态,当前隐藏状态

s t

和上下文

c t

,即

(11)

y t = s o f t m a x W s t ⊕ c t 。

式中:y_t为t时刻解码器的输出;W是权重矩阵;⊕表示拼接操作。

在经典的编码器-解码器框架中,编码器将整个输入序列编码成一个固定长度的上下文向量,解码器使用这个上下文向量来生成输出序列。注意力力权重与编码器隐藏状态h_i相乘,综合了输入序列中当前解码器输出最相关的信息。对于每个输出步骤,解码器使用注意力机制计算加权总和的上下文向量,其权重反映了每个输入元素对当前输出的重要性。模型流程如图1所示。

显示原图|下载原图ZIP|生成PPT

图1 Attention-LSTM模型流程

Fig.1 Flowchart of Attention-LSTM model

1.3 Bagging算法

Bagging算法的原理是基于自助采样(Bootstrap Sampling)和模型集成的思想。其核心是通过构建多个独立的模型并将其预测结果汇总起来提高模型的预测性能,减少单个模型可能出现的过拟合问题。

Bagging集成学习算法实现方式是:从原始数据m个样本中有放回地随机抽取n个样本进行训练(n≤m),其中包含重复或未包含的样本。重复上述步骤A次,即可得到A个新的数据集。由于每次抽样都是随机的,因此A个子数据集中分布具有一定的差异,但也会保留原数据集中的规律。采用A个不同的特征子集并进行独立训练,以增加模型的多样性。最后,计算A个模型预测值的平均值,作为最终的预测结果。

1.4 模型耦合

大坝监测数据呈现复杂性和多样性,传统、单一模型难以全面捕捉其非线性和时序特征,导致预测和解释的能力较差。为此,本文提出一种基于可解释性因子选择的耦合模型,具体流程如图2所示。

显示原图|下载原图ZIP|生成PPT

图2 耦合模型流程

Fig.2 Flowchart of coupled model

2 算例分析

为验证耦合模型的有效性和适用性,本文以某碾压混凝土重力坝的变形监测数据为研究对象进行预测分析。该水利工程控制流域面积3 000 km²,水库总库容14.39亿m³。本文选择4个位移测点作为研究对象,具体位置依次为左岸非溢流坝段的坝顶中间、厂房坝段的坝体中间、厂房坝段的坝顶和河床溢流坝段的坝体中间。其中测点1—3采用起测日2017年11月1日—2024年3月27日的变形监测数据,测点4采用起测日2012年4月1日—2024年3月27日的变形监测数据。剔除异常数据得到样本数据集,取前90%为训练集,后10%为测试集,检验耦合模型拟合预测效果。各测点的位移过程线如图3所示。

显示原图|下载原图ZIP|生成PPT

图3 不同坝段测点位移过程线

Fig.3 Time-dependent displacements of measurement points in different dam sections

2.1 数据预处理

水位的变化直接影响大坝结构的压力分布,造成大坝的变形;大坝材料(如混凝土)会随着温度的变化发生热胀冷缩,导致结构尺寸变化和应力分布的改变;随时间的推移,大坝材料老化,结构性能降低,影响大坝的长期稳定性和变形情况。因此,大坝变形一般由水压分量、温度分量及时效分量组成^[24]。

水位因子由H、H²、H³构成,H₁=H,H₂=H²,H₃=H³,其中H=H_t-H_o(H_t为当前上游水位,H_o为初始上游水位)。坝体位移变形受到温度季节性变化的影响,通常表现出周期性的变化模式。因此,在模拟和分析坝体温度效应时,通常采用具有周期性的正余函数来准确表示温度因子,即

(12)$\begin{array}{l} T_{1}=\sin \frac{2 \pi t}{365}-\sin \frac{2 \pi t_{0}}{365}, T_{2}=\cos \frac{2 \pi t}{365}-\cos \frac{2 \pi t_{0}}{365}, \\ T_{3}=\sin \frac{4 \pi t}{365}-\sin \frac{4 \pi t_{0}}{365}, T_{4}=\cos \frac{4 \pi t}{365}-\cos \frac{4 \pi t_{0}}{365} 。 \end{array}$

式中t₀为初始时间。温度因子

T 1 — T 4

通过正弦/余弦函数的组合,量化温度的周期性变化(基频周期365 d,二倍频周期182.5 d),并利用

t 0

调整相位,以精准模拟坝体温度效应。

时效因子对大坝的长期性能和安全性有着显著影响,通常用I₁=ln

t 1 + 1

,I₂=1-

e - t 1

,I₃=

t 1 1 + t 1

,I₄=t₁,I₅=

t 12

,I₆=

t 1 0.5

,I₇=

t 1 - 0.5

,I₈=

1 1 + e - t 1

,共8种形式表示,其中

t 1 = t 365

。时效因子的影响具有多样性和不确定性,选用8个初始时效因子可以最大程度地涵盖可能影响坝体结构的长时间变化因素,保证模型在最初阶段具备更高的灵活性,能够充分考虑多种潜在影响。综上所述,水位因子取3项,温度因子取4项,时效因子取8项,共计15项影响因子作为输入特征。将上述的数据集去除异常值后,结合LSTM模型时间序列的特征,完成归一化处理。

2.2 LASSO筛选输入特征

本文选用上述15项影响因子,引入LASSO回归方法以筛选输入特征。模型中正则化参数为0.01;最大迭代次数为1 000;容差为0.000 1。如图4所示,LASSO特征选择可以直观地看出各影响因子系数,便于识别出关键影响因素。

显示原图|下载原图ZIP|生成PPT

图4 影响因子权重占比

Fig.4 Weight proportions of influencing factors

通过剔除系数为0的影响因子,列举出各测点的输入特征选择结果,如表1所示。由表1可知,水位因子在测点2和测点3处筛选较多,由于厂房坝段结构复杂且对水位变化敏感,水位波动会直接影响发电设备的运行和安全,因此水位对其影响远大于其他坝段。本文取混凝土重力坝为研究对象,温度变化会引起混凝土的热胀冷缩,进而影响坝体的变形,所以各测点温度特征选取个数较多。因为河床溢流坝段的测点4长期处于水流作用下,该区域的材料老化和长期变形效应更加显著,所以筛选出的时效因子较多。时效因子能够更全面地反映坝体的长时间累积效应,保留一定数量的时效因子可以确保模型在长时间监测中保持鲁棒性,而不容易受到单一时效因子变动的影响。结果表明,LASSO在特征选择中能够合理地反映各测点的主要影响因子,同时也提供了一种可解释性的变量选择机制。

表1 LASSO回归影响因子选择结果

Table 1 Selection results of influencing factors of LASSO regression

测点	选择结果	个数
1	H₃、T₁、T₂、T₃、T₄、I₄、I₅	7
2	H₁、H₂、T₁、T₂、T₄、I₁、I₅、I₇、I₈	9
3	H₁、H₂、H₃、T₁、T₂、T₃、T₄、I₁、I₃、I₇	10
4	H₁、T₁、T₂、T₃、T₄、I₁、I₂、I₅、I₆、I₇、I₈	11

2.3 注意力机制编解码器

将以上选取的输入特征输入LSTM网络的编码器(Encoder)部分。编码器可将输入的时序特征进行抽取和编码,并在解码器(Decoder)部分引入注意力机制。模型的编码器和解码器均为1层LSTM结构,隐藏层单元数量为64。采用Adam优化器并设置学习率为0.001,并指定损失函数为均方误差(Mean-Square Error,MSE)。其本质为产生解码器输出和编码器输出之间的注意力权重,再将此权重分布映射到编码器输出,帮助模型更加关注输入序列中的重要特征,忽略次要信息,进而提高模型准确性。

2.4 基于Bagging算法的预测模型

本文采用Bagging算法对原始数据多次抽样构造训练样本集,对同一预测任务训练多个不同学习器,然后整合各个学习器形成一个强学习器,以获取更好的泛化性能,做出精准的预测。本文设置5个基学习器,并行训练5个含注意力机制的LSTM模型,在同一组原数据集中随机抽取99%的数据作为每个子模型的输入,最后分别输出各个子模型中不同影响因子所对应的注意力权重,如表2所示。由表2可知,各个子模型对特征权重的判断趋于一致,进一步说明了Bagging算法减少了模型对特定数据子集的依赖,提高了模型在面对不同数据分布时的泛化能力。

表2 子模型影响因子注意力权重

Table 2 Attention weights of influencing factors of sub-models

测点	影响因子	子模型 1	子模型 2	子模型 3	子模型 4	子模型 5	平均值
1	H₃	0.126	0.126	0.126	0.124	0.126	0.126
	T₁	0.124	0.124	0.125	0.123	0.124	0.124
	T₂	0.118	0.118	0.119	0.115	0.114	0.117
	T₃	0.123	0.123	0.123	0.119	0.116	0.121
	T₄	0.162	0.161	0.160	0.161	0.158	0.160
	I₄	0.186	0.186	0.185	0.192	0.195	0.189
	I₅	0.161	0.161	0.162	0.165	0.167	0.163
2	H₁	0.108	0.108	0.108	0.108	0.108	0.108
	H₂	0.108	0.108	0.108	0.108	0.108	0.108
	T₁	0.110	0.111	0.111	0.111	0.111	0.111
	T₂	0.114	0.114	0.115	0.116	0.116	0.115
	T₄	0.110	0.111	0.111	0.112	0.113	0.111
	I₁	0.105	0.106	0.106	0.107	0.107	0.106
	I₅	0.104	0.104	0.104	0.104	0.104	0.104
	I₇	0.113	0.112	0.111	0.110	0.110	0.111
	I₈	0.128	0.126	0.126	0.124	0.123	0.125
3	H₁	0.099	0.099	0.099	0.099	0.099	0.099
	H₂	0.102	0.102	0.102	0.102	0.102	0.102
	H₃	0.101	0.101	0.101	0.102	0.102	0.101
	T₁	0.098	0.098	0.098	0.098	0.098	0.098
	T₂	0.093	0.093	0.093	0.093	0.093	0.093
	T₃	0.092	0.091	0.091	0.091	0.090	0.091
	T₄	0.093	0.093	0.092	0.092	0.091	0.092
	I₁	0.100	0.099	0.099	0.098	0.098	0.099
	I₃	0.109	0.109	0.109	0.109	0.109	0.109
	I₇	0.115	0.116	0.116	0.116	0.117	0.116
4	H₁	0.090	0.090	0.090	0.090	0.090	0.090
	T₁	0.089	0.089	0.089	0.089	0.089	0.089
	T₂	0.090	0.090	0.090	0.090	0.090	0.090
	T₃	0.089	0.089	0.089	0.089	0.089	0.089
	T₄	0.091	0.091	0.091	0.091	0.091	0.091
	I₁	0.093	0.093	0.093	0.093	0.093	0.093
	I₂	0.093	0.093	0.093	0.093	0.092	0.093
	I₅	0.094	0.093	0.093	0.093	0.093	0.093
	I₆	0.092	0.092	0.092	0.092	0.092	0.092
	I₇	0.091	0.091	0.091	0.091	0.091	0.091
	I₈	0.088	0.088	0.088	0.088	0.088	0.088

2.5 模型性能评估

在深度学习中,损失函数是衡量模型性能的关键指标之一。如图5所示,展示了5个子模型在训练过程中每个周期(epoch,完整遍历次数)的MSE损失。其中均方误差是一种常用的损失函数,用于衡量模型预测值与实际值之间的差异。MSE损失的计算方式是将每个预测值与实际值之间的差值平方,然后计算这些平方差的平均值。

显示原图|下载原图ZIP|生成PPT

图5 各个子模型训练损失

Fig.5 Training loss curves of sub-models

训练的目标是找到一组模型参数,使得损失函数的值最小。本文选用周期数为5,即模型遍历整个训练数据集5次,且每个周期包含一次完整的训练数据。批量大小取32,每次梯度更新时,模型将处理32个样本。从训练数据中划分出20%的数据作为验证集,用于在训练过程中评估模型的性能。如损失函数图所示,损失值的范围大多从0.7左右减低到接近0.0左右,说明由Bagging算法生成的各子模型在训练过程中取得了显著的改进。通过观察损失曲线的变化,可知随着epoch的增加,各测点中5个子模型的训练损失函数都呈下降并趋于平稳,所有模型都呈现出收敛的趋势,这表明其性能在逐渐提高并达到了稳定状态。

2.6 耦合模型预测结果

将训练好的模型对测试集数据进行预测验证,绘制预测结果与实测数据的对比残差图,如图6所示。

显示原图|下载原图ZIP|生成PPT

图6 模型预测结果及残差

Fig.6 Model prediction results and residuals

从图6可知该耦合模型残差值较小,且残差分布随机性较强,表明模型预测精度高。4个测点拟合结果均表现为平滑且与实测数据吻合良好,预测结果稳定并未出现“畸形”现象。

3 不同模型预测比较

LSTM模型是当下较为成熟的时间序列预测的模型,在大坝预测领域取得了一定的成功;逐步回归模型引领着传统回归分析模型,在相关领域得到了较为成熟且广泛的应用;LASSO回归模型作为一种线性回归模型,利用L1正则化可减少模型的复杂程度并防止过拟合。因此,本文选取同一数据集和相同比例划分,分别引用LSTM多因素模型、逐步回归预测模型、LASSO回归模型、LASSO-LSTM模型进行对比研究。

各模型预测结果对比如图7所示,各模型均能大致描述实测大坝位移的变化总趋势。但对于LASSO回归模型和逐步回归模型预测误差较大,未能预测曲线的细微变化趋势。尽管LASSO回归可能在数据关系非线性的情况下拟合效果不佳,但它使用交叉验证来选择惩罚参数

λ

可以提高特征选择的可靠性,减少模型复杂性。LSTM多因素预测值与实测值之间存在着局部波动序列预测较差的问题。LASSO-LSTM模型与耦合模型的拟合曲线与实测大坝位移曲线基本一致。但在模型训练时,LASSO-LSTM模型耗时过长,效率过低。因此,本文采用Bagging集成学习算法通过对多个简单子模型并行训练,显著提高了模型计算效率。综上所述,本文提出的耦合模型在整体预测趋势和部分波动预测精度都明显优于其他模型。

显示原图|下载原图ZIP|生成PPT

图7 各模型预测结果对比

Fig.7 Comparison of prediction results of each model

为验证本文提出耦合模型的性能,选取常用平均绝对误差(Mean Absolute Error,MAE)、MSE、均方根误差(Root Mean Square Error,RMSE)作为模型拟合优度评定指标,计算公式分别为:

(13)

M A E = 1 N ∑ i = 1 N y i - y ∧ i,

(14)

M S E = 1 N ∑ i = 1 N (y i - y ∧ i) 2,

(15)

R M S E = 1 N ∑ i = 1 N (y i - y ∧ i) 2 。

式中:N表示数据集长度;

y i

表示测点实测值;

y ∧ i

表示模型预测值。

对逐步回归预测模型、LASSO-LSTM模型、LSTM多因素模型、LASSO回归预测模型的精准度计算结果进行对比分析,计算结果越小,表示模型精确性越高。各模型的MAE、MSE、RMSE计算结果见表3。由表3可知,本文构建的耦合模型在预测精度和稳定性方面具有明显优势,4个测点的MAE、MSE、RMSE平均值依次为0.052、0.005、0.067 mm。

表3 各模型的评价指标

Table 3 Evaluation indicators of each model

测点	模型类型	MAE/mm	MSE/mm	RMSE/mm
	耦合模型	0.047	0.003	0.059
	逐步回归预测模型	1.126	2.044	1.430
1	LASSO-LSTM模型	0.285	0.164	0.405
	LSTM多因素模型	0.674	0.599	0.774
	LASSO回归预测模型	1.119	2.073	1.440
	耦合模型	0.046	0.003	0.057
	逐步回归预测模型	0.739	1.159	1.077
2	LASSO-LSTM模型	0.180	0.053	0.230
	LSTM多因素模型	0.431	0.260	0.509
	LASSO回归预测模型	0.776	1.223	1.106
	耦合模型	0.038	0.002	0.045
	逐步回归预测模型	0.206	0.078	0.279
3	LASSO-LSTM模型	0.137	0.028	0.167
	LSTM多因素模型	0.161	0.036	0.191
	LASSO回归预测模型	0.211	0.080	0.283
	耦合模型	0.077	0.011	0.106
	逐步回归模型	0.387	0.238	0.487
4	LASSO-LSTM模型	0.088	0.018	0.135
	LSTM多因素模型	0.120	0.029	0.169
	LASSO回归预测模型	0.382	0.235	0.485

由图8可知,LASSO-LSTM模型评定参数均低于LSTM,说明加入LASSO算法可有效筛选出与大坝位移量有影响的因子,简化模型的因子选择,提高模型预测精度。LASSO回归模型与逐步回归模型优势在于反映线性趋势,但由于大坝位移量受多种因素影响,呈现局部复杂多变的情况,导致模型预测较为困难,其评定参数较高。相较于其他深度学习模型来说,本文提出的耦合模型评定参数均优于其他预测模型,说明加入注意力机制使其具有较好的非线性提取能力,组合Bagging算法提高模型的泛化性和准确性,使模型在处理大量非线性的时间序列数据时更稳定。

显示原图|下载原图ZIP|生成PPT

图8 各模型精度评价雷达

Fig.8 Radar charts of accuracy evaluation for each model

4 结论

本文结合LASSO回归特征选择、含注意力机制LSTM模型以及Bagging集成算法的优势,提出了一种多模型耦合的方法。与其他预测模型进行对比分析,得到了以下结论:

(1)在特征数量较多的情况下,LASSO变量选择方法通过添加L1正则化项来减少模型的复杂度并筛选出对坝体位移有重要影响的特征,增强因子选择的可解释性。结合该方法,集成多个含有注意力机制LSTM模型并行训练预测,减少了单个模型可能出现的过拟合问题,提高了耦合模型的泛化能力和预测效率。在实际应用中,基于可解性变量选择的耦合模型为后续组合模型的优化提供了参考依据。

(2)结合实际案例的评价指标显示耦合模型具有较高的预测精度,4个测点的MAE、MSE、RMSE平均值依次为0.052、0.005、0.067 mm。通过与多种常用模型的对比分析,结果表明多模型耦合在工程应用中具备显著的优势,能够更准确地反映大坝结构的动态变化。

(3)本文主要研究对象是以不同坝段内的某一个监测点为主,其构建的多因素单测点模型实现了高效率、高精度的预测。未来的研究方向可考虑从不同坝段的单测点转变到同坝段的多测点,分析测点所在的位置和不同测点之间的关系,构建全面的多测点耦合模型。

References

Publishing order | Descend order by publishing year | Descend order by cited within

[1]	李明超, 任秋兵, 孔锐, 等. 多维复杂关联因素下的大坝变形动态建模与预测分析[J]. 水利学报, 2019, 50(6): 687-698. (LI Ming-chao, REN Qiu-bing, KONG Rui, et al. Dynamic Modeling and Prediction Analysis of Dam Deformation under Multidimensional Complex Relevance[J]. Journal of Hydraulic Engineering, 2019, 50(6): 687-698.) (in Chinese)

[2]

王瑞婕, 包腾飞, 李扬涛, 等. 基于多因子融合和Stacking集成学习的大坝变形组合预测模型[J]. 水利学报, 2023, 54(4): 497-506.

(WANG

Rui-jie

, BAO

Teng-fei

, LI

Yang-tao

, et al. Combined Prediction Model of Dam Deformation Based on Multi-factor Fusion and Stacking Ensemble Learning[J]. Journal of Hydraulic Engineering, 2023, 54(4): 497-506.) (in Chinese)

[3]	龙江, 左生龙, 徐朗, 等. 基于影响因子筛选和GWO-KELM的大坝变形预测模型[J]. 中国农村水利水电, 2024(8):194-199,207. DOI (LONG Jiang, ZUO Sheng-long, XU Lang, et al. Dam Deformation Prediction Model Based on Impact Factors Screening and GWO-KELM[J]. China Rural Water and Hydropower, 2024(8):194-199, 207.) (in Chinese) DOI

[4]	张孟昕, 陈波, 刘伟琪, 等. SSA-XGBoost与时空特征选取的大坝变形预测模型[J]. 水力发电学报, 2024, 43(1): 84-98. (ZHANG Meng-xin, CHEN Bo, LIU Wei-qi, et al. Dam Deformation Prediction Model Selected by SSA-XGBoost with Temporal and Spatial Features[J]. Journal of Hydroelectric Engineering, 2024, 43(1): 84-98.) (in Chinese)

[5]	罗璐, 李志, 张启灵. 大坝变形预测的最优因子长短期记忆网络模型[J]. 水力发电学报, 2023, 42(2): 24-35. (LUO Lu, LI Zhi, ZHANG Qi-ling. Optimal Factor Set Based Long Short-term Memory Network Model for Prediction of Dam Deformation[J]. Journal of Hydroelectric Engineering, 2023, 42(2): 24-35.) (in Chinese)

[6]	黄海燕, 艾星星, 刘兴阳, 等. 基于可解释性分析的大坝变形监控模型对比研究[J]. 人民长江, 2024, 55(9):203-209. (HUANG Hai-yan, AI Xing-xing, LIU Xing-yang, et al. Comparison of Monitoring Model for Dam Deformation Based on Interpretability Analysis[J]. Yangtze River, 2024, 55(9): 203-209.) (in Chinese)

[7]	陈斯煜, 顾冲时, 盛金保, 等. SBL驱动的可解释性大坝变形区间预测模型[J]. 水力发电学报, 2025, 44(1): 18-29. (CHEN Si-yu, GU Chong-shi, SHENG Jin-bao, et al. Sparse Bayesian Learning-driven Interpretable Interval Prediction Model for Dam Deformation[J]. Journal of Hydroelectric Engineering, 2025, 44(1): 18-29.) (in Chinese)

[8]

姜振翔, 徐镇凯, 魏博文. 基于小波分解和支持向量机的大坝位移监控模型[J]. 长江科学院院报, 2016, 33(1):43-47.

DOI

(JIANG

Zhen-xiang

, XU

Zhen-kai

, WEI

Bo-wen

. A Monitoring Model of Dam Displacement Based on Wavelet Decomposition and Support Vector Machine[J]. Journal of Yangtze River Scientific Research Institute, 2016, 33(1): 43-47.) (in Chinese)

DOI

[9]

朱小韦, 袁占良, 李宏超. 基于BP-PCA-WCA-SVM的混凝土大坝变形预测方法[J]. 长江科学院院报, 2024, 41(9): 138-145.

DOI

(ZHU

Xiao-wei

, YUAN

Zhan-liang

, LI

Hong-chao

. A Method of Predicting Concrete Dam Deformation Based on BP-PCA-WCA-SVM[J]. Journal of Changjiang River Scientific Research Institute, 2024, 41(9): 138-145.) (in Chinese)

[10]

崔婷婷, 安雪莲, 孙德亮, 等. 基于SHAP的可解释机器学习的滑坡易发性评价模型[J]. 成都理工大学学报(自然科学版), 2025, 52(1): 153-172.

(CUI

Ting-ting

, AN

Xue-lian

, SUN

De-liang

, et al. Explainable Machine Learning Models for Landslide Susceptibility Mapping Based on SHAP[J]. Journal of Chengdu University of Technology (Science & Technology Edition), 2025, 52(1): 153-172.) (in Chinese)

[11]	李端有, 周元春, 甘孝清. 混凝土拱坝多测点确定性位移监控模型研究[J]. 水利学报, 2011, 42(8): 981-985, 994. (LI Duan-you, ZHOU Yuan-chun, GAN Xiao-qing. Research on Multiple Points Deterministic Displacement Monitoring Model of Concrete Arch Dam[J]. Journal of Hydraulic Engineering, 2011, 42(8): 981-985, 994.) (in Chinese)

[12]	何裕坤, 晁阳, 李同春, 等. 基于SBO-LSTM的大坝变形预测模型[J]. 水利水电技术(中英文), 2024, 55(增刊1): 78-86. (HE Yukun, CHAO Yang, LI Tongchun, et al. Dam Deformation Prediction Model Based on SBO-LSTM[J]. Water Resources and Hydropower Engineering, 2024, 55(Supp. 1): 78-86.) (in Chinese)

[13]	翁鸣昊, 项兴华, 陈俊涛, 等. 基于LSTM与Transformer的大坝变形预测研究[J]. 中国农村水利水电, 2024(4):250-257. DOI (WENG Ming-hao, XIANG Xing-hua, CHEN Jun-tao, et al. Dam Deformation Prediction Research Based on LSTM and Transformer[J]. China Rural Water and Hydropower, 2024(4): 250-257.) (in Chinese) DOI

[14]

姜建国, 陈鹏, 郭晓丽, 等. 基于双注意力机制的Seq2Seq短期负荷预测[J]. 吉林大学学报(信息科学版), 2023, 41(2): 251-258.

(JIANG

Jian-guo

, CHEN

Peng

, GUO

Xiao-li

, et al. Seq2seq Short-term Load Forecasting Based on Double Attention Mechanism[J]. Journal of Jilin University (Information Science Edition), 2023, 41(2): 251-258.) (in Chinese)

[15]

向镇洋, 包腾飞, 白妍丽, 等. 基于混合注意力机制和深度学习的大坝变形预测模型[J]. 水利水电科技进展, 2023, 43(2): 96-101.

(XIANG

Zhen-yang

, BAO

Teng-fei

, BAI

Yan-li

, et al. Dam Deformation Prediction Model Based on Mixed Attention Mechanism and Deep Learning[J]. Advances in Science and Technology of Water Resources, 2023, 43(2): 96-101.) (in Chinese)

[16]

王晓玲, 梁羽翎, 王佳俊, 等. 耦合注意力机制大坝变形改进LSTM序列到序列预测模型[J]. 天津大学学报(自然科学与工程技术版), 2023, 56(7): 702-712.

(WANG

Xiao-ling

, LIANG

Yu-ling

, WANG

Jia-jun

, et al. Improved LSTM Sequence-to-sequence Prediction Model for Dam Deformation Coupled with Attention Mechanism[J]. Journal of Tianjin University (Science and Technology), 2023, 56(7): 702-712.) (in Chinese)

[17]	REN Q, LI M, LI H, et al. A Novel Deep Learning Prediction Model for Concrete Dam Displacements Using Interpretable Mixed Attention Mechanism[J]. Advanced Engineering Informatics, 2021, 50: 101407. DOI

[18]	郭张军, 黄华东, 屈旭东. 基于深度学习的大坝变形预测模型[J]. 水电能源科学, 2020, 38(3): 83-86, 185. (GUO Zhang-jun, HUANG Hua-dong, QU Xu-dong. Dam Deformation Prediction Model Based on Deep Learning[J]. Water Resources and Power, 2020, 38(3): 83-86, 185.) (in Chinese)

[19]	施彦彤, 郑东健, 赵汉, 等. 基于CNN-Attention-LSTM的大坝变形预测模型[J]. 水利水电技术(中英文), 2024, 55(9): 121-132. (SHI Yan-tong, ZHENG Dong-jian, ZHAO Han, et al. Dam Deformation Prediction Model Based on CNN-attention-LSTM[J]. Water Resources and Hydropower Engineering, 2024, 55(9):121-132.) (in Chinese)

[20]

邓思源, 周兰庭, 王飞, 等. 大坝变形的XGBoost-LSTM变权组合预测模型及应用[J]. 长江科学院院报, 2022, 39(10): 72-79.

DOI

(DENG

Si-yuan

, ZHOU

Lan-ting

, WANG

Fei

, et al. XGBoost-LSTM Combinatorial Model with Variable Weight for Dam Deformation Prediction and Its Application[J]. Journal of Yangtze River Scientific Research Institute, 2022, 39(10): 72-79.) (in Chinese)

DOI

[21]

刘丹, 吕倩, 胡少华, 等. 大坝变形GA-LSTM组合预测模型研究[J]. 安全与环境学报, 2023, 23(7): 2246-2253.

(LIU

Dan

, LÜ

Qian

, HU

Shao-hua

, et al. A Combined Model for Predicting Dam Deformation Based on Genetic Algorithm and Long Short-term Memory Neural Network[J]. Journal of Safety and Environment, 2023, 23(7): 2246-2253.) (in Chinese)

[22]	王悦, 曹颖, 许方党, 等. 考虑非滑坡样本选取和集成机器学习方法的水库滑坡易发性预测[J]. 地球科学, 2024, 49(5): 1619-1635. (WANG Yue, CAO Ying, XU Fang-dang, et al. Reservoir Landslide Susceptibility Prediction Considering Non-landslide Sampling and Ensemble Machine Learning Methods[J]. Earth Science, 2024, 49(5): 1619-1635.) (in Chinese)

[23]	FAN J Z, FAN Z Y. A Time Series Regression Model via Improved PCA and Bagging Algorithms[J]. Academic Journal of Engineering and Technology Science, 2023, 6(5): 702-712.

[24]	王晓玲, 谢怀宇, 王佳俊, 等. 基于Bootstrap和ICS-MKELM算法的大坝变形预测[J]. 水力发电学报, 2020, 39(3): 106-120. (WANG Xiao-ling, XIE Huai-yu, WANG Jia-jun, et al. Prediction of Dam Deformation Based on Bootstrap and ICS-MKELM Algorithms[J]. Journal of Hydroelectric Engineering, 2020, 39(3):106-120.) (in Chinese)

Options

Outlines

模态框（Modal）标题

Abstract

Cite this article

0 引言

1 方法原理

1.1 LASSO回归因子选择

1.2 基于注意力机制编解码LSTM模型

1.2.1 LSTM模型

1.2.2 注意力机制编解码器

图1 Attention-LSTM模型流程

1.3 Bagging算法

1.4 模型耦合

图2 耦合模型流程

2 算例分析

图3 不同坝段测点位移过程线

2.1 数据预处理

2.2 LASSO筛选输入特征

图4 影响因子权重占比

表1 LASSO回归影响因子选择结果

2.3 注意力机制编解码器

2.4 基于Bagging算法的预测模型

表2 子模型影响因子注意力权重

2.5 模型性能评估

图5 各个子模型训练损失

2.6 耦合模型预测结果

图6 模型预测结果及残差

3 不同模型预测比较

图7 各模型预测结果对比

表3 各模型的评价指标

图8 各模型精度评价雷达

4 结论

References