工程安全与灾害防治

基于BP-PCA-WCA-SVM的混凝土大坝变形预测方法

  • 朱小韦 , 1 ,
  • 袁占良 2 ,
  • 李宏超 , 1
展开
  • 1 河南测绘职业学院,郑州 451464
  • 2 河南理工大学 测绘与国土信息工程学院,河南 焦作 454000
李宏超(1979-),男,山东菏泽人,教授,硕士,研究方向为地理测绘及人工智能算法。E-mail:

朱小韦(1981-),男,河南新乡人,副教授,硕士,研究方向为精密工程测量。E-mail:

Copy editor: 黄玲

收稿日期: 2023-02-24

  修回日期: 2023-05-05

  网络出版日期: 2023-11-01

基金资助

国家自然科学基金项目(41572341)

:教育部高等学校科学研究发展中心专项课题(ZJXF2022161)

A Method of Predicting Concrete Dam Deformation Based on BP-PCA-WCA-SVM

  • ZHU Xiao-wei , 1 ,
  • YUAN Zhan-liang 2 ,
  • LI Hong-chao , 1
Expand
  • 1 Henan College of Surveying and Mapping,Zhengzhou 451464,China
  • 2 School of Surveying and LandInformation Engineering, Henan Polytechnic University, Jiaozuo 454000, China

Received date: 2023-02-24

  Revised date: 2023-05-05

  Online published: 2023-11-01

摘要

传统基于单一模型的混凝土大坝变形预测方法预测精度低,噪声稳健性差,泛化能力弱。为解决该问题,提出一种基于贝塔先验主成分分析(BP-PCA)与水循环算法(WCA)优化支撑向量机(SVM)相结合的混凝土大坝变形组合预测方法。首先利用所提BP-PCA模型对变形数据进行多尺度降噪分解,将复杂非线性、非平稳随机过程分解为一系列结构简单的主分量;然后利用WCA优化的SVM(WCA-SVM)对每个主分量分别建立预测模型;最后将多个主分量的预测结果综合叠加得到最终预测结果。以我国中部地区某混凝土大坝变形监测数据开展试验,结果表明,所提BP-PCA模型能够有效挖掘数据中隐含的趋势性和规律性信息,BP-PCA-WCA-SVM模型能够获得较高的预测精度,预测结果的相对误差为1.07%,误差均方根为0.065。相对于Kalman滤液、SVM、CNN 3种方法,所提模型预测性能提升均超过62%,并且具有更强的噪声稳健性和泛化能力。

本文引用格式

朱小韦 , 袁占良 , 李宏超 . 基于BP-PCA-WCA-SVM的混凝土大坝变形预测方法[J]. 长江科学院院报, 2024 , 41(9) : 138 -145 . DOI: 10.11988/ckyyb.20230194

Abstract

Traditional single-model prediction methods suffer from issues like low accuracy, susceptibility to noise, and limited generalization capability. To address these challenges, we propose a novel approach for predicting concrete dam deformation by integrating the Beta Prior Principal Component Analysis (BP-PCA) and the Water Cycle Algorithm (WCA). Initially, the BP-PCA model decomposes deformation data into multiple scales, effectively reducing noise. This decomposition transforms the intricate nonlinear and non-stationary stochastic process into a set of principal components with simplified structures. Simultaneously, it enhances noise robustness by suppressing noise during the decomposition process. Subsequently, we employ the Water Cycle Algorithm optimized Support Vector Machine (WCA-SVM) to construct prediction models for each principal component. Finally, we integrate the prediction outcomes from multiple principal components to derive the final prediction result. The relative prediction error is minimized to 1.07%, with a root mean square error of 0.065. Compared to the three methods included in the comparative analysis, our approach yields over 62% improvement in prediction performance, demonstrating superior noise robustness and generalization capability.

开放科学(资源服务)标识码(OSID):

0 引言

近年来,随着我国经济社会的快速发展,港珠澳大桥、白鹤滩水电站、中国高铁、特高压输电等众多利国利民的大型水电、土木工程相继投入运行,极大地提升了人民群众的生活便利性。与此同时,这些大型、超大型建筑工程在使用和运维过程中受自然环境,人类活动等众多因素的综合影响,会产生不同程度的沉降变形。若变形量过大,则会导致建筑物产生裂缝,造成安全隐患。因此,及时、准确地对建筑物变形趋势进行预测从而提前预警,对于保护人民群众的生命财产安全和经济社会的平稳健康发展具有重要意义[1-2]
目前国内外学者对建筑物变形预测的研究可以归纳为统计类方法和人工智能类方法。其中,统计类方法以时间序列[3]、卡尔曼(Kalman)滤波[4]、灰色理论模型(Grey Model, GM)[5]等为代表。其基本思想是利用精确的数学模型对建筑物变形过程进行建模,从而对建筑物未来的变形趋势进行预测。文献[6]将自回归滑动平均(Auto Regression Moving Average, ARMA)模型引入变形监测领域,利用ARMA对地铁变形监测数据进行建模和预测,获得了较高的短期预测精度;文献[7]首先介绍了3种典型Kalman滤波方法(KKF、STKF和STME)的基本原理,进而较为全面地对其在建筑物变形预测中的应用效果进行了对比分析;文献[8]将灰色理论模型应用到建筑变形预测工程实例中,获得了较小的后验差比值和较高的预测精度。不同于统计类方法,人工智能类方法的核心是数据驱动,不需要建立精确的数学模型,直接利用人工智能算法的自适应、自学习能力从历史变形数据中抽象得到网络结构参数,从而实现对未来变形趋势的预测,以支撑向量机(Support Vector Machine, SVM)[9]、长短时记忆神经网络(Long Short-Term Memory Neural Network, LSTM)[10]和卷积神经网络(Convolution Neural Network, CNN)[11]等方法为代表。SVM在面对小样本、非线性问题时表现出特有优势,文献[12]利用SVM对郴宁高速公路位移数据进行分析和预测,获得了远高于时间序列模型的预测精度;LSTM独有的具有记忆功能的隐含层提升了其对不同时间序列的适应能力,文献[13]利用LSTM对滑坡位移变化趋势进行预测,并利用循环移位的方式进行网络参数实时更新,从而获得了动态预测能力;CNN相对于LSTM具有更加鲁棒的卷积架构,文献[14]首先分析了大坝变形时间序列的非线性和非平稳特征,进而利用CNN对其进行建模预测,相对于LSTM获得了更高的预测精度。
建筑物变形过程受众多因素影响,是一种典型的非线性、非平稳随机过程,且具有明显的波动性、微弱性和多尺度特点。上述采用单一模型的预测方法在实际应用过程中都存在或多或少的问题。例如,时间序列模型只适合进行短时预测,在进行长时预测时会出现累积误差;GM和Kalman滤波方法不适合对非平稳随机过程建模;SVM预测性能受核参数和偏移量的选取影响较大,LSTM和CNN需要大量高质量训练数据,模型泛化能力弱且对噪声敏感。
针对上述问题,本文提出一种基于贝塔先验主成分分析(Beta Prior Principal Component Analysis, BP-PCA)与水循环算法(Water Cycle Algorithm, WCA)优化SVM相结合的BP-PCA-WCA-SVM组合预测方法,并利用我国中部某地区混凝土大坝实际变形监测数据开展试验对所提方法的预测性能进行验证。

1 基于BP-PCA的变形数据降噪分解

1.1 PCA

建筑物变形是一种长期、缓慢的变化过程,与环境变化和人类活动等多种因素相关,呈现出典型的波动性、微弱性和多尺度特点。如果直接对变形监测原始数据进行建模分析,不仅会增加模型的复杂度,而且受数据中噪声和干扰等随机因素的影响,难以全面提取数据中的有用信息,预测精度较低。PCA是一种经典的数据降维去噪方法,通过线性变换将高维数据分解为低维空间中少数几个主分量的形式,并且这些主分量中包含了原始数据中绝大部分有用信息[15]
对于建筑物变形监测数据x= x 1 , x 2 , , x D,利用PCA对其进行降噪分解首先需要计算得到x的协方差矩阵R
R = E x - x - T x - x -  
式中:E(·)为求期望运算; x -x的均值。
然后对R进行特征分解,即
R = i = 1 D λ i u i u T i = i = 1 M λ i u i u T i + i = M + 1 D σ 2 u i u T i  
式中: λ iui分别为R的第i个特征值和特征向量; σ 2为噪声方差,且 λ 1 λ 2 λ M σ 2
从式(2)可以看出,特征分解后,R由两部分构成,第一部分为前 M( M D)个大特征值以及对应的特征向量,即主分量,主分量中包含了原始数据中的有用信息;第二项为剩余 D - M个小特征值以及对应的特征向量,即次分量,次分量中主要包含了原始数据中的噪声和干扰等无用信息。
最后需要确定主分量个数 M,目前常用的方法是根据占特征值总能量90%的大特征值个数确定 M,即
M = a r g i i = 1 M λ i 2 / i = 1 D λ i 2 = 0.90  
上述确定主分量个数的方法存在主观性较强,且对不同数据适应性差等问题[16],因此需要对其进行优化,使其能够自动确定主分量个数。

1.2 BP-PCA降噪分解模型

本文将贝叶斯理论引入PCA,提出BP-PCA模型,利用伯努利-贝塔先验的稀疏性实现最优主分量个数的自动确定,式(4)给出了所提BP-PCA模型。
x = U B U T x + ε   , B = d i a g b 1 , b 2 , , b D   , b k ~ B e r n o u l l i π k   , π k ~ B e t a a 0 , b 0   , ε ~ N o r m 0 , α - 1 I   , α ~ G a m m a c 0 , d 0  
式中U为式(2)获得的特征向量矩阵,U= u 1 , u 2 , , u D。模型中其他参数的解释如下:
(1)对角矩阵B=diag b 1 , b 2 , , b D。BP-PCA的目的是实现对特征向量矩阵U= u 1 , u 2 , , u D中主分量的自动选取,BP-PCA模型对对角矩阵B=diag b 1 , b 2 , , b D引入伯努利分布,即bk~Bernoulli π k,伯努利分布的引入使bk的取值只能为0或者1,bk=1表明对应的uk被选择,否则uk被抛弃,πkbk取值为1的概率。
为了给模型引入稀疏性,根据贝叶斯理论,BP-PCA进一步对πk构建贝塔先验,即πk~Beta a 0 , b 0,a0、b0为超参数。此时πk的均值和方差分别为
< π k > = a 0 / a 0 + b 0   , < π k - < π k > 2 > = a 0 b 0 / a 0 + b 0 2 a 0 + b 0 + 1
式中 < · >表示求变量的期望运算符。根据式(5)可知,当 a 0 / a 0 + b 0取值趋向于0时, π k的均值 < π k >和方差 < π k - < π k > 2 >同样趋近于0,表明 b k = 1的概率很小,即大部分特征向量被“关闭”,从而实现对主分量的自动选择。
(2)噪声分量 ε。BP-PCA假设噪声分量与包含有用信息的主分量是相互独立的,且服从零均值,协方差矩阵为 α - 1 I的高斯分布,即ε~N(0,α-1I)。同时,为了提升模型的噪声稳健性,BP-PCA进一步对 α赋予参数为 c 0 d 0的伽马(Gamma ·)先验。在模型求解过程中会发现,随着迭代的进行, α会逐渐趋近于无穷大,对应的 α - 1 I会趋近于零矩阵,从而使模型获得噪声稳健性。
(3)模型求解。目前对于全概率贝叶斯模型,经典的求解方法为变分贝叶斯期望最大(Variational Bayesian Expectation Maximization, VBEM)算法[17],本文采用VBEM算法对所提BP-PCA进行求解,模型的全数据对数似然函数可以表示为
L = D K l n α - γ n = 1 N ( s - U B U T s ) T ( s - U B U T s ) + k = 1 K z k l n π k + ( 1 - z k ) l n ( 1 - π k ) + l n Γ ( a 0 + b 0 ) Γ ( a 0 ) Γ ( b 0 ) + ( a 0 - 1 ) l n π k + ( b 0 - 1 ) l n ( 1 - π k ) ] + [ - l n Γ ( c 0 ) + c 0 l n d 0 + ( c 0 - 1 ) l n α - d 0 α ] + c o n s t  
式中:D为信息空间维度;K为主分量个数;N为特征值个数;const为模型中的常数集合。通过提取式(6)中与特定变量有关项,并将其他变量用其期望值代替的方式可获得各个变量后验概率分布的具体形式。

2 WCA-SVM预测模型

2.1 SVM回归模型

变形监测数据经BP-PCA分解后,得到 M个结构简单的主分量,本文对 M个主分量分别建立SVM回归模型进行预测。SVM是最大边界决策和结构风险最小化准则下的一种回归模型,具有模型复杂度低,预测精度高且适合小样本应用等优点。利用SVM对BP-PCA得到的第 k个主分量uk进行回归预测可以表示为
y k = ω T · φ ( u k ) + e  
式中: ω为权值; φ ( · )为非线性映射函数; e为偏移量。
利用拉格朗日乘子法将式(7)中参数 ω e的求解转化为式(8)所示优化问题。
m a x k = 1 l η k - η k * y k - 1 2 k = 1 l j = 1 l η k - η k * ·   K u k , u j - k = 1 l η i + η i * e   , s . t . k = 1 l η k - η k * = 0    
式中: η k η k *为拉格朗日乘子,k=1,2,…,l,l为拉格朗日乘子维度;ukuj分别为第k和第j个主分量;K u k , u j为满足摩西准则的核函数,目前常用的形式为高斯核函数,即
K u k , u j = e x p - u k - u j 2 2 δ 2  
式中 δ为核参数。
求解式(8)所示优化问题可以得到最终的SVM回归模型为
f u k = k = 1 l η k - η k * K u k , u l + e  

2.2 WCA-SVM预测算法

SVM回归模型的预测性能受核参数 δ和偏移量 e影响较大,目前常用的交叉验证方法存在运算量大、自动化程度低等问题[18]。WCA算法是对自然界中溪流和河流汇入大海过程进行抽象而得到的启发式优化算法,相对于传统粒子群算法、遗传算法、人工蜂群算法等具有更高的运算效率和更快的收敛速度,更容易获得全局最优解。
与传统启发式优化算法类似,WCA也需要构建初始种群和适应度函数,其中适应度函数值最小的个体记为海洋Sea;适应度函数值较小的个体记为河流River;其余适应度函数值较大的个体记为溪流Stream。在迭代过程中,按照溪流流向河流和大海,河流流向大海这一准则对不同个体的位置进行更新;为了避免陷入局部最优解,WCA引入了蒸发的概念,每次蒸发后重新划分大海、河流和溪流,从而确保算法收敛于最优解。
对于SVM核参数和偏移量优化问题,WCA首先生成大小为Npop×K的初始种群,其中Npop为种群数量, K为寻优的变量个数,由于本文需要对 M个主分量分别建立SVM预测模型,因此 K = 2 M,初始种群矩阵可以表示为
S e a R i v e r 1 R i v e r 2 S t r e a m N s r + 1 S t r e a m N s r + 2 S t r e a m N p o p = x 1 1 x 2 1 x D 1 x 1 2 x 2 2 x D 2 x 1 N p o p x 2 N p o p x D N p o p  
式中Nsr是海洋(Sea)及河流(River)的数量之和。WCA将溪流流向河流和海洋,河流流向海洋的汇流过程,即溪流、河流和海洋位置更新过程表示为
X s t r e a m t + 1 = X s t r e a m t + σ C X r i v e r t - X s t r e a m t , X s t r e a m t + 1 = X s t r e a m t + σ C X s e a t - X s t r e a m t , X r i v e r t + 1 = X r i v e r t + σ C X s e a t - X r i v e r t
式中: t是当前迭代次数; C是迭代步长; σ为取值在0和1之间的随机数; X t s t r e a m X t r i v e r X t s e a分别为第 t次迭代时溪流、河流和海洋的位置; X s t r e a m t + 1 X t + 1 r i v e r X t + 1 s e a分别为第 t + 1次迭代时溪流、河流和海洋的位置。
每次迭代后,重新计算溪流、河流和海洋的适应度函数值,若溪流的适应度函数值小于其汇入的河流,则将两者位置交换;同样,若河流的适应度函数值小于其汇入的海洋,则将两者位置交换。
为了防止算法收敛于局部最优解,WCA引入蒸发的概念来模拟因流速过慢而无法汇入海洋的溪流和河流,蒸发过程的判决条件为
X s e a t - X r i v e r t < d m a x  
式中dmax通常取为接近0的常数。迭代终止时,海洋的位置即为WCA全局最优解,对应的参数值即为SVM最优核参数 δ *和偏移量 e *

3 算法流程

混凝土大坝变形监测数据呈现出典型的波动性、微弱性和多尺度特点,单一预测模型难以全面获取数据中的信息,因此存在预测精度低,噪声稳健性差,泛化能力较弱等问题。本文结合BP-PCA降噪分解能力和WCA-SVM对小样本、非线性问题的泛化能力,建立BP-PCA-WCA-SVM组合预测方法实现对建筑物变形的高精度预测,具体流程如图1所示。
图1 BP-PCA-WCA-SVM组合预测模型流程

Fig.1 Flow chart of the proposed BP-PCA-WCA-SVM method

首先利用BP-PCA将高维复杂变形数据分解为 M个结构简单主分量的形式,实现噪声抑制的同时有效提取数据中的关键信息。然后对每个主分量分别建立WCA-SVM预测模型,实现对变形趋势的高精度预测。最后将各个主分量预测结果综合叠加从而获得最终预测结果。算法步骤可以总结为:
(1)步骤1:模型初始化。对WCA-SVM预测模型进行初始化,设置WCA种群数量Npop、参数个数 K、海洋与河流数量Nsr、溪流数量Nstream、选择高斯核函数作为SVM核函数。
(2)步骤2:BP-PCA分解。对于建筑物变形监测数据 x,利用BP-PCA模型对其进行自适应分解,自动获得 M个主分量 u 1 u M
(3)步骤3:WCA-SVM预测。对每个主分量分别利用WCA对SVM核参数和偏移量进行全局寻优获取最优参数,进而建立最优WCA-SVM模型进行变形预测,获得预测结果 u 1 * u M *
(4)步骤4:结果综合。将步骤3得到的预测结果按照式(14)进行综合叠加,即PCA反变换,从而获得所提组合模型的预测结果。
x * = U * < B > U * T x  
式中:U*= u 1 * , u 2 * , , u M *;<B>为VBEM算法迭代终止时对角矩阵B的后验期望。

4 试验及结果分析

4.1 试验数据及评估指标

为了验证所提方法在实际工程应用中的预测性能,采用我国中部地区某混凝土大坝2017年1月—2018年12月期间的水平位移数据开展试验,位移数据的采样间隔为1周/期,总共获得97期数据。该大坝总共布设了14个水平位移监测点位,经过前期数据分析发现各个监测点位水平位移变化趋势大致相同。因此本文采用7号点位记录位移数据开展试验,如图2所示。
图2 大坝水平位移数据

Fig. 2 Original time series of dam’s horizontal deformation

图2可知,前20期以及第30—第55期观测时间内,大坝水平位移变化较为平缓,其余时间内位移波动较大,给变形预测带来了困难。
采用式(15)所示预测值与实际位移量之间的相对误差(Relative Error, RE)以及式(16)所示误差均方根(Mean Square Error, MSE)作为所提组合预测模型变形预测性能的定量评估指标。
R E = x i - x i * x i l 2 × 100 %   ;
M S E = 1 N i = 1 N x i - x i * 2  
式中: x i为第 i期位移实测值; x i *为第 i期位移预测值; N为总观测样本数; · l 2表示计算变量的 l 2范数算子。

4.2 组合预测方法预测结果

根据图1所示算法流程,首先需要利用所提BP-PCA模型对图2所示变形监测数据进行自适应分解,将其自动划分为 M个主分量的形式。图3给出了利用VBEM(Variable-Bias-Empirical)算法求解BP-PCA模型,迭代终止时对角矩阵B=diag[b1,b2,…,bD]
图3 BP-PCA主分量个数自动选择结果

Fig.3 Automatic selection result of principal components

后验期望<B>的取值,可以看出,前3个主分量对应的伯努利分布 b k ( k = 1,2 , 3)取值为1,剩余 b k ( k = 4,5 , )取值为0,表明所提BP-PCA对传统PCA引入了稀疏性,实现了主分量个数的自动选择。
图4给出了图2所示位移数据经BP-PCA分解后得到的3个主分量和1个次分量。可以看出,BP-PCA分解将原始数据中不同维度的信息分解至不同主分量中。其中,主分量1表现出了较为明显的波形性,随时间变化比较剧烈;主分量2表现出了较为平稳的趋势性,呈现了随时间上升的趋势信息;主分量3介于两者之间,表现出了一定的周期性趋势;次分量主要为高频噪声,通过剔除次分量能够提升算法的噪声稳健性。对比图2图4可以看出,经过BP-PCA分解后,原始非线性、非平稳的复杂变形数据被分解为3个结构简单平滑的主分量,相对于直接对复杂原始数据建立模型进行变形预测,对3个简单主分量建模预测能够有效降低预测模型的复杂度。
图4 BP-PCA分解结果

Fig.4 BP-PCA decomposition results

完成BP-PCA分解后,需要对每个主分量分别建立WCA-SVM模型进行变形趋势预测。试验中,将前60期数据作为训练样本,用于进行WCA-SVM模型训练和参数优化,剩余37期数据作为测试样本,对3个主分量得到的预测结果如图5(a)图5(c)所示,图5(d)给出了对3个主分量预测结果进行综合叠加得到的最终预测结果。可以看出,所提组合预测模型获得的预测结果与实际变形数据较为接近,根据式(15)和式(16)计算得到的所有期数的最大RE为1.07%,MSE为0.065,预测精度较高。
图5 BP-PCA-WCA-SVM组合预测方法预测结果

Fig.5 Prediction results of the proposed BP-PCA-WCA-SVM model

4.3 与其他预测方法的对比分析

图6给出了在相同条件下分别采用Kalman滤波、SVM、CNN和所提BP-PCA-WCA-SVM组合模型4种方法获得的预测结果与实际变形数据之间的预测残差曲线。表1给出了4种方法预测结果的RE和MSE评估指标。
图6 不同方法预测残差曲线

Fig.6 Curves of residue by different methods

表1 不同方法预测结果

Table 1 Prediction results of different methods

方法 RE/% MSE 方法 RE/% MSE
Kalman 9.35 0.583 CNN 2.89 0.175
SVM 8.15 0.407 组合模型 1.07 0.065
图6表1可知,Kalman滤波模型的预测精度随着时间的推移逐渐降低,预测结果的RE为9.35%,MSE为0.583;SVM模型的预测性能略优于Kalman滤波,预测结果的RE为8.15%,MSE为0.407,但是预测结果的波动性较大;CNN模型的预测性能明显优于SVM,预测结果的RE为2.89%,MSE为0.175,所提BP-PCA-WCA-SVM预测模型对于每一期数据均能获得最高的预测精度,预测结果的RE为1.07%,MSE为0.065,相对于CNN方法预测性能提升超过62%,具有更高的应用前景。

4.4 不同预测方法噪声稳健性对比分析

建筑物变形是一种长期、缓慢的变化过程,变形数据具备微弱性特征,在采集过程中容易被噪声、干扰等污染,从而影响预测模型对数据中有用信息的提取,降低预测性能。因此低信噪比条件下预测算法的噪声稳健性是其能否适应真实环境的关键。图7给出了向图2所示数据添加高斯白噪声构建的信噪比(Singnal-Noise Ratio,SNR)为-6 dB时的数据变化曲线。对比图2图7可知,SNR降低后,数据的起伏更加剧烈,波动性更大,进一步增加了变形预测的难度。
图7 信噪比为-6 dB时的变形监测数据

Fig.7 Deformation monitoring data when signal-to-noise ratio equals -6 dB

图8给出了低信噪比条件下分别采用Kalman滤波、SVM、CNN和所提BP-PCA-WCA-SVM组合模型进行变形预测,得到MSE随SNR变化曲线(信噪比变化范围为-8~0 dB)。可以看出,随着SNR的降低,4种方法预测的MSE都出现了不同程度的下降,其中CNN模型下降最为明显,其在SNR为-6 dB时的预测性能相对于SNR为0 dB时的预测性能下降了96.5%,表明其噪声稳健性较差,而所提组合模型在BP-PCA分解时能够将噪声分量自动分解至次分量中,通过剔除次分量实现噪声抑制,因此所提组合模型表现出了较强的噪声稳健性,在SNR为-6 dB时的预测性能相对于SNR为0 dB时的预测性能仅仅下降了12.4%,明显优于3种对比方法。
图8 不同方法预测性能随SNR变化曲线

Fig.8 Curves of prediction performance versus signal-to-noise ratio of different methods

4.5 不同预测方法泛化能力对比分析

在实际应用中,由于测量条件限制,很多建筑物在运维过程中没有或者只有少量历史变形监测数据,这种情况下,要求预测模型具备小样本条件下的泛化能力,只需要很少的训练样本即可获得高精度的预测结果。针对该种需求,本文建立不同训练样本情况下的预测试验,对所提BP-PCA-WCA- SVM组合模型及Kalman滤波、SVM、CNN的泛化能力进行对比分析。
表2给出了本文构建的5种不同训练和测试样本集划分试验,图9给出了样本集不同划分情况下,4种方法的预测性能。可以看出,Kalman滤波和CNN方法的预测性能随着训练样本数的减少而急剧下降,而SVM和所提组合预测模型在训练数据集减少为前20期情况下获得的预测性能与训练样本集为前50期情况下的预测性能接近,表现出了较强的泛化能力。
表2 不同数据集划分方式

Table 2 Divisions of different datasets

序号 训练数据集 测试数据集 序号 训练数据集 测试数据集
1 前10期 剩余87期 4 前40期 剩余57期
2 前20期 剩余77期 5 前50期 剩余47期
3 前30期 剩余67期
图9 不同训练样本集条件下的预测结果

Fig.9 Prediction results with different training sample sets

5 结论

针对基于单一模型的混凝土大坝变形预测方法存在的预测精度低,噪声稳健性差,泛化能力弱等问题,本文提出一种BP-PCA-WCA-SVM组合模型实现对混凝土大坝变形趋势的高精度预测,主要得到以下结论:
(1)混凝土大坝变形监测数据是一种典型复杂非线性、非平稳随机过程,相对于直接建模分析,采用“分解-预测-重构”方式能够大大降低模型复杂度,同时可以深度挖掘数据中隐含的趋势性和周期性信息,有利于提升预测性能。
(2)BP-PCA模型在分析混凝土大坝变形监测数据时,能够自动确定主分量个数,且将原始数据中不同维度的信息分解至不同主分量中,同时其具备的噪声抑制能力能够提升组合模型的噪声稳健性。
(3)WCA能够实现SVM核参数和偏移量的全局寻优,提升SVM回归模型的预测精度。
(4)基于真实变形监测数据的试验结果表明,所提BP-PCA-WCA-SVM组合预测模型相对于单一预测模型预测精度提升超过62%,并且具有更强的噪声稳健性和泛化能力,更能适应实际应用场景。
[1]
WU Bang-bin, NIU Jing-tai, SU Huai-zhi, et al. An Approach for Deformation Modulus Mechanism of Super-High Arch Dams[J]. Structural Engineering and Mechanics, 2019, 69(5): 557-566.

[2]
WEI B, YUAN D, LI H, et al. Combination Forecast Model for Concrete Dam Displacement Considering Residual Correction[J]. Structural Health Monitoring, 2019, 18(1): 232-244.

[3]
袁德宝, 张振超, 张军, 等. 最优化分数阶算子EGM(1,1)模型在变形监测预报中的应用[J]. 大地测量与地球动力学, 2020, 40(4): 331-334, 345.

(YUAN De-bao, ZHANG Zhen-chao, ZHANG Jun, et al. Application of Optimized Fractional Order EGM (1, 1) Model in Deformation Monitoring and Forecasting[J]. Journal of Geodesy and Geodynamics, 2020, 40(4): 331-334, 345. (in Chinese))

[4]
杨玲, 魏静, 许子伏. 基于平滑先验法-麻雀搜索算法-支撑向量机回归模型的滑坡位移预测:以三峡库区八字门和白水河滑坡为例[J]. 地球科学与环境学报, 2022, 44(6): 1096-1110.

(YANG Ling, WEI Jing, XU Zi-fu. Displacement Prediction of Landslide Based on SPA-SSA-SVR Model: Taking Bazimen and Baishuihe Landslides in Three Gorges Reservoir Area, China as Examples[J]. Journal of Earth Sciences and Environment, 2022, 44(6): 1096-1110. (in Chinese))

[5]
王利, 岳聪, 舒宝, 等. 基于混沌时间序列的黄土滑坡变形预测方法及应用[J]. 地球科学与环境学报, 2021, 43(5): 917-925.

(WANG Li, YUE Cong, SHU Bao, et al. Chaotic Time Series Based Surface Displacement Prediction Method and Application to Loess Landslides[J]. Journal of Earth Sciences and Environment, 2021, 43(5): 917-925. (in Chinese))

[6]
臧妻斌, 黄腾. 时间序列分析在地铁变形监测中的应用[J]. 测绘科学, 2014, 39(7): 155-157.

(ZANG Qi-bin, HUANG Teng. Application of Time Series Analysis in Subway Deformation Monitoring[J]. Science of Surveying and Mapping, 2014, 39(7): 155-157. (in Chinese))

[7]
石强, 戴吾蛟, 晏慧能, 等. 时空Kalman滤波在变形分析中的应用研究[J]. 测绘学报, 2022, 51(10): 2125-2138.

(SHI Qiang, DAI Wu-jiao, YAN Hui-neng, et al. Research on Application of Spatio-temporal Kalman Filter in Deformation Analysis[J]. Acta Geodaetica et Cartographica Sinica, 2022, 51(10): 2125-2138. (in Chinese))

[8]
周春霖, 王有志, 徐刚年, 等. 基于优化非等时距权重傅里叶灰色模型的变形预测[J]. 人民长江, 2019, 50(1): 207-210.

(ZHOU Chun-lin, WANG You-zhi, XU Gang-nian, et al. Optimization of Non-equal Interval Weight Fourier Grey Model for Deformation Prediction[J]. Yangtze River, 2019, 50(1): 207-210. (in Chinese))

[9]
ORLAND E, ROERING J J, THOMAS M A, et al. Deep Learning as a Tool to Forecast Hydrologic Response for Landslide-prone Hillslopes[J]. Geophysical Research Letters, 2020, 47(16): 1-12.

[10]
XIN J, ZHOU J, YANG S X, et al. Bridge Structure Deformation Prediction Based on GNSS Data Using Kalman-ARIMA-GARCH Model[J]. Sensors, 2018, 18(1): 298.

[11]
刘晶磊, 张国朋, 张冲冲, 等. 基于误差分级迭代法的基坑变形预测[J]. 科学技术与工程, 2021, 21(14): 5822-5827.

(LIU Jing-lei, ZHANG Guo-peng, ZHANG Chong-chong, et al. Research on Deformation Prediction of Foundation Pit Based on Error Grading Iterative Method[J]. Science Technology and Engineering, 2021, 21(14): 5822-5827. (in Chinese))

[12]
牛景太. 基于奇异谱分析与PSO优化SVM的混凝土坝变形监控模型[J]. 水利水电科技进展, 2020, 40(6): 60-65, 77.

(NIU Jing-tai. Dam Deformation Monitoring Model Based on Singular Spectrum Analysis and SVM Optimized by PSO[J]. Advances in Science and Technology of Water Resources, 2020, 40(6): 60-65, 77. (in Chinese))

[13]
XING Y, YUE J, CHEN C. Interval Estimation of Landslide Displacement Prediction Based on Time Series Decomposition and Long Short-term Memory Network[J]. IEEE Access, 2019, 8: 3187-3196.

[14]
张健飞, 衡琰. 基于VMD-PE-CNN的混凝土坝变形预测模型[J]. 水利水电技术(中英文), 2022, 53(11): 100-109.

(ZHANG Jian-fei, HENG Yan. VMD-PE-CNN-based Deformation Prediction Model of Concrete Dam[J]. Water Resources and Hydropower Engineering, 2022, 53(11): 100-109. (in Chinese))

[15]
TIPPING M E, BISHOP C M. Probabilistic principle Component analysis[J]. Journal of Royal Statistical Society, 1999, 61(3): 611-622.

[16]
NIELSEN F B. Variational Approach to Factor Analysis and Related Models[D]. Denmark: Technical University of Denmark, 2003.

[17]
AKAIKE H. A New Look at the Statistical Model Identification[J]. IEEE Transactions on Automatic Control, 1974, 19(6): 716-723.

[18]
容静, 刘立龙, 康昊华, 等. 基于方差补偿自适应Kalman滤波的ARMA与PSO-SVM模型变形预测[J]. 大地测量与地球动力学, 2018, 38(7): 689-694.

(RONG Jing, LIU Li-long, KANG Hao-hua, et al. The Deformation Prediction of ARMA and PSO-SVM Model Based on Variance Compensation Adaptive Kalman Filter[J]. Journal of Geodesy and Geodynamics, 2018, 38(7): 689-694. (in Chinese))

文章导航

/