水灾害

基于多变量变分模态分解与相关性重构的日径流预测模型

  • 丁杰 , 1, 2 ,
  • 涂鹏飞 , 1, 2 ,
  • 冯谕 1, 2 ,
  • 曾怀恩 1, 2
展开
  • 1 三峡大学 土木与建筑学院,湖北 宜昌 443002
  • 2 三峡大学 湖北省水电工程施工与管理重点实验室,湖北 宜昌 443002
涂鹏飞(1965-),男,湖北宜昌人,教授,硕士,研究方向为水灾害治理与防控。E-mail:

丁 杰(2000-),男,湖北宜昌人,硕士研究生,研究方向为人工智能下的径流预测。E-mail:

Copy editor: 罗玉兰

收稿日期: 2024-05-17

  修回日期: 2024-08-22

  网络出版日期: 2025-01-02

基金资助

国家自然科学基金项目(42074005)

Daily Runoff Prediction Model Based on Multivariate Variational Mode Decomposition and Correlation Reconstruction

  • DING Jie , 1, 2 ,
  • TU Peng-fei , 1, 2 ,
  • FENG Yu 1, 2 ,
  • ZENG Huai-en 1, 2
Expand
  • 1 College of Civil Engineering & Architecture, China Three Gorges University, Yichang 443002, China
  • 2 Hubei Key Laboratory of Construction and Management in Hydropower Engineering,China Three Gorges University, Yichang 443002, China

Received date: 2024-05-17

  Revised date: 2024-08-22

  Online published: 2025-01-02

摘要

准确预测径流是预防洪涝灾害的基础。针对这一问题,提出一种基于多变量变分模态分解与皮尔逊相关性重构的日经流预测组合模型,该模型首先运用多变量变分模态分解(MVMD)方法分解日径流数据,然后,针对分解后的模态分量,运用皮尔逊相关系数法对该分量进行重构分类为波动项和随机项,运用思维进化算法(MEA)优化BP神经网络对波动项进行预测;运用灰狼优化算法(GWO)优化极限学习机算法(ELM)对随机项进行预测。最后,对两个模态分量预测融合得出最终预测结果。以汉江流域中的安康水电站与白河水电站径流数据为例进行分析,结果表明:安康站平均R2为0.87,白河站平均R2为0.93,预测模型预测效果较好、准确性较高,具有预测合理性。研究结果可为预防洪涝灾害和合理调控水资源提供依据。

本文引用格式

丁杰 , 涂鹏飞 , 冯谕 , 曾怀恩 . 基于多变量变分模态分解与相关性重构的日径流预测模型[J]. 长江科学院院报, 2025 , 42(5) : 119 -129 . DOI: 10.11988/ckyyb.20240537

Abstract

[Objective] This study took Hanjiang River Basin as the study area. To better monitor the runoff conditions in Hanjiang River Basin, the daily runoff data collected from Ankang and Baihe hydroelectric power stations were selected for prediction analysis. The original data included daily runoff from January 2005 to December 2012. [Methods] This study first employed Multivariate Variational Mode Decomposition(MVMD) to decompose the original daily runoff data from the two stations, reducing data complexity. Subsequently, the decomposed modes and the historical runoff data from the previous 7 days were reconstructed using the Pearson correlation coefficient method(used to measure inter-variable correlation). The modes with high correlation coefficients were superimposed and defined as fluctuation terms, while those with low correlation coefficients were superimposed and defined as random terms. For the prediction of fluctuation terms, the historical runoff from the previous 7 days was used as input, resulting in seven operating conditions. Then, the Microbial Enhanced Algorithm-Back Propagation(MEA-BP) model was used for multiple predictions, and the average values were taken, and evaluation indicators were employed to assess the seven operating conditions. For the prediction of random terms, the Grey Wolf Optimizer-Extreme Learning Machine(GWO-ELM) was used for multiple predictions, and the average values were taken, and evaluation indicators were also used for assessment. Finally, the predicted results were fused, and evaluation coefficients were derived using evaluation indicators, demonstrating the accuracy and stability of the model. [Results] For Ankang station, IMF1 and IMF5 showed correlation coefficients greater than 0.5 with R1-R7, indicating high correlation. Therefore, IMF1 and IMF5 were reconstructed as fluctuation terms. IMF2, IMF3, IMF4, and IMF6, with correlation coefficients all below 0.5 with R1-R7, were reconstructed as random terms. Similarly, for Baihe station, IMF1 and IMF5 had correlation coefficients exceeding 0.5 with R1-R7 and were reconstructed as fluctuation terms, while IMF2, IMF3, IMF4, and IMF6, with correlation coefficients all below 0.5 with R1-R7, were reconstructed as random terms. For the prediction of fluctuation terms, the seven operating conditions were specifically defined as: R1,R1-R2,R1-R3, R1-R4,R1-R5, R1-R6,and R1-R7. The coefficients of determination(R2) for these seven conditions of fluctuation term prediction at Ankang station were 0.54, 0.73, 0.74, 0.72, 0.81, 0.73, and 0.60, respectively, while those at Baihe station were 0.65, 0.68, 0.72, 0.77, 0.82, 0.74, and 0.77, respectively. The optimal operating condition for both stations was condition 5(R1-R5). For the prediction of random terms, the R2 for random term prediction at Ankang and Baihe stations was 0.80 and 0.74, respectively. Finally, the integrated prediction combining fluctuation and random terms under condition 5 yielded R2 of 0.87 and 0.93 for the overall prediction at Ankang and Baihe stations, respectively, demonstrating excellent model performance. [Conclusions](1) The MVMD decomposition method can control the number of decomposition layers, ensuring complete signal feature extraction without overfitting while improving processing speed.(2) Pearson correlation coefficient method enhances prediction accuracy through decomposed data classification.(3) The MEA-BP can improve signal-to-noise ratio, adapt to complex environments, enhance learning efficiency and generalization ability, and reduce computational complexity.(4) The GWO-ELM algorithm integrates grey wolf optimizer with extreme learning machine, providing a fast and adaptive solution for time-series prediction with reduced overfitting and improved efficiency.(5) The overall combined model can efficiently and stably process large amount of data while ensuring high accuracy.

开放科学(资源服务)标识码(OSID):

0 引言

全球的洪涝灾害是一个复杂的问题,受到多种因素影响,其中包括气候变化、土地利用变化、城市化、河流管理和基础设施建设等[1-2]。在这样的背景下,对水电站进行日径流预测可以帮助预防洪涝灾害。通过准确地预测未来一段时间内的降雨量和径流量,可以及时调整水库的水位,以应对洪水风险。此外,水电站还可以通过控制水库的泄洪量,减缓洪水的流速和峰值,从而减轻洪水对下游地区的影响。
随着技术进步,相较于传统的预测模型(数理统计法以及成因分析法[3-6]),融合人工智能领域中神经网络、机器模型、回归模型、优化算法等方法的径流预测模型具有更好的预测效果[7-12],精度高。郝丽娜等[13]利用小波广义回归神经网络耦合模型预测径流,通过离散小波变换(Discrete Wavelet Transform,DWT)将原始径流进行分解重构,从而提高预测精度。李文武等[14]利用变分模态分解(Variational Mode Decomposition,VMD)和深度门控网络进行组合预测,通过将分解的径流重构到高维特征空间,进行深度学习后与深度门控网络中得到的分量累加进行组合预测,显著降低误差。赵莹玉等[15]结合融合改进灰狼算法(Hybrid Gray Wolf Optimization,HGWO)和优化的支持向量回归(Support Vector Regression,SVR)算法结合进行预测分析,解决了收敛速度慢、易陷入局部极值的缺点。岳兆新等[16]利用改进深度信念网络(Improved Deep Belief Networks,IDBN)模型进行预测分析,提升了预测速度和精度。张璐等[17]利用VMD-PSR(Phase Space Reconstruction)-BNN(Bayesian Neural Network)模型进行预测分析,通过VMD良好的鲁棒性和PSR重构输入到BNN模型中进行预测,具有良好的拟合效果。刀海娅等[18]利用多极小波包变换融合改进浣熊算法进行径流预测,提高了预测精度并降低了模型的复杂程度。刘扬等[19]利用CEEMDAN-QPSO-BLS组合模型进行径流预测,通过粒子群优化(Particle Swarm Optimization,PSO)寻优进并重构,从而提高精确度。胡乐怡等[20]利用LSTM(Long Short-Term Memory)模型对赣江流域径流预测,通过输入前期径流数据并设定不同情景下的记忆时间,找寻最优的记忆时间,从而提高LSTM模型的精度。
以上研究方法表明,通过融合人工智能方法对径流进行预测显著提高了预测精度和稳定性。径流预测的主流方法通常是先分解,再通过重构,最后进行预测。信号分解法如傅里叶变换、小波变换、奇异值分解、经验模态分解、变分模态分解、多变量变分模态分解等方法。傅里叶变换法能够提供信号的频谱信息,将信号从时域转换到频域,有利于频域分析,但是时频分辨率固定,无法适应信号局部特性变化。小波变换能够捕捉信号的局部特征,可以用于非平稳信号的分析,但是小波基的选择对结果影响较大,需要针对性地选择合适的小波基。奇异值分解可以提取出信号的主要成分,对于信号降维和特征提取有较好的效果,但是计算复杂度高,对非线性信号表现不佳。经验模态分解不需要预先确定信号的基函数,具有较好的自适应性,但是结果容易受到模态混叠等问题的影响,需要进行后处理。变分模态分解结果较稳定,对于信号分解和特征提取效果较好,能够控制分解的模态数目,具有一定的灵活性,但是无法处理多个通道的信号。而多变量变分模态分解在分解过程中考虑了多个通道之间的相关性,因此可以更准确地分离出不同通道的模态成分,提高了信号分解的准确性和稳定性。
本文首先使用多变量变分模态分解对数据进行分解处理,控制分解层数,减少过多分解层数对模型的影响。较传统的重构方法,如灰色关联度、相空间重构,参数选择依赖经验,易受主观性和数据质量影响。相比之下,本文采用皮尔逊相关系数法,无需人工设定关键参数,计算效率高,通过计算各模态分量与历史径流量相关性系数,针对性进行重构,高相关性定义为波动项,低相关性定义为随机项。采用MEA(Microbial Enhanced Algorithm)优化BP(Back Propagation)神经网络算法和GWO(Grey Wolf Optimizer)优化ELM(Extreme Learning Machine)算法进行组合预测,两者都结合了生物启发式算法和神经网络的优化方法。MEA-BP算法利用MEA进行全局搜索和BP神经网络进行局部搜索,具有快速收敛、高精度和强鲁棒性等优点,对波动项设置不同情况下的工况进行预测分析,找寻最优工况作为预测结果;而GWO-ELM算法结合了灰狼优化算法和极限学习机,具有强大的全局搜索能力和快速收敛速度,通过调整参数后,利用时间序列对随机项进行预测分析。最后通过融合MEA-BP与GWO-ELM的预测结果得出最终结果,显著提高了预测精度与稳定性。

1 研究方法

1.1 多变量变分模态分解法

MVMD(Multivariate Variational Mode Decomposition)是一种多变量信号分解算法[21-22]。它是基于VMD的方法。 VMD的目标是将一个信号分解成若干个本征模态函数(Intrinsic Mode Functions,IMFs),每个IMF都有一个中心频率。VMD的目标函数定义为每个模态的带宽总和,通过变分方法最小化该目标函数来求得每个模态。而在MVMD中,考虑到多个信号可能存在相关性,MVMD的目标是同时分解多个信号,使得得到的模态之间具有最小的带宽,并保持模态之间的某种关联性。其中有2个重要参数需要设置,A为惩罚因子,取值影响模态分量的带宽,与带宽成反比关系。如果A设置较小,可能会导致模态混叠,从而影响特征的提取;而如果A设置较大,虽然能避免模态混叠,却可能造成局部信息丢失的问题。分解层数K决定了分解后的模态分量数量,选取合适的K值可以减少模型的复杂程度以及提高模型稳定性。
MVMD从包含 C个通道的数据中提取出预设数量的多变量调制振荡 u k (t) 。即
y ( t ) = k = 1 K u k (t)
式中: y (t) 是输入数据;t为时间变量; u k表示有k个限带宽的固有模态函数分量。然后再识别输入数据的多变量振荡模式集,通过最小化这些模式的总带宽,从而实现原始信号的精确恢复,将原始信号定义为
u + k (t) = u k (t) + j H u k (t) = u + 1 (t) u + 2 (t) u + C (t) = A 1 (t) e φ 1 (t) A 2 (t) e φ 2 (t) A C (t) e φ C (t)
式中: u + k (t) 是振荡集合;H是希尔伯特变换; φ 1 (t) 是相位;j是虚数单位。
运用 u + k (t) 的L2范数来演算 u k (t) 的带宽,由此引出MVMD的成本函数P
P = k t [ e j ω k t u + k (t) ] 2 2
式中: t是狄拉克函数; ω k是各个固有模态函数的中心频率。
MVMD识别出跨所有通道共享同一频率成分的多变量振荡。通过对所有通道的单边频谱进行位移,并计算结果矩阵的Frobenius范数,从而估计调制的多变量振荡带宽为
J = k C t [ e - j ω k t u + k , C (t) ] 2 2
式中: u + k , C (t) 是与 k , C系数相应的解析信号。为了应对约束优化问题,成本函数变为
m i n { u k , C } { u k } { k C t [ u + k , C (t) e - j ω k t ] 2 2 }
式(5)受制于式(6)有
k u k , C (t) = y C (t)
对应的拉格朗日函数转变为
L ( { u k , C } , { ω k } , λ C ) = A k C t [ u + k , C (t) e - j ω k t ] 2 2 + C y C (t) - k u k , C (t) 2 2 + C < λ (t) , y C (t) - k u k , C (t) >
式中 λ (t) 是Lagrange 算子。
再通过交替方向乘子法(Alternating Direction Method of Multipliers,ADMM)的方法优化式(7),推算出简化的Lagrange函数表达式,即
λ C n + 1 ω = λ C n ω + τ y C ω - k u C n + 1 ω
式中: λ C n + 1是拉格朗日乘子的频域形式; τ是步长。
对应的迭代过程的约束条件进行了修改,即
k = 1 K c = 1 C u k , C n + 1 - u k , C n 2 2 u k , C n 2 2 < ε
式中 ε 为迭代结束的条件[23]

1.2 MEA-BP预测模型

当输入特征与输出变量的相关性较高时,BP神经网络预测模型可以得到较为精确与稳定的预测结果,因此,本文提出一种MEA-BP神经网络预测模型,原理如下:
BP神经网络构成包含3个主要部分[24-25]:输入层、隐藏层和输出层,如图1所示。数据首先进入输入层,接着通过权重和偏置进行线性变换后,通过激活函数处理,形成隐藏层的输出,即作为下一层的输入。 x 1 x n表示输入数据,WijWjk表示赋予的权值, O 1 O m表示输出数据。在隐藏层和输出层之间,数据同样经过权重和偏置的线性变换以及激活函数处理,最终产生网络的输出。
图1 BP神经网络拓扑结构

Fig.1 Diagram of BP neural network topology

MEA是一种受自然界微生物生态系统启发的优化技术[26],其原理与遗传算法(Genetic Algorithm,GA)、PSO类似,这些算法通常在搜索全局最优解的过程中保持多样性。MEA可以帮助BP神经网络避免陷入局部最优解,提高找到全局最优或更好解的概率,能够根据优化过程中的反馈动态调整神经网络的学习参数。MEA-BP优化神经网络流程如图2所示。
图2 MEA-BP神经网络流程

Fig.2 Flowchart of MEA-BP neural network

1.3 GWO-ELM预测模型

考虑到输入特征与输出变量之间的随机非线性关系,提出一种具有较好的泛化能力、可以很好地解决复杂非线性问题的GWO-ELM预测模型。
灰狼优化(Grey Wolf Optimizer, GWO)算法是一种启发式搜索算法[27-28],由Mirjalili等在2014年提出,其灵感来源于灰狼的社会等级和狩猎行为。这种算法模拟了灰狼在寻找食物、追踪、包围和攻击猎物的自然行为。GWO算法以其简单性、易于实现以及需要调整的参数少等优点,在优化问题中得到了广泛的应用。
灰狼优化算法基于4个等级的灰狼社会分层: α β δ ω。在这个模型中, α代表领导者, β δ在社会等级中排在后,帮助 α做决定,并在必要时指导 ω,而 ω是社会中的追随者。等级关系如图3所示。
图3 灰狼社会支配等级关系

Fig.3 Social dominant hierarchy of grey wolves

在算法执行过程中,群体首先确定猎物(最优解)的位置,然后进行包围。这一过程通过模拟灰狼的包围猎物策略来进行优化搜索。通过式(10)—式(11)来更新其位置,以包围猎物,即
D = C · X p ( μ ) - X ( μ )   ,
X ( μ + 1 ) = X p ( μ ) - A · D
式中: D 是与猎物之间的距离; X p 是猎物位置; X 是灰狼的位置; A C 是系数向量; μ表示当前的迭代次数。系数 A C 通过式(12)、式(13)计算,即
A = 2 a · r 1 - a   ,
C = 2 · r 2
式中: a 是一个线性递减的系数,从2递减到0; r 1 r 2 0,1之间的随机向量。 α β δ(最好的3个解)被认为是领导狼,其余的灰狼 ω根据这3个领导狼的位置更新自己的位置,以此模拟狩猎过程。通过这种方式,GWO算法能够在解空间中进行高效的全局搜索,同时利用社会等级结构来细化搜索方向,从而提高寻找最优解的效率。此外,通过动态调整系数,算法能够在探索(全局搜索)和开发(局部搜索)之间平衡,以适应不同阶段的搜索需求。
极限学习机(Extreme Learning Machine, ELM)是一种单层前馈神经网络(SLFNs)的学习算法[29-30],ELM的核心思想是随机初始化输入层到隐藏层的权重和偏置,然后计算隐藏层到输出层的权重,简化了学习过程,避免了传统神经网络中常见的局部最小值问题,同时也减少了学习过程中的人为干预。
给定一个训练集 { ( x i , t i ) } ( i = 1,2 , 3 , , N ),其中 x i是输入样本, t i是相应的目标输出, N是样本数量。ELM的目标是最小化输出误差,即找到一个函数 f (x) ,使得 f ( x i ) - t i 尽可能小。对于含有 L个隐藏节点的单层前馈神经网络,其数学模型可以表示为
V M = T
式中:V是隐藏层的输出矩阵;M是隐藏层到输出层的权重矩阵;T是训练样本的目标输出矩阵。隐藏层的输出V可以通过以下方式计算,即
V i j = g ( ω i · x j + b i )
式中: g ( · )是激活函数;ωi是输入层到隐藏层的权重向量; b i是偏置项; x i是第 j个输入样本。ELM的关键步骤是随机初始化 ω i b i,然后通过求解以下优化问题来计算输出权重M,即
m i n M M 2 s . t . V M = T
这个优化问题的解可以通过最小二乘法(Least Squares)得到,即
M = V + T
式中V+V的Moore-Penrose广义逆矩阵。
GWO-ELM结合了灰狼优化算法的全局搜索能力和极限学习机的快速学习特性,提供了一种高效且具有强泛化能力的模型优化方法。这种方法自动化参数优化过程,减少了人工调参的需求,使模型能够更好地适应各种复杂的非线性问题。通过提升训练效率、增强模型的泛化能力并确保稳定可靠的性能,GWO-ELM显著优化了模型在多领域应用的潜力和实用性,流程如图4所示。
图4 GWO-ELM融合神经网络流程

Fig.4 Flowchart of GWO-ELM integrated neural network

2 实例分析

2.1 研究区域与数据

汉江是长江中游最大支流,位于106°E—114°E,30°N—34°N之间。起源于陕西宁强县,于武汉汇入长江,全长1 577 km,流域面积约15.9万km2,占长江流域的9.2%。汉江流经亚热带季风区,气候温和湿润,年均气温约16 ℃,年均降水量887 mm,表现出明显的季节性降水。流域海拔由西北向东南递减,该流域是多个重要水利工程的水源地,如南水北调中线工程。汉江流域洪涝灾害频发,致使多地受灾,造成巨大损失,所以本文选取灾害频发的安康段与白河段地区进行研究,通过对安康、白河水电站的每日径流量进行预测,有助于预防洪涝灾害。
安康水电站和白河水电站位于汉江流域中部,如图5所示。通过预测2站的日径流量,可以把控汉江流域径流的整体波动情况,因此,选取安康站和白河站2005—2012年日径流数据进行分析,数据缺失部分运用线性插值法补充。划分训练集为80%,预测集为20%,数据来源于长江水文年鉴。安康水电站和白河水电站日径流数据如图6所示。
图5 汉江流域及水电站概况

Fig.5 Overview of Hanjiang River Basin and hydroelectric power stations

图6 2005年1月至2012年12月日径流监测曲线

Fig.6 Daily runoff monitoring curves from Jan. 2005 to Dec. 2012

2.2 预测模型总体流程

本文通过多变量变分模态与相关性重构组合模型进行预测,总体流程如图7所示。
图7 径流预测模型总体流程

注:R1R7为预测前1~7 d的径流量。

Fig.7 Overall flowchart of runoff prediction model

2.3 分解与重构

2.3.1 数据分解

首先将安康水电站和白河水电站日径流数据输入MVMD分解模块进行分解,参考文献[14],将MVMD的参数Α设置为200, K设置为6层,收敛容差值设置为1×10-7,安康水电站和白河水电站分解数据如图8所示。
图8 安康水电站和白河水电站分解数据

Fig.8 Decomposed data at Ankang and Baihe hydroelectric power stations

2.3.2 相关性重构

Pearson相关系数,也称作Pearson积矩相关系数[31],是用于度量2个变量之间相关程度的统计量。选用Pearson相关系数的绝对值作为相关性的评价标准,数学表达式为
r = a b s i = 1 n ( X i - X ¯ ) ( Y i - Y ¯ ) i = 1 n ( X i - X ¯ ) 2 i = 1 n ( Y i - Y ¯ ) 2
式中: r是Pearson相关系数; X i Y i分别是变量 X Y的观察值; X ¯ Y ¯分别是 X Y的平均值; n是观察值的数量。
日径流量具有波动性与随机性,因此,以前7 d的历史径流作为基准,评价历史径流与分解的IMF之间的相关性。因此,运用式(18)对分解后的曲线进行Pearson相关性计算,得到安康站与白河站径流数据的相关性热图如图9所示。
图9 安康站和白河站相关性热图

Fig.9 Correlation heatmap of Ankang station and Baihe station

据相关性热图,将与历史径流高相关性的IMF1与IMF5曲线叠加重构为波动项,将相关性程度较低的IMF2、IMF3、IMF4、IMF6叠加重构为随机项,重构后的波动项与随机项曲线如图10所示。
图10 安康站和白河站分解重构对比

Fig.10 Comparison of decomposition and reconstruction at Ankang station and Baihe station

2.4 预测过程与结果

2.4.1 波动项预测

运用MEA-BP模型对波动项进行预测,依照参考文献[26]设置模型参数:种群大小为200,优胜子种群个数为5,临时子种群个数为5,迭代次数为2 500。
考虑到特征输入会影响模型的预测效果,因此,为找寻最优特征输入组合,本文将2站前7 d历史径流特征设置为7种工况,如表1所示。前1 d的径流 R 1 单独为工况1,依此类推,前7 d的径流 R 1 R 7集合为工况7,将7种工况分别输入到MEA-BP模型中,得到7种工况的预测结果如图11图12所示。
表1 7种工况配置情况

Table 1 Configuration of seven operating conditions

工况编号 径流数据 工况编号 径流数据
1 R 1 5 R 1 R 2 R 3 R 4 R 5
2 R 1 R 2 6 R 1 R 2 R 3 R 4 R 5 R 6
3 R 1 R 2 R 3 7 R 1 R 2 R 3 R 4 R 5 R 6 R 7
4 R 1 R 2 R 3 R 4
图11 安康站7种工况预测

Fig.11 Prediction for seven operating conditions at Ankang station

图12 白河站7种工况预测

Fig.12 Prediction for seven operating conditions at Baihe station

以均方误差(MSE)、均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)、决定系数(R2)来评价7种工况下预测模型的性能,各参数计算式为:
M S E = 1 n i = 1 n ( y i - y i ) 2   ,
R M S E = M S E = 1 n i = 1 n ( y i - y i ) 2   ,
M A E = 1 n i = 1 n y i - y i   ,
M A P E = 1 n i = 1 n y i - y i y i   ,
R 2 = 1 - i = 1 n ( y i - y i ) 2 i = 1 n ( y i - y ¯ ) 2
式中: y i是第 i个观察到的实际值; y i是第 i个预测值; y ¯是实际值的平均值。
以多次计算的平均值作为最终的模型性能指标,如表2所示。
表2 安康站和白河站波动项预测性能指标

Table 2 Performance indicators for fluctuation term prediction at Ankang station and Baihe station

站点 工况 MAPE RMSE MAE R2
1 3.01 702.42 403.64 0.54
2 0.41 539.05 215.87 0.73
3 0.43 537.09 212.98 0.74
安康站 4 0.49 556.53 220.19 0.72
5 0.74 457.63 200.11 0.81
6 0.37 543.57 201.73 0.73
7 0.43 492.79 139.35 0.60
1 1.10 859.56 579.52 0.65
2 0.25 830.32 294.43 0.68
3 0.24 780.33 291.34 0.72
白河站 4 0.25 706.42 279.45 0.77
5 0.32 621.99 265.88 0.82
6 0.26 744.98 295.49 0.74
7 0.23 767.71 278.89 0.77
表2可以看出,工况5即以前5 d的径流 R 1 R 5作为特征输入到MEA-BP模型中的预测效果最好。

2.4.2 随机项预测

运用GWO-ELM模型对随机项进行预测,依照参考文献[15]设置模型参数:种群大小为20,迭代次数为150,隐藏神经元数量为60。
随机项受历史数据与时间的影响呈现出随机性,因此,以随机项预测值的前7个数据与时间作为特征输入到GWO-ELM模型中进行预测,得到预测结果如图13所示。
图13 安康站和白河站时间序列预测

Fig.13 Time-series prediction for Ankang station and Baihe station

为了定量描述预测模型的性能,以均方误差(MSE)、均方根误差(RMSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)、决定系数R2来评价模型性能。以多次计算的平均值作为最终的模型性能指标,如表3所示。
表3 安康站、白河站随机项预测性能指标

Table 3 Performance indicators for random term prediction at Ankang and Baihe stations

站点 MAPE RMSE MAE R 2
安康 3.22 204.26 96.54 0.80
白河 6.57 375.96 207.41 0.74
表3可知,GWO-ELM模型对于随机项的预测效果较好。

2.4.3 总体预测

将波动项预测结果与随机项预测结果叠加得到总体预测结果,如图14所示。
图14 安康站和白河站总体预测

Fig.14 Overall prediction at Ankang station and Baihe station

据式(19)—式(23)、图14可知,评价总体预测模型的性能,得到计算结果如表4所示。
表4 安康站、白河站总体预测性能指标

Table 4 Overall prediction performance indicators for Ankang and Baihe stations

站点 MAPE RMSE MAE R2
安康 1.23 480.36 235.61 0.87
白河 0.36 395.51 232.43 0.93
表4可知,基于多变量变分模态分解与相关性重构的日径流预测模型的预测效果较好,可为汉江流域的流量控制提供预测依据。

3 结论

本文提出了MVMD-MEA-BP-GWO-ELM组合模型对安康站、白河站进行日径流量预测,体现了各个模型的优越性以及组合的有效性,可以得出以下结论:
(1)通过MVMD分解法控制分解层数,以便最有效地捕捉信号的本质特征,确保分解结果不缺失,也不会过度拟合,同时保证了更快的处理速度。
(2)利用Pearson相关性系数法提前对IMF分解数据进行分类处理,通过计算出与历史径流量的相关性,与历史径流量相关性高的重构为波动项,与历史径流量相关性低的随机项(随机项与历史时间序列相关),并进行专项预测处理,提高了后续预测工作的准确性和有效性。
(3)MEA-BP模型针对波动项进行预测,相比于单BP模型预测,能够提高信噪比,并适应多变的环境,在复杂环境中更加稳健和有效,提高了学习效率和泛化能力,同时还能降低计算复杂度。
(4)GWO-ELM模型结合了灰狼优化算法的全局搜索能力和极限学习机的高效训练特性,为时间序列预测提供了一种快速且适应性强的解决方案。能够在不同的初始化条件下找到相似的最优解,适应多种时间序列预测任务,减少过拟合的风险,并利用并行处理能力提高效率。
(5)本文组合预测模型优点在于本文选取的时间序列模型针对性较强,针对径流量的预测具有良好的效果,能对大量数据进行高效、稳定的预测,并确保其精确度;缺点在于需要在分解过程以及特征选取上进行精细化调整,前期细微的变化对后期的预测影响较大,确保精确度的同时复杂程度较高。
[1]
钟鸣, 张鸿瑞, 王一帆, 等. 基于物理机制耦合深度学习方法的径流预测研究[J]. 云南电力技术, 2023, 51(3): 2-6, 12.

(ZHONG Ming, ZHANG Hong-rui, WANG Yi-fan, et al. Research on Runoff Prediction Based on Physical Mechanism Coupling Deep Learning Method[J]. Yunnan Electric Power, 2023, 51(3): 2-6, 12.) (in Chinese)

[2]
张建云, 王国庆, 金君良, 等. 1956—2018年中国江河径流演变及其变化特征[J]. 水科学进展, 2020, 31(2): 153-161.

(ZHANG Jian-yun, WANG Guo-qing, JIN Jun-liang, et al. Evolution and Variation Characteristics of the Recorded Runoff for the Major Rivers in China during 1956—2018[J]. Advances in Water Science, 2020, 31(2): 153-161.) (in Chinese)

[3]
王富强, 霍风霖. 中长期水文预报方法研究综述[J]. 人民黄河, 2010, 32(3): 25-28.

(WANG Fu-qiang, HUO Feng-lin. Summary of Research on Medium and Long-term Hydrological Forecasting Methods[J]. Yellow River, 2010, 32(3): 25-28.) (in Chinese)

[4]
章淹. 致洪暴雨中期预报进展[J]. 水科学进展, 1995, 6(2): 162-168.

(ZHANG Yan. Progress in Medium-term Forecast of Flood-causing Rainstorm[J]. Advances in Water Science, 1995, 6(2): 162-168.) (in Chinese)

[5]
张丽霞, 梁新平. 基于单相关系数法的中长期水文预报研究[J]. 水资源与水工程学报, 2008, 19(3):49-51.

(ZHANG Li-xia, LIANG Xin-ping. Study on Mid-to-long-term Hydrological Forecasting Based on Single Correlation Coefficient[J]. Journal of Water Resources and Water Engineering, 2008, 19(3): 49-51.) (in Chinese)

[6]
杨旭, 栾继虹, 冯国章. 中长期水文预报研究评述与展望[J]. 西北农业大学学报, 2000, 28(6):203-207.

(YANG Xu, LUAN Ji-hong, FENG Guo-zhang. Discussion and Prospect on Mid-to-long-term Hydrological Forecasting[J]. Journal of Northwest A & F University(Natural Science Edition), 2000, 28(6):203-207.) (in Chinese)

[7]
GHOSE D, DAS U, ROY P. Modeling Response of Runoff and Evapotranspiration for Predicting Water Table Depth in Arid Region Using Dynamic Recurrent Neural Network[J]. Groundwater for Sustainable Development, 2018, 6: 263-269.

[8]
GAO S, ZHANG S, HUANG Y, et al. A Hydrological Process-based Neural Network Model for Hourly Runoff Forecasting[J]. Environmental Modelling & Software, 2024, 176: 106029.

[9]
ZOUNEMAT-KERMANI M, KISI O, RAJAEE T. Performance of Radial Basis and LM-feed Forward Artificial Neural Networks for Predicting Daily Watershed Runoff[J]. Applied Soft Computing, 2013, 13(12):4633-4644.

[10]
XU D M, HU X X, WANG W C, et al. A New Hybrid Model for Monthly Runoff Prediction Using ELMAN Neural Network Based on Decomposition-integration Structure with Local Error Correction Method[J]. Expert Systems with Applications, 2024, 238: 121719.

[11]
ZHANG J, YAN H. A Long Short-term Components Neural Network Model with Data Augmentation for Daily Runoff Forecasting[J]. Journal of Hydrology, 2023, 617: 128853.

[12]
SONG C M. Data Construction Methodology for Convolution Neural Network Based Daily Runoff Prediction and Assessment of Its Applicability[J]. Journal of Hydrology, 2022, 605: 127324.

[13]
郝丽娜, 粟晓玲, 黄巧玲. 基于小波广义回归神经网络耦合模型的月径流预测[J]. 水力发电学报, 2016, 35(5): 47-54.

(HAO Li-na, SU Xiao-ling, HUANG Qiao-ling. Monthly Runoff Prediction Using Wavelet Transform and Generalized Regression Neural Network Model[J]. Journal of Hydroelectric Engineering, 2016, 35(5): 47-54.) (in Chinese)

[14]
李文武, 石强, 王凯, 等. 基于变分模态分解和深度门控网络的径流预测[J]. 水力发电学报, 2020, 39(3):34-44.

(LI Wen-wu, SHI Qiang, WANG Kai, et al. Runoff Prediction Based on Variational Mode Decomposition and Deep Gated Network[J]. Journal of Hydroelectric Engineering, 2020, 39(3): 34-44.) (in Chinese)

[15]
赵莹玉, 彭慧春, 李继清. 融合改进灰狼算法的机器学习月径流预测方法[J]. 水力发电学报, 2023, 42(9):34-45.

(ZHAO Ying-yu, PENG Hui-chun, LI Ji-qing. Machine Learning Method for Monthly Runoff Prediction Based on Improved Grey Wolf Algorithm[J]. Journal of Hydroelectric Engineering, 2023, 42(9):34-45.) (in Chinese)

[16]
岳兆新, 艾萍, 熊传圣, 等. 基于改进深度信念网络模型的中长期径流预测[J]. 水力发电学报, 2020, 39(10):33-46.

(YUE Zhao-xin, AI Ping, XIONG Chuan-sheng, et al. Mid-and Long-term Runoff Forecasting Based on Improved Deep Belief Networks Model[J]. Journal of Hydroelectric Engineering, 2020, 39(10):33-46.) (in Chinese)

[17]
张璐, 刘真, 李磊, 等. 基于VMD-PSR-BNN模型的月径流预测方法研究[J]. 中国农村水利水电, 2023(4):105-113.

DOI

(ZHANG Lu, LIU Zhen, LI Lei, et al. Research on the Monthly Runoff Prediction Method Based on VMD-PSR-BNN Model[J]. China Rural Water and Hydropower, 2023(4): 105-113.) (in Chinese)

DOI

[18]
刀海娅, 程刚, 崔东文. 多极小波包变换与改进浣熊算法优化的混合核极限学习机径流预测[J]. 中国农村水利水电, 2024(6): 1-9, 20.

DOI

(DAO Hai-ya, CHENG Gang, CUI Dong-wen. Multipole Wavelet Packet Transform and Improved Raccoon Algorithm Optimized Hybrid Kernel LimitLearning Machine for Runoff Prediction[J]. China Rural Water and Hydropower, 2024(6): 1-9, 20.) (in Chinese)

DOI

[19]
刘扬, 赵丽. 基于CEEMDAN-QPSO-BLS模型的径流预测研究[J]. 中国农村水利水电, 2024(1):101-108.

DOI

(LIU Yang, ZHAO Li. Runoff Prediction and Analysis Based on CEEMDAN-QPSO-BLS Method[J]. China Rural Water and Hydropower, 2024(1):101-108.) (in Chinese)

DOI

[20]
胡乐怡, 蒋晓蕾, 周嘉慧, 等. 考虑记忆时间的LSTM模型在赣江流域径流预报中的应用[J]. 湖泊科学, 2024, 36(4):1241-1252.

(HU Le-yi, JIANG Xiao-lei, ZHOU Jia-hui, et al. Application of LSTM Considering Time Steps in Runoff Prediction of Ganjiang River Basin[J]. Lake Science, 2024, 36(4):1241-1251.) (in Chinese)

[21]
李广, 郑豪豪, 蔡红柱, 等. 基于深度残差网络与MVMD的多通道地磁信号处理[J]. 地球物理学报, 2023, 66(8):3540-3556.

(LI Guang, ZHENG Hao-hao, CAI Hong-zhu, et al. Multi-channel Geomagnetic Signal Processing Based on Deep Residual Network and MVMD[J]. Chinese Journal of Geophysics, 2023, 66(8): 3540-3556.) (in Chinese)

[22]
LUO S, WEI B, CHEN L. Multi-point Deformation Monitoring Model of Concrete Arch Dam Based on MVMD and 3D-CNN[J]. Applied Mathematical Modelling, 2024, 125: 812-826.

[23]
王仪, 许枫, 杨娟. 低信噪比下基于多元变分模态分解的水下蛙人特征提取[J]. 声学学报, 2024, 49(2): 318-326.

(WANG Yi, XU Feng, YANG Juan. Acoustic Feature Extraction of Divers Based on Multivariate Variational Mode Decomposition with Low Signal-to-noise Ratio[J]. Acta Acustica, 2024, 49(2): 318-326.) (in Chinese)

[24]
赵鹏, 姜彤, 苏布达, 等. 基于SSA-BP神经网络模型的全球入海径流量未来变化趋势[J]. 气候变化研究进展, 2024, 20(2): 182-192.

(ZHAO Peng, JIANG Tong, SU Bu-da, et al. Research on the Future Change Trend of Global Runoff into the Sea Based on SSA-BP Neural Network Model[J]. Climate Change Research, 2024, 20(2): 182-192.) (in Chinese)

[25]
温会. BP神经网络在柏叶口水库中长期径流预报中的应用[J]. 内蒙古水利, 2022(9):9-11.

(WEN Hui. Application of BP Neural Network in Medium- and Long-term Runoff Prediction of Baiyekou Reservoir[J]. Inner Mongolia Water Resources, 2022(9):9-11.) (in Chinese)

[26]
高兴培. 基于结构熵权法和MEA-BP神经网络的MOOC学习效果评价[J]. 科技风, 2023(28): 16-18.

(GAO Xing-pei. Evaluation of MOOC Learning Effect Based on Structure Entropy Weight Method and MEA-BP Neural Network[J]. Technology Wind, 2023(28): 16-18.) (in Chinese)

[27]
SUBUDHI U, DASH S. Detection and Classification of Power Quality Disturbances Using GWO ELM[J]. Journal of Industrial Information Integration, 2021, 22: 100204.

[28]
YANG H, ZHANG Z, LIU X, et al. Monthly-scale Hydro-climatic Forecasting and Climate Change Impact Evaluation Based on a Novel DCNN-transformer Network[J]. Environmental Research, 2023,236:116821.

[29]
李菊, 崔东文. 基于数据分解与斑马算法优化的混合核极限学习机月径流预测[J]. 长江科学院院报, 2024, 41(6):42-50.

DOI

(LI Ju, CUI Dong-wen. Monthly Runoff Prediction of Hybrid Kernel Extreme Learning Machine Based on Data Decomposition and Zebra Algorithm Optimization[J]. China Industrial Economics, 2024, 41(6):42-50.) (in Chinese)

[30]
许建伟, 崔东文. WPT-HPO-ELM径流多步预报模型研究[J]. 水资源与水工程学报, 2022, 33(6): 69-76.

(XU Jian-wei, CUI Dong-wen. WPT-HPO-ELM Multi-step Runoff Forecast Model[J]. Journal of Water Resources and Water Engineering, 2022, 33(6): 69-76.) (in Chinese)

[31]
黄康杰, 熊斌, 崔刚, 等. 基于Pearson相关性分析的双V型永磁电机失磁故障动态识别方法研究[J]. 电工技术学报, 2024, 39(22):7111-7125.

(HUANG Kang-jie, XIONG Bin, CUI Gang, et al. Research on Dynamic Identification Method of Loss-of-excitation Fault of Double V Permanent Magnet Motor Based on Pearson Correlation Analysis[J]. China Industrial Economics, 2024, 39(22):7111-7125.) (in Chinese)

文章导航

/