Water Environment And Water Ecology

Prediction of Wastewater Effluent Water Quality Based on Variational Mode Decomposition and Deep Learning Algorithm

  • MEI Dan , 1 ,
  • ZHANG Heng , 2, 3
Expand
  • 1 Wuhan Sanzhen Industry Holding Co., Ltd., Wuhan 430000, China
  • 2 School of Civil and Hydraulic Engineering, Huazhong University of Science & Technology, Wuhan 430000, China
  • 3 National Center of Technology Innovation for Digital Construction, Wuhan 430000, China

Received date: 2024-07-08

  Revised date: 2024-09-18

  Online published: 2025-01-02

Abstract

[Objective] This study aims to propose a novel method for predicting effluent water quality in wastewater treatment plants, in order to enhance prediction accuracy and address the inadequate generalizability of existing models, thereby providing robust support for the operational optimization of wastewater treatment plants. [Methods] The proposed prediction framework primarily includes the following steps: First, the water quality sequence was decomposed into multiple subsequences with different characteristics using the variational mode decomposition (VMD) method. Subsequently, a comprehensive evaluation indicator (CEI) was introduced, based on which the deep learning algorithm with optimal prediction performance was selected for each decomposed subsequence. Four deep learning algorithms were involved in this study. Finally, the predicted values from each sub-model were aggregated to obtain the final effluent quality prediction. Taking the effluent chemical oxygen demand (COD) concentration of a wastewater treatment plant in Wuhan, Hubei Province as the research object, the proposed prediction framework was validated through a case study. The performance of the proposed framework was evaluated by comparing the prediction performance with that of single models. [Results] The effluent COD concentration data from a wastewater treatment plant in Wuhan were used for validation. The results showed that by decomposing the COD time series into different intrinsic mode functions (IMFs) using VMD, the complexity of the COD time series was effectively reduced. This provided simplified components for subsequent prediction, enabling the prediction model to better capture underlying patterns in the data and consequently improve prediction performance. Meanwhile, by introducing the CEI, four key evaluation indicators—mean absolute error (MAE), root mean square error (RMSE), standard deviation (STD), and mean absolute percentage error (MAPE)—were successfully integrated. This allowed for a comprehensive consideration of multi-dimensional error conditions when selecting the optimal prediction algorithm for each IMF subsequence, ensuring the comprehensiveness and accuracy of the selected algorithm. Finally, predictions were made for each different IMF based on the selected algorithm with optimal prediction performance. The results showed that this method effectively improved the overall model’s prediction accuracy, with the RMSE reaching 0.485. This confirmed that the proposed prediction framework achieved significant improvement in prediction performance compared to single models, providing strong support for accurate effluent water quality prediction in wastewater treatment plants. [Conclusions] The proposed water quality prediction framework based on VMD and multiple deep learning algorithms achieves high-precision prediction of effluent COD concentration in wastewater treatment plants by reasonably decomposing the water quality sequence and adaptively selecting prediction algorithms. The framework overcomes the limitations of existing single prediction models in handling complex nonlinear relationships, providing more accurate water quality predictions to support energy-saving and consumption-reduction decision-making in wastewater treatment plants. With significant practical value, it can be further extended in the future to predict other water quality indicators and be applied to wastewater treatment plants of different scales and types, thereby promoting intelligent operation and management in the wastewater treatment industry.

Cite this article

MEI Dan , ZHANG Heng . Prediction of Wastewater Effluent Water Quality Based on Variational Mode Decomposition and Deep Learning Algorithm[J]. Journal of Changjiang River Scientific Research Institute, 2025 , 42(9) : 67 -74 . DOI: 10.11988/ckyyb.20240721

开放科学(资源服务)标识码(OSID):

0 引言

近年来,随着我国工业化和城市化的迅速发展,城市废水排放量逐年增加[1]。为了最大限度降低废水对环境的影响,必须在废水排放前对其严格处理,因此提升城市污水处理厂的污水处理能力显得尤为迫切。
城市污水处理厂的管理人员通过提高曝气量来确保出水水质达标,但这一措施显著增加了能源消耗。据2021年统计数据,我国污水处理厂的平均能耗为0.29 kW·h/m3,而鼓风曝气这一环节能达到总能耗的50%以上,是全厂最大的耗能处理单元。为准确预测出水浓度,可根据预测值提前调整污水处理工艺的参数,优化各个处理单元的资源配置,以降低能耗和运行成本。此外,预测出水浓度还可以为污水处理过程中的突发情况提供预警,使管理人员能够提前做好应对措施。
近年来,污水处理厂出水水质预测领域涌现出多种预测模型,主要可分为机理模型和数据驱动模型两大类。其中,机理模型以BSM1(Benchmark Simulation Model No.1)和BSM2(Benchmark Simulation Model No.2)为代表,通过数学方程和物理化学原理模拟复杂的污水处理过程[2]。虽然这些模型能够提供较好的预测结果,但其应用存在明显局限:首先,模型操作需要使用者具备专业的污水处理知识和建模经验[3];其次,由于采用标准化的算法框架[4],模型难以充分反映不同污水处理厂的工艺特点和运行条件,导致其在实际应用中的适应性和通用性不足。数据驱动模型可分为传统的数据驱动模型和深度学习模型两大类[5]。传统的数据驱动方法广泛应用于污水处理中,该模型开发了基于极限梯度提升(XGBoost)的软传感器,可用于预测流入物和流出物BOD5[6]。然而,污水处理过程漫长且复杂,不同时期的各种外生时间序列发生着变化,这些由空间和时间关系组成的动态相关性是传统数据驱动模型难以克服的难题[7]
为了捕捉到这些复杂的非线性关系,深度学习方法和信号分解方法已被广泛应用于预测回归任务[8-11]。例如:Aragao等[12]建立了一种基于循环神经网络(Recurrent Neural Network, RNN)和长短期记忆网络(Long Short-Term Memory, LSTM)的深度学习模型预测2019巴西冠状病毒疾病数据;Liu等[13]建立了一种基于LSTM、卷积神经网络(Convolutional Neural Networks,CNN)、时间卷积网络(Temporal Convolutional Network,TCN)等的深度学习算法,实现了污水处理厂的多变量水质时间序列预测;Masmoudi等[14]建立了一种基于多层感知器(Multilayer Perceptron,MLP)和径向基(Radial Basis Function,RBF)算法的深度学习模型,预测了吸附剂的比表面积及其CO2吸附能力。这些研究融合了不同深度学习算法,虽然在预测性能上有了较大的提升,但仍未降低原始数据复杂度,后期计算量十分庞大;刘亚辉等[15]建立了一种基于聚类经验模态分解(Cluster Empirical Mode Decomposition,CEMD)、CNN、LSTM的短期电力负荷预测方法,尽管经验模态分解(Empirical Mode Decomposition,EMD)能够有效降低模型复杂度,但忽略了EMD模态混叠问题;黄睿等[16]建立了一种基于变分模态分解(Variational Mode Decomposition,VMD)、CNN、LSTM的短期电力负荷预测方法,但核心参数 α , k为手动设置,并未使用寻优算法找到最优值。
由于污水处理厂出水水质序列具有复杂的非线性和随机波动特性,捕捉其原始数据特征信息有一定难度,而VMD在分解非线性时间序列的应用中有着较优表现。VMD不具备自适应性,因此本文引入灰狼优化算法[17]对其进行寻优。对于分解后的子序列,也没有一个算法能同时在预测所有子序列上有最好的预测性能。
综上,本文使用经灰狼优化算法优化的VMD技术,分解污水厂出水水质序列,并为每个分解得到的子序列寻找到最合适的预测模型,最后将这些子序列预测值叠加,即可得到最终预测值。

1 VMD和深度学习算法介绍

1.1 VMD

VMD是一种自适应且完全非递归的信号分解方法。该方法通过迭代自适应匹配每个被分解出来的模态分量的频率中心及带宽,这些模态分量可以用来共同描述原始信号中的不同频率成分。其过程如下:
(1)基于Hilbert变换、Wiener滤波与外差解调,寻求原始信号自适应地分解出 k个不同中心频率的模态分量μk t,其表达式为
μ k t = A k t c o s φ k t  
式中Ak(t)、φk(t)分别为各模态分量的瞬时幅值、瞬时频率。
(2)为估算出各模态分量所对应的带宽,构造一个约束变分问题,约束条件为各模态分量带宽之和最小,且所有分量之和等于原输入信号,如式(2)所示。
m i n { μ k , ω k } k = 1 K t δ ( t ) + j π t μ k ( t ) e - j ω k ( t ) 2 2 , s . t . k = 1 K μ k ( t ) = x ( t )    
式中:μk(t)为各模态分量;ωk(t)为各模态分量的中心频率;x(t)为输入信号;δ(t)为Dirac分布;j为虚数单位;∂t为梯度运算。
(3)为了解决式(2)的约束变分问题,引入惩罚因子 α和Lagrange算子λ(t),将式(2)变成非约束变分问题,得到扩展的Lagrange表达式如式(3)所示。
$\begin{array}{c} L\left(\left\{\mu_{k}\right\},\left\{\omega_{k}\right\}, \lambda\right)= \\ \alpha \sum_{k=1}^{K}\left\|\partial_{t}\left[\left(\delta(t)+\frac{\mathrm{j}}{\pi t}\right) \mu_{k}(t)\right] \mathrm{e}^{-\mathrm{j} \omega_{k}(t)}\right\|_{2}^{2}+ \\ \left\|f(t)-\sum_{k=1}^{K} \mu_{k}(t)\right\|_{2}^{2}+<\lambda(t), f(t)-\sum_{k=1}^{K} \mu_{k}(t)>。 \end{array} $
采用乘子交替方向法(Alternating Direction Method of Multipliers,ADMN)迭代多个子优化问题,交替更新 μ k n + 1 ω k n + 1 λ n +,即可求得上述问题的最优解。

1.2 改进VMD

在VMD过程中,将约束变分问题转化为非约束变分问题时所引入的惩罚因子 α,对所分解出来的固有模态函数(Intrinsic Mode Function,IMF)带宽影响较大,一般来说 α越小,带宽越大,这显然不利于分解出有明显差别的中心频率的IMF。而IMF的个数k也很重要,若k取值过小,分解效果不好;若k取值过大,则可能会出现过分解问题。因此,[α,k]的取值对VMD的分解效果影响很大。
为寻找到适应于本时间序列的最优[α,k],本文采用灰狼优化算法(Grey Wolf Optimizer,GWO)对其进行寻优,优化目标为分形盒维数最小,边界条件为 α 0,2   000 , k 3,8

1.3 深度学习算法

1.3.1 GRU

GRU是一种特殊的RNN,其门控机制和递归结构在处理序列数据时具有更强的特征提取能力。GRU网络简化了LSTM的结构,将LSTM中的3个门组合成2个门,即更新门和复位门。其中,单元状态和输出被组合成一个状态,如图1所示。 σ为输出在0~1之间的Sigmoid激活函数;ht-1为上一时刻的输出状态;ht为当前时刻的输出值。
图1 GRU神经网络结构

Fig.1 Structure of GRU neural network

GRU能捕捉不同时间尺度上的依赖关系,充分利用时间序列数据的内在特征,解决RNN中的梯度爆炸问题,GRU单元格的定义如式(4)—式(7)所示。
z t = σ W z h t - 1 , x t   ,
r t = σ W r h t - 1 , x t   ,
h t ~ = t a n h W h ~ r t h t - 1 , x t   ,
h t = 1 - z t h t - 1 + z t h t ~  
式中:zt为更新门,指定在前一个状态中存储的信息在下一个状态中保存数量;rt为复位门,指定如何将前一个状态信息与新的输入信息结合;[ ]表示2个向量是相连的;xt为输入; h t ~为当前时刻形成的隐藏状态;􀱋为矩阵乘法;WrWz W h ~分别为复位门、更新门和候选输出的权重。

1.3.2 LSTM

LSTM网络是由Sepp Hochreiter和Jürgen Schmidhuber提出的递归神经网络的一种改进形式[18]。“Long-Short Term Memory”的名称表明它可以灵活地桥接相应任务的长时间滞后或短时间滞后。与传统的RNN相比,LSTM具有以下2个优点:①LSTM可以解决传统RNN中的梯度消失和梯度爆炸问题;②LSTM的内部结构比传统的RNN更能处理长序列。
LSTM的结构由遗忘门(FT)、输入门(IT)和输出门(OT) 3个门和存储单元组成。通过对这些门的操作,信息可以存储在单元中,写入单元中,或从单元中读取单元中。LSTM非常适合于处理和预测时滞未知的时间序列。用于处理序列的LSTM的详细结构如图2所示,单元格的定义如式(8)—式(13)所示。
f t = σ W f h t - 1 , x t + b f   ,
u t = t a n h W c h t - 1 , x t + b c   ,
i t = σ W i h t - 1 , x t + b i   ,
C t = f t C t - 1 + i t u t   ,
O t = σ W o h t - 1 , x t + b o   ,
h t = O t t a n h C t  
式中:Wxbx(x=f,c,i,o)分别为与控制门相关的权矩阵和偏置; C t - 1 C t分别为上一时刻和当前时刻的状态;tanh为双曲正切激活函数。上一个状态的输出ht-1和当前状态的输入xt结合作为LSTM的输入。
图2 LSTM网络结构

Fig.2 Structure of LSTM network

1.3.3 CNN

CNN是一种有效的自动提取特征的技术,在图像视觉领域取得了巨大的成功。同时,它们在处理时间序列方面也显示出很强的潜力,如自动语音识别和风速预测等。CNNs(基于CNN模型的集合体)的空前成功可归功于以下优点:①将特征提取和分类过程混合在一个单一的CNNs主体中,使得CNNs在训练时可以直接学习从原始数据中优化特征;②由于CNN的神经元与前一层的连接很少,所以CNN比MLP更有效地处理大数据集。关于一维卷积的运算表述如式(14)所示。
$\begin{array}{c} \alpha_{j}^{l+1}(\tau)=\sigma\left(\boldsymbol{b}_{j}^{l}+\sum_{f=1}^{F^{l}} K_{f=1}^{l}(\tau) \alpha_{f}^{l}(\tau)\right)= \\ \sigma\left\{\boldsymbol{b}_{j}^{l}+\sum_{f=1}^{F^{l}}\left[\sum_{p=1}^{p^{l}} K_{i f}^{l}(p) \alpha_{f}^{l}(\tau-p)\right]\right\} \end{array}$
式中: α j l + 1(τ)为第 l + 1层的特征映射j; σ为非线性激活函数;τ表示二维卷积过程中特征图的位置; F l为第l层的特征数量; K j f l为内核在l层的特征映射F进行卷积,生成l+1层的特征映射j; b j l为偏置矢量;p为内核长度; p l为第l层的内核长度; α f l表示第l层输入特征映射f

1.3.4 BP

BP神经网络[19]的学习过程分为2个部分。首先,信号从输入层开始,经过隐式层到达输出层,为前向传播。其次,误差从输出层开始,经过隐式层到达输入层,在输入层通过梯度下降算法进行反向传播,该算法依次调整各层之间的权重和偏差。梯度下降算法中的梯度矩阵表示函数增长最快的方向,沿着相反的方向可以快速找到最小值。
BP神经网络的具体实现流程为:每个神经元接收来自其他神经元的输入信号,每个输入信号都有一个连接权重,神经元将这些信号进行集成,并与神经元阈值进行比较。输出值在经激活函数处理后,作为输入传递给后续神经元。激活函数的作用是在算法中引入非线性,提高深度神经网络的表现力。激活函数一般采用Sigmoid函数。BP神经网络的具体原理如图3所示。
图3 BP神经网络结构

Fig.3 Structure of BP neural network

2 预测模型的实现过程

2.1 基于VMD和深度学习算法的预测框架

本文提出的基于VMD和深度学习算法的水质指标化学需氧量(Chemical Oxygen Demand,COD)时序预测模型如图4所示。具体流程:首先运用VMD技术,将经过预处理的时序序列进行分解,并划分为多个具有不同特性的模态分量;采用基于验证集评估的方法预测各分解后的子序列,即运用验证集数据对基于训练集所构建的模型性能进行量化评估,由此筛选出针对每个子序列预测性能最佳的深度学习算法;完成各子序列的预测后,通过对各预测子序列结果进行线性叠加,整合得到最终的预测值;最后,利用独立的测试集数据,对整个时序预测框架的综合预测性能进行客观、系统的评价,以此衡量该模型在时序预测中的有效性和可靠性。
图4 COD时序预测流程

Fig.4 Flowchart of COD time series prediction

2.2 子模型选择方法

子模型选择采用4个性能评价指标(即平均绝对误差(Mean Absolute Error,MAE)、平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)、均方根误差(Root Mean Square Error,RMSE)和标准差(Standard Deviation,STD))。其计算式分别为:
M A E = 1 n i = 1 n y i - y i   ,
M A P E = 1 n i = 1 n y i - y i y i × 100 %   ,
R M S E = 1 n i = 1 n y i - y i   ,
$\mathrm{STD}=\sqrt{\frac{\sum_{i=1}^{n}\left(y_{i}-\hat{y}_{i}\right)^{2}}{n-1}}$
式中:n为数据数量; y i为模型预测值; y i为测试值。
考虑到单一指标过于粗略,容易对预测结果产生错误的判断,引入综合评价指标(Comprehensive Evaluation Indicators,CEI)来评价子模型性能,以便在处理不同负荷序列时找到最合适的子模型。CEI基于以下4个步骤构建:
(1)根据测试集数据和验证集数据计算分解序列的MAE、MAPE、RMSE和STD值。
(2)标准化MAE、MAPE、RMSE和STD值。具体来说,以MAPE为例,归一化的MAPE值如式(19)所示。
M A P E j ' = M A P E j - m i n 1 j n M A P E m a x 1 j n M A P E - m i n 1 j n M A P E  
(3)CEI的计算式为
C E I j = 0.25 M A E j ' + 0.25 R M S E j ' + 0.25 S T D j ' + 0.25 M A P E j '  
(4)将CEI最小值对应的算法作为每个分解后的IMF的预测算法。

2.3 预测评价指标

本文采用上述提到的4个评价指标(MAE、RMSE、STD、MAPE),以及决定系数 R 2评估所建模型的性能,其中R2的计算式为
$R^{2}=1-\frac{\sum_{i=1}^{n}\left(y_{i}-\hat{y}_{i}\right)^{2}}{\sum_{i=1}^{n}\left(y_{i}-\bar{y}_{i}\right)^{2}}。$
式中 y - i为平均值。

2.4 数据预处理

(1)由于数据均为水质检测仪所测并由人工记录所得,故存在一定的异常点和缺失值。需将这些异常点去除后,再利用插值法进行填充。
(2)完成步骤(1)后,对整个数据进行归一化处理。为防止归一化后的数据接近0,对评价指标MAPE造成影响,本文将所有数据归一化到区间[1,2],归一化的公式如式(22)所示。
y = y - y m i n y m a x - y m i n + 1  
式中ymaxymin分别为整列数据的最大值和最小值。
(3)采用滑动窗口方法为本文的时间序列任务构建数据集 D = X i , Y i i = 1 n。时间序列预测的任务是学习非线性映射函数Yi=f X i。滑动窗口方法的具体实现如下:
$X_{i}=\left[x_{i}, x_{i+1}, \cdots, x_{i+w-1}\right] \in \mathbb{N}^{w}, $
$Y_{i}=\left[x_{i+w}, \cdots, x_{i+w+h-1}\right] \in \mathbb{N}^{h}。$
式中: w为滑动窗口的大小,本文取30; h为预测步长,本文取1;$\mathbb{N}$表示构建出来的XiYi为向量。
(4)将数据集 D按照8∶1∶1的比例分为训练集、验证集和测试集。其中80%作为训练集,用于确定改进VMD的超参数和训练预测模型;中间的10%作为验证集,用于确定每个子序列的最优子模型;最后的10%作为测试集,用于得到最终的预测结果。

3 实例分析

3.1 COD序列分解

本文选取的数据为湖北省武汉市某污水处理厂的排水COD,数据每隔2 h记录一次,共2 500条。对归一化后的数据进行VMD。根据灰狼优化算法所寻优到的结果,本次使用VMD选择的参数分别为:模态数K=6,二次惩罚项参数α=214。数据的分解结果如图5所示。
图5 VMD各模态分解

Fig.5 Decomposition of each mode in VMD

每种分解后的分量有着不同的频率,IMF1—IMF6频率逐渐增加,因此为每个分量选择合适的预测模型至关重要。每个IMF的预测模型由集成指标CEI确定,IMF相同时CEI值最小的模型即为最优子预测模型。子预测模型选用4种深度学习模型,表1给出了所使用的模型及参数设置。不同预测模型的相同参数是一致的,比如GRU、LSTM、CNN、BP的隐藏层的神经元个数都为10,迭代次数设置为50,批次数设置为64。
表1 深度学习模型参数设置

Table 1 Parameter setting for the deep learning models

模型 参数名称 参数设置
时间步长 30
GRU、 隐藏层神经元数量 10
LSTM、 批次数 64
CNN、 学习率 0.01
BP 迭代次数 50
优化器 Adam

3.2 各模态分量算法选择

为找到适合于每个子序列的预测模型,将4种算法分别代入各个子序列中,得到每个模型的预测性能指标,如表2所示。由表2可以看出,对于某一子序列来说,评价指标不同,表现最好的算法也不同。例如,在IMF1中,BP算法在MAE、RMSE和MAPE中均取得了最好的效果,但取得STD最佳效果的是LSTM。
表2 各子序列对应不同模型的性能指标

Table 2 Different model performance metrics corresponding to each subsequence

子序列
名称
算法
名称
MAE RMSE STD MAPE/% R2
IMF1 GRU 1.430 1.648 0.977 12.3 -0.099
LSTM 0.378 0.563 1.225 2.9 0.991
CNN 0.168 0.199 1.351 1.4 0.972
BP 0.125 0.151 1.355 1.0 0.954
IMF2 GRU 0.071 0.093 0.895 67.9 0.947
LSTM 0.071 0.092 0.898 57.0 0.985
CNN 0.105 0.137 0.890 76.4 0.872
BP 0.091 0.116 0.891 76.8 0.991
IMF3 GRU 0.104 0.134 0.746 58.0 0.956
LSTM 0.133 0.168 0.734 73.2 0.950
CNN 0.101 0.131 0.740 49.0 0.940
BP 0.107 0.139 0.741 53.8 0.985
IMF4 GRU 0.116 0.148 0.678 156.2 0.984
LSTM 0.117 0.156 0.661 135.1 0.980
CNN 0.083 0.114 0.667 67.6 0.973
BP 0.094 0.131 0.662 73.9 0.973
IMF5 GRU 0.111 0.155 0.620 59.3 0.967
LSTM 0.113 0.165 0.614 61.9 0.967
CNN 0.087 0.122 0.644 63.0 0.991
BP 0.098 0.138 0.646 67.7 0.986
IMF6 GRU 0.066 0.085 0.670 42.7 0.970
LSTM 0.061 0.084 0.669 35.3 0.964
CNN 0.089 0.125 0.670 50.3 0.958
BP 0.097 0.135 0.671 49.5 0.963
计算得到IMF1—IMF6的CEI值如图6所示。根据CEI值为每个分解的IMF确定最合适的预测模型,最小CEI值所对应的预测模型即为最优子模型,最终结果分别为BP、LSTM、CNN、CNN、CNN、LSTM。图中所有CEI均未出现0值,即对于某一序列,没有一个模型能同时在4个评价指标上取得最优,说明使用多个评价指标的必要性。
图6 各模态CEI值

Fig.6 CEI values of each mode

3.3 预测结果分析

3.3.1 基于VMD和4种深度学习算法的预测

在为分解后得到的各模态分量选定最佳预测模型后,将这些预测结果相加即可得到完整的COD预测序列,如图7所示。
图7 最终结果预测

Fig.7 Final prediction results

图7可以看出,所提出的模型对于出水COD的预测结果与真实序列吻合较好,其中拟合程度R2达到了0.979。为验证该模型的预测精度,将其与其他模型进行对比。

3.3.2 本文方法对比

为验证本文所选模型的有效性,VMD分解后对所有序列分别采用GRU、LSTM、CNN、BP四组试验进行对比。图8为4组试验与本文所选模型的真实值与预测值的线性拟合结果。试验均采用y=x对这些点进行拟合,散点分布越靠近y=x,表明预测效果越好。
图8 对比模型和所选模型线性拟合结果

Fig.8 Linear fittings of comparative models

结果表明,相较于4组对比试验,本文所选模型与y=x的拟合程度(R2=0.979)更高,RMSE达到0.485,评价指标较其他4组中表现最好的均有了一定的提升,如MAE值比表现最好的VMD-BP模型降低了0.025,MAPE值下降了0.22%,RMSE下降了0.034,由此可以看出所提预测框架效果最好。

4 结论

本文针对污水处理厂出水水质提出一种基于VMD和多种深度学习算法相融合的COD预测方法,主要结论如下:
(1)采用VMD将出水COD序列分解成不同的IMF,减少了COD时间序列的复杂度,有效提升了预测性能。
(2)引入CEI值可以将MAE、RMSE、MAPE、STD四个评价指标结合在一起,在为每个子模型选择最佳预测算法时可以综合考虑这4个评价指标。
(3)选择预测性能最好的算法对不同的IMF进行预测,能有效提高整个模型的预测精度。
本文所采用的预测框架是为每个经VMD得到的子序列选择最优模型,而在此过程中仅对VMD的参数进行了寻优,并未考虑4种深度学习算法的参数对预测性能的影响。
此外,本文仅使用出水水质本身的时间序列数据进行预测,未考虑污水处理厂的进水水质。结合进水水质对出水水质进行预测,可以更全面地掌握水处理过程,从而提升出水水质的预测能力。未来,我们将考虑采用这种方法建立预测模型,为实际水处理优化提供更有力的数据支持。
[1]
TAYYAB M, JEMAI J, LIM H, et al. A Sustainable Development Framework for a Cleaner Multi-item Multi-stage Textile Production System with a Process Improvement Initiative[J]. Journal of Cleaner Production, 2020, 246: 119055.

[2]
HASSEN E B, ASMARE A M. Predictive Performance Modeling of Habesha Brewery Wastewater Treatment Plant Using Artificial Neural Networks[J]. Chemistry International, 2019, 5(1):87-96.

[3]
LY Q V, TRUONG V H, JI B, et al. Exploring Potential Machine Learning Application Based on Big Data for Prediction of Wastewater Quality from Different Full-scale Wastewater Treatment Plants[J]. Science of The Total Environment, 2022, 832: 154930.

[4]
WANG R, YU Y, CHEN Y, et al. Model Construction and Application for Effluent Prediction in Wastewater Treatment Plant: Data Processing Method Optimization and Process Parameters Integration[J]. Journal of Environmental Management, 2022, 302: 114020.

[5]
NI Q, CAO X, TAN C, et al. An Improved Graph Convolutional Network with Feature and Temporal Attention for Multivariate Water Quality Prediction[J]. Environmental Science and Pollution Research, 2023, 30(5):11516-11529.

[6]
CHING P M L, ZOU X, WU D, et al. Development of a Wide-range Soft Sensor for Predicting Wastewater BOD5 Using an eXtreme Gradient Boosting (XGBoost) Machine[J]. Environmental Research, 2022, 210:112953.

[7]
GENG J, YANG C, LI Y, et al. MPA-RNN: A Novel Attention-based Recurrent Neural Networks for Total Nitrogen Prediction[J]. IEEE Transactions on Industrial Informatics, 2022, 18(10): 6516-6525.

[8]
刘杰, 金勇杰, 田明. 基于VMD和TCN的多尺度短期电力负荷预测[J]. 电子科技大学学报, 2022, 51(4):550-557.

(LIU Jie, JIN Yong-jie, TIAN Ming. Multi-scale Short-term Load Forecasting Based on VMD and TCN[J]. Journal of University of Electronic Science and Technology of China, 2022, 51(4):550-557. (in Chinese))

[9]
许玉格, 曹涛, 罗飞. 基于相关向量机的污水处理出水水质预测模型[J]. 华南理工大学学报(自然科学版), 2014, 42(5):103-108.

DOI

(XU Yu-ge, CAO Tao, LUO Fei. Wastewater Effluent Quality Prediction Model Based on Relevance Vector Machine[J]. Journal of South China University of Technology (Natural Science), 2014, 42(5): 103-108. (in Chinese))

[10]
金岩磊, 何茂慧, 郭涛, 等. 改进VMD融合深度学习在滚动轴承故障诊断中的应用[J]. 热能动力工程, 2023, 38(2):144-152.

(JIN Yan-lei, HE Mao-hui, GUO Tao, et al. Application of Improved VMD Combined with Deep Learning in Rolling Bearing Fault Diagnosis[J]. Journal of Engineering for Thermal Energy and Power, 2023, 38(2):144-152. (in Chinese))

[11]
李涛, 杨腾宇, 刘波, 等. 基于VMD-GRU的地铁隧道台阶法施工地表沉降预测[J]. 华中科技大学学报(自然科学版), 2023, 51(7): 48-54, 62.

(LI Tao, YANG Teng-yu, LIU Bo, et al. Surface Settlement Prediction of Subway Tunnels Constructed by Step Method Based on VMD-GRU[J]. Journal of Huazhong University of Science and Technology (Natural Science), 2023, 51(7): 48-54, 62. (in Chinese))

[12]
ARAGÃO D P, OLIVEIRA E V, BEZERRA A A, et al. Multivariate Data Driven Prediction of COVID-19 Dynamics: Towards New Results with Temperature, Humidity and Air Quality Data[J]. Environmental Research, 2022, 204: 112348.

[13]
LIU W, LIU T, LIU Z, et al. A Novel Deep Learning Ensemble Model Based on Two-stage Feature Selection and Intelligent Optimization for Water Quality Prediction[J]. Environmental Research, 2023, 224:115560.

[14]
MASMOUDI S, ELGHAZEL H, TAIEB D, et al. A Machine-learning Framework for Predicting Multiple Air Pollutants’ Concentrations via Multi-target Regression and Feature Selection[J]. Science of The Total Environment, 2020, 715: 136991.

[15]
刘亚珲, 赵倩. 基于聚类经验模态分解的CNN-LSTM超短期电力负荷预测[J]. 电网技术, 2021, 45(11):4444-4451.

(LIU Ya-hui, ZHAO Qian. Ultra-short-term Power Load Forecasting Based on Cluster Empirical Mode Decomposition of CNN-LSTM[J]. Power System Technology, 2021, 45(11):4444-4451. (in Chinese))

[16]
黄睿, 朱玲俐, 高峰, 等. 基于变分模态分解的卷积长短时记忆网络短期电力负荷预测方法[J]. 现代电力, 2024, 41(1):97-105.

(HUANG Rui, ZHU Ling-li, GAO Feng, et al. Short-term Power Load Forecasting Method Based on Variational Modal Decomposition for Convolutional Long-short-term Memory Network[J]. Modern Electric Power, 2024, 41(1): 97-105. (in Chinese))

[17]
NIU D, SUN L, YU M, et al. Point and Interval Forecasting of Ultra-short-term Wind Power Based on a Data-driven Method and Hybrid Deep Learning Model[J]. Energy, 2022, 254: 124384.

[18]
FAN G, YU P, WANG Q, et al. Short-term Motion Prediction of a Semi-submersible by Combining LSTM Neural Network and Different Signal Decomposition Methods[J]. Ocean Engineering, 2023, 267: 113266.

[19]
WEI M, DENG A, CHEN H, et al. Classification of Wellhead Device Defects Based on CNN-GA-BP Model[J]. Journal of Magnetism and Magnetic Materials, 2023, 572:170606.

Outlines

/