Urban Water Environmental Treatment Technologies for Middle-Lower Yangtze River

Wastewater Aeration Optimization Using Gaussian Process Regression Combined with Improved Black Widow Algorithm

  • LIU Long-zhi , 1 ,
  • ZHENG Zhi-jiang 2 ,
  • LI Ming , 1 ,
  • CHENG Hao 1 ,
  • YANG Wei-min 3 ,
  • WANG Yi-ke 1 ,
  • YANG Zheng-zhang 1 ,
  • WANG Xiao-yan 1
Expand
  • 1 China Three Gorges Corporation, Wuhan 430014, China
  • 2 School of Artificial Intelligence and Automation, Huazhong University of Science and Technology, Wuhan 430074, China
  • 3 Wuhan KEDI Intelligent Environment Co., Ltd., Wuhan 430000, China

Received date: 2025-07-08

  Revised date: 2025-10-06

  Online published: 2025-11-04

Abstract

[Objective] Aeration represents the most energy-intensive process in wastewater treatment plants (WWTPs), accounting for over 50% of total energy consumption. Traditional operation strategies often rely on excessive aeration to ensure effluent compliance, causing substantial energy waste and increased carbon emissions. To address this challenge, we propose a data-driven probabilistic optimization framework integrating Gaussian process regression (GPR) with an improved black widow optimization (IBWO) algorithm to minimize aeration energy consumption while ensuring effluent quality compliance under dynamic and uncertain influent conditions. The novelty lies in combining a probabilistic prediction model with an enhanced evolutionary algorithm for adaptive and energy-efficient aeration control at the plant scale.[Methods] A GPR model was developed to describe the nonlinear relationships between influent characteristics, aeration flow rate, and effluent water quality indicators, and furthermore, an IBWO algorithm was constructed by enhancing the standard black widow optimization framework. The GPR-IBWO framework was executed in a closed-loop configuration, where the GPR model continuously updated effluent predictions from real-time process data, and IBWO dynamically optimized aeration flow rates to minimize energy consumption while maintaining effluent quality within probabilistic bounds. Benchmark tests on six CEC2017 functions demonstrated that IBWO outperformed GA, PSO, ABC, and standard BWO in convergence speed and solution accuracy. The GPR-IBWO strategy was tested in a full-scale municipal WWTP in Jiujiang City, China. Operational data were collected over 30 days during wet and dry seasons to capture hydraulic and load fluctuations. The performance of four strategies was compared: the proposed GPR-IBWO optimization, conventional plant control mode, baseline GPR-BWO strategy method, and benchmark LSTM-PSO framework. [Results] Under both hydrological conditions, GPR-IBWO consistently maintained effluent concentrations of N ${\mathrm{H}}_{4}^{+}$-N, TN, TP, COD, BOD5, and SS below discharge limits, despite large influent quality variations. Other optimization schemes occasionally caused transient exceedances, particularly in TN and TP during high-load periods. GPR-IBWO exhibited smoother fluctuations and faster recovery from disturbances, indicating stronger robustness and adaptability. These advantages stemmed from the probabilistic nature of GPR, which incorporated uncertainty into decision-making, and from the enhanced global search capacity of IBWO, which avoided premature convergence and ensured reliable optimization results. Energy analysis demonstrated the method’s superiority. Compared to the conventional control strategy, total aeration energy consumption decreased by 41.62% during the wet season and 29.86% during the dry season, outperforming GPR-BWO (27.7% and 24.8%) and LSTM-PSO (31.8% and 19.9%). The optimized aeration profiles dynamically adapted to fluctuating influent loads, minimizing energy input while maintaining effluent compliance. The GPR model achieved high prediction accuracy, with mean absolute percentage errors below 2% for most indicators and coverage rates exceeding 93% within the 95% confidence interval, confirming the reliability of probabilistic predictions for real-time optimization in stochastic environments. [Conclusion] This study develops and validates a probabilistic intelligent optimization framework for aeration control that integrates machine learning-based prediction with evolutionary optimization. The main conclusions are as follows. (1) The GPR-based model accurately captures nonlinear and uncertain process dynamics, providing high-confidence effluent predictions with narrow uncertainty intervals. (2) The IBWO algorithm, through multi-mechanism improvement, demonstrates superior convergence, robustness, and solution quality compared to mainstream metaheuristics. (3) The integrated GPR-IBWO strategy effectively maintains effluent quality compliance and reduces aeration energy consumption by up to 40%, confirming its strong adaptability to seasonal and hydraulic variations. (4) For long-term implementation, periodic recalibration of the GPR model or incorporation of disturbance observers is recommended to mitigate model drift and sustain optimization performance. Overall, the GPR-IBWO framework offers a generalizable and uncertainty-aware approach for optimizing WWTP operations, enhancing energy efficiency without compromising effluent quality and showing substantial potential for large-scale application in smart wastewater management and low-carbon environmental infrastructure.

Cite this article

LIU Long-zhi , ZHENG Zhi-jiang , LI Ming , CHENG Hao , YANG Wei-min , WANG Yi-ke , YANG Zheng-zhang , WANG Xiao-yan . Wastewater Aeration Optimization Using Gaussian Process Regression Combined with Improved Black Widow Algorithm[J]. Journal of Changjiang River Scientific Research Institute, 2025 , 42(12) : 207 -215 . DOI: 10.11988/ckyyb.20250630

开放科学(资源服务)标识码(OSID):

0 引言

污水处理是实现污水无害化回归自然环境的关键手段,其核心目标是确保出水水质满足环保标准。实现该目标涉及的泵回流、化学药剂投加和曝气溶氧等高能耗操作间接导致了碳排放的增加[1]。传统污水处理普遍采用粗放式运作模式,难以有效平衡能耗与水质之间的矛盾。因此,同步实现出水水质达标和能耗优化,已成为当前污水处理领域的重要研究课题。
针对能耗优化过程,首先需建模预测出水水质。传统活性污泥模型,虽具备良好的物理和生化解释性,但其原理复杂、模型校准高度依赖经验知识,不利于应用推广[2]。随着机器学习技术的快速发展,现代算法可为此类任务提供有效的解决途径。陈霖等[3]使用网格搜索算法(Grid Search,GS)和变异粒子群算法(Mutant Particle Swarm Optimization,MPSO)对支持向量机(Support Vector Machine,SVM)的惩罚因子与核函数参数进行确定,利用GS-SVM与MPSO-SVR模型预测炼化污水厂出水化学需氧量(COD)浓度,两模型在训练集中平均相对误差分别为2.23%和2.21%;余铭铨等[4]引入深度学习的长短期记忆神经网络(Long Short-Term Memory,LSTM)对重庆市某污水厂的出水总氮(TN)浓度进行预测,结果显示LSTM在各项指标上均优于传统的时序预测模型。最后基于上述预测模型,构建并求解能耗与出水水质的优化问题。李志峰等[5]提出了一种融合多策略的多目标麻雀搜索算法,并将所求帕累托前沿解应用于国际水协的仿真基准模型(Benchmark Simulation Model 1,BSM1)测试平台,在保证出水水质达标的同时降低了能耗;何正磊等[6]则采用多智能体强化学习的方法对优化问题进行求解,通过“求解—观测—决策”进行动态优化,可使造纸污水处理温室气体排放量降低10.3%。
然而,现有优化方案未充分考虑污水处理厂在实际运行时受到外界随机负荷扰动(如进水流量或水质变化)的影响。在严格的出水标准要求下,进水负荷的剧烈波动可能导致突发性的出水水质超标现象。因此,需评估随机干扰对优化效果的影响,并采取更为鲁棒的运行策略。
本文以九江市某污水处理厂为研究对象。因曝气对污水中氨氮硝化污染物的脱除影响较大,曝气过程中,曝气能耗在污水处理总能耗中的占比>51%,故着重研究出水水质与曝气能耗的优化问题[7-8]。通过高斯过程回归(Gaussian Processes Regression,GPR)建立进出水水质与曝气参数的关系模型,得到给定置信水平下的出水水质预测分布;基于该模型提出优化问题,采用本文提出的改进黑寡妇算法(Improved Black Widow Optimization,IBWO)进行求解,得到最终的运行策略。优化结果确保在外界负荷变化的情况下,出水水质能够以置信水平保持在限制值以下。同时,精确的曝气投加较粗放式操作显著节省能耗。

1 出水水质的建模预测

1.1 高斯过程回归原理

高斯过程是基于贝叶斯概率理论的非参数回归模型,适用于数据量中小且随机性较强的多维度输入输出关系拟合[9]。对于给定的训练集数据Dtrain={(xi,yi)|i=1,2,…,n},其中xi= $[{x}_{i1},{x}_{i2},\dots,{x}_{id}{]}^{\mathrm{T}}$yi= $[{y}_{i1},{y}_{i2},\dots,{y}_{ik}{]}^{\mathrm{T}}$分别表示第i个样本的d维输入特征向量和k维输出特征向量。定义训练集的输入和输出矩阵分别为X=[x1,x2,…,xn]T,Y=[y1,y2,…,yn]T。在无噪声情况下,高斯过程假设输入与输出特征满足多元高斯分布,可通过隐函数f进行映射,其数学表达形式为
f(X)~GP(μ(X),K(X,X))
式中:GP表示多元高斯先验分布;μ(X)和K(X,X)分别对应均值函数向量和协方差函数矩阵。
但现实中噪声不可避免,所以高斯过程须考虑噪声的影响。在高斯过程中,噪声被视为独立变量,且服从高斯分布,从而建立标准的高斯过程模型。
Y=f(X)+ε
式中ε为高斯白噪声向量,ε~N(0, ${\sigma }_{n}^{2}$I),其中N为正态分布, ${\sigma }_{n}^{2}$为方差,I为单位矩阵。
联立式(1)与式(2)得
Y~GP $\left(\mu \left(X\right),K(X,X)+{\sigma }_{n}^{2}I\right)$
给定测试集数据Dtest={(x*j,y*j|j=1,2,…,m},其中x*i=[x*i1,x*i2,…,xid]Ty*i=[y*i1,y*i2,…,yid]T。定义测试的输入和输出矩阵分别为X*=[x*1,x*2,…,x*m]TY*i=[y*i1,y*i2,…,x*m]T。建立其与训练集的联合高斯分布为

$\left[\begin{array}{l}Y\\ {Y}_{\mathrm{*}}\end{array}\right]$~N $\left(\left[\begin{array}{l}\mu \left(X\right)\\ \mu \left({X}_{\mathrm{*}}\right)\end{array}\right]\right.$,

$\left.\left[\begin{array}{ll}K(X,X)+{\sigma }_{n}^{2}I& K(X,{X}_{\mathrm{*}})\\ K({X}_{\mathrm{*}},X)& K({X}_{\mathrm{*}},{X}_{\mathrm{*}})\end{array}\right]\right)$
式中:K(X,X)表示训练集输入特征的n×n自协方差函数矩阵;K(X,X*)和K(X*,X)分别表示训练集与测试集输入特征的n×mm×n互协方差函数矩阵;K(X*,X*)表示测试集输入特征的m×m自协方差函数矩阵。
根据贝叶斯后验概率公式,可以得到X*的高斯过程回归预测结果为
$\left\{\begin{array}{l}{Y}_{\mathrm{*}}~N({\mu }_{\mathrm{*}},{\sigma }_{\mathrm{*}}^{2});\\ {\mu }_{\mathrm{*}}=\mu \left({X}_{\mathrm{*}}\right)+K({X}_{\mathrm{*}},X)\left(K\right(X,X)+\\   {\sigma }_{n}^{2}{I)}^{-1}(Y-\mu (X\left)\right);\\ {\sigma }_{\mathrm{*}}^{2}=K({X}_{\mathrm{*}},{X}_{\mathrm{*}})-K({X}_{\mathrm{*}},X)\left(K\right(X,X)+\\   {\sigma }_{n}^{2}{I)}^{-1}K(X,{X}_{\mathrm{*}})。\end{array}\right.$
本文选用径向基函数(Radial Basis Function,RBF)核作为GPR的协方差函数,其可有效捕捉污水处理过程的非线性动态,适应负荷波动和随机扰动。RBF核的数学表达形式为
K(X,X*)= ${\sigma }_{f}^{2}$exp(- $\frac{\Vert X-{\mathrm{X}}_{\mathrm{*}}{\Vert }^{2}}{2{l}^{2}}$) 。
式中 ${\mathrm{\sigma }}_{\mathrm{f}}^{2}$和l分别表示RBF核的信号方差和长度尺度。

1.2 出水水质预测问题描述

污水处理厂作为复杂的生化处理系统,可视为一个带外源性输入的非线性自回归模型[10],其出水水质不仅取决于历史进水参数及运行参数,还受到过去出水水质自身的动态反馈作用,数学表达形式为
Yt+1=h $\left({R}_{\mathrm{t}-{\mathrm{n}}_{\mathrm{r}}:t},{U}_{\mathrm{t}-{\mathrm{n}}_{\mathrm{u}}:t},{Y}_{\mathrm{t}-{\mathrm{n}}_{\mathrm{y}}:t}\right)$+Dt+1
式中:h为非线性函数;Rt-nr:t表示时刻t-nr到时刻t的进水参数,包括进水流量和进水水质;Ut-nu:t表示时刻t-nu到时刻t的运行参数,是用于人为调控污水处理的效率;Yt-ny:t表示时刻t-ny到时刻t的出水参数;Dt+1为外界扰动或噪声,表示来自环境或系统内部的不确定性,可能对处理过程以及出水水质造成影响。污水处理厂监测水质的关键指标为氨氮(NH3-H)浓度、总氮(TN)浓度、总磷(TP)浓度,化学需氧量(COD)、五日生化需氧量(BOD5)和悬浮固体(SS)浓度。典型的运行参数包括泵回流量、化学药剂投加量和曝气流量等,本文只关注曝气流量。出水水质Yt+1作为系统输出,其监测指标与进水保持一致,且受到时刻t-ny到时刻t出水水质Yt-ny:t的影响。
高斯过程回归用于对未知的非线性函数h进行建模描述,即输入进水参数Rt-nr:t,运行参数Ut-nu:t和过去出水水质Yt-ny:t,输出出水水质Yt+1的概率分布。
h$\left[\begin{array}{l}\overline{N{H}_{3}-H}~\mathrm{N}({\mathrm{\mu }}_{N{H}_{3}-H},{\mathrm{\sigma }}_{N{H}_{3}-H}^{2})\\ \overline{TN}~\mathrm{N}({\mathrm{\mu }}_{TN},{\mathrm{\sigma }}_{TN}^{2})\\ \overline{TP}~\mathrm{N}({\mathrm{\mu }}_{TP},{\mathrm{\sigma }}_{TP}^{2})\\ \overline{COD}~\mathrm{N}({\mathrm{\mu }}_{COD},{\mathrm{\sigma }}_{COD}^{2})\\ \overline{BO{D}_{5}}~\mathrm{N}({\mathrm{\mu }}_{BO{D}_{5}},{\mathrm{\sigma }}_{BO{D}_{5}}^{2})\\ \overline{SS}~\mathrm{N}({\mathrm{\mu }}_{SS},{\mathrm{\sigma }}_{SS}^{2})\end{array}\right]$
式中 $\overline{\mathrm{N}{\mathrm{H}}_{3}\mathrm{-}\mathrm{H}}$ $\overline{\mathrm{T}\mathrm{N}}$ $\overline{\mathrm{T}\mathrm{P}}$ $\overline{\mathrm{C}\mathrm{O}\mathrm{D}}$ $\overline{\mathrm{B}\mathrm{O}{\mathrm{D}}_{5}}$ $\overline{\mathrm{S}\mathrm{S}}$分别表示高斯过程回归模型对6种出水水质参数的预测输出,这些随机变量均服从相应的正态分布。

1.3 出水水质预测结果评估

建模数据集为2024年3月15日—4月24日的960条实时数据,数据采样频率为每小时一次。针对数据中的异常值与缺失值,本文进行了合理的插值处理,以保证数据的完整性和一致性。数据集按0.9∶0.1的比例被划分为训练集和测试集,其中,训练集用于模型训练,测试集用于评估训练后模型的预测性能。
在GPR模型训练过程中,RBF核的参数通过最大似然估计(Maximum Likelihood Estimation,MLE)确定。训练后的GPR模型在测试集上的表现如图1所示(置信水平设置为95%)。结果表明,预测均值与真实值高度一致,且预测区间能较好地覆盖真实值。
图1 高斯过程回归模型的出水水质预测

Fig.1 Effluent water quality predicted by the GPR model

表1列出了模型预测结果与真实出水水质偏差的定量评估,包括平均绝对误差(Mean Absolute Error,MAE)、均方根误差(Root Mean Square Error,RMSE)和平均绝对百分比误差(Mean Absolute Percentage Error,MAPE);在验证预测区间的有效性时,采用了Li等[11]提出的覆盖比例(Coverage Ratio,CR)和平均宽度百分比(Mean Wide Percentage,MWP)作为评估指标,其中,CR反映在给定置信水平下,真实值落入预测区间的比例,MWP则为在相同置信水平下预测区间宽度相对于预测值的平均百分比,用于防止因预测区间过宽而丧失对不确定度的可靠量化的重要补充指标。由表1可知,6种水质的预测误差均维持较小水平,除NH3-H(MAPE=2.07%)和TP(MAPE=1.26%)外,其他水质的MAPE均低于1%;6种出水水质的CR>93%;而除NH3-H(MWP=10.50%)和TP(MWP=9.83%)外,其他出水水质的MWP<6%,平均预测区间较窄,这主要是由于NH3-H和TP的数值较小且波动较大,导致其超标风险高于其他水质,因此需要更宽的预测区间。
表1 高斯过程回归模型的出水水质预测精度与区间评估

Table 1 Evaluation of accuracy and interval of GPR model predicted effluent water quality

出水
水质
MAE/
(mg·L-1)
RMSE/
(mg·L-1)
MAPE/
%
CR/
%
MWP/
%
NH3-H浓度 0.001 3 0.002 7 2.07 93.75 10.50
TN浓度 0.027 3 0.038 2 0.32 96.88 2.55
TP浓度 0.006 2 0.007 8 1.26 98.96 9.83
COD 0.018 7 0.024 4 0.21 100.00 1.84
BOD5 0.001 3 0.001 7 0.20 98.96 1.29
SS浓度 0.008 7 0.011 5 0.66 98.96 5.63

2 出水水质与曝气能耗优化

2.1 优化问题构造

传统污水处理厂粗放式曝气策略是保证出水水质达标的一种常见手段,该方法可确保污水处理厂在应对进水波动时始终维持较低的出水水质。然而,过于保守的方法导致曝气能源消耗过大,这在某种程度上加剧了碳排放。因此,优化降低曝气能耗成为污水处理厂提效、节能和降碳的重要研究方向。
曝气能耗是指通过鼓风器向生化池中输送空气,调节池内溶解氧浓度以促进脱氮反应所消耗的能量,则曝气能耗AE为
AE= $\frac{1}{kT}\stackrel{k-1}{\sum _{i=0}}\frac{{Q}_{air}(\mathrm{t}+\mathrm{i}\mathrm{T})\Delta P}{\eta }$
式中:T为曝气流量优化周期;k为计算平均能耗时所选取的周期数;Qair(t+iT)为时刻t+iT的曝气流量;ΔP为鼓风机产生的压力差;η为鼓风机的运行效率。ΔPη取值基于目标污水处理厂一年的实际运行数据,采用平均值法计算。
由于降低曝气流量会对污水处理厂氨氮硝化污染物去除效果产生影响,因此还需考虑出水水质的约束条件对曝气耗散的影响。基于外界扰动带来的不确定性,采用概率软约束替代硬约束,即出水水质将以一定的置信水平低于水质限制标准。最终构造的曝气优化问题如下:
min J=AE,
s.t. $\left\{\begin{array}{l}{\mathrm{\mu }}_{N{H}_{3}-H}+{\mathrm{\Phi }}^{-1}\left(\mathrm{p}\right){\mathrm{\sigma }}_{N{H}_{3}-H}\le 2 ;\\ {\mathrm{\mu }}_{TN}+{\mathrm{\Phi }}^{-1}\left(\mathrm{p}\right){\mathrm{\sigma }}_{TN}\le 12.5 ;\\ {\mathrm{\mu }}_{TP}+{\mathrm{\Phi }}^{-1}\left(\mathrm{p}\right){\mathrm{\sigma }}_{TP}\le 0.5 ;\\ {\mathrm{\mu }}_{COD}+{\mathrm{\Phi }}^{-1}\left(\mathrm{p}\right){\mathrm{\sigma }}_{COD}\le 20 ;\\ {\mathrm{\mu }}_{BO{D}_{5}}+{\mathrm{\Phi }}^{-1}\left(\mathrm{p}\right){\mathrm{\sigma }}_{BO{D}_{5}}\le 8 ;\\ {\mathrm{\mu }}_{SS}+{\mathrm{\Phi }}^{-1}\left(\mathrm{p}\right){\mathrm{\sigma }}_{SS}\le 8 ;\\ {\mathrm{Q}}_{air}^{low}\le {\mathrm{Q}}_{air}(\mathrm{t}+\mathrm{i}\mathrm{T})\le {\mathrm{Q}}_{air}^{high}。\end{array}\right.$
式中:Φ-1(p)为置信水平p下的标准正态分布的反函数; ${Q}_{\mathrm{a}\mathrm{i}\mathrm{r}}^{\mathrm{l}\mathrm{o}\mathrm{w}}$ ${Q}_{\mathrm{a}\mathrm{i}\mathrm{r}}^{\mathrm{h}\mathrm{i}\mathrm{g}\mathrm{h}}$分别为曝气流量的上限和下限。
则高斯过程回归联合改进黑寡妇算法(GPR-IBWO)的污水厂曝气优化的实现流程:在每个优化周期内,通过求解上述优化问题获得最佳曝气流量;将该优化值应用于实际操作,并通过传感器采集执行后的出水水质参数,用于下一时刻的高斯过程回归预测,从而实现闭环动态优化。优化结构如图2所示。
图2 GPR-IBWO的污水曝气优化控制结构

Fig.2 Optimized control structure for wastewater aeration using GPR-IBWO

2.2 标准黑寡妇算法

黑寡妇算法(Black Widow Optimization,BWO)作为一种新颖的元启发式优化算法,其设计思路来源于黑寡妇蜘蛛独特的繁衍行为[12]。该算法通过模拟黑寡妇蜘蛛种群的动态更替和适应度演化,实现对复杂优化问题的全局最优解搜索。
在算法初始化阶段,需随机生成规模为Npop的种群。每个个体xid维向量 $[{x}_{i1},{x}_{i2},\dots,{x}_{id}{]}^{T}$表示,其对应的适应度由目标优化函数f(xi)进行评估。个体任一维度的初始值由下式随机生成。xij=lbj+rand(0,1)(ubj-lbj) 。 (12)式中:ubj和lbj分别为第j个维度的上限和下限;rand(0,1)为取值区间[0,1]的均匀随机数。
初始化完成后,算法进入迭代过程。在每轮迭代中,种群依次经历交配、同类相食和变异3个关键环节。
交配阶段从种群中选取Npr个个体作为父母,随机配对并进行d/2次交配操作,以实现父母遗传信息的融合,兼顾种群多样性与优良特征的传递。对于任意一对父母xixj(ij),其生成的子代个体如下
$\left\{\begin{array}{l}{x}_{\mathrm{c}\mathrm{h}\mathrm{i}\mathrm{l}\mathrm{d}1}=\alpha ☉{x}_{i}+(1-\alpha )☉{x}_{j} ;\\ {x}_{\mathrm{c}\mathrm{h}\mathrm{i}\mathrm{l}\mathrm{d}2}=\alpha ☉{x}_{j}+(1-\alpha )☉{x}_{i} 。\end{array}\right.$
式中:☉为逐元素乘积运算;α为交叉系数,是d维权重向量,表示父母个体间的信息交换程度。
同类相食旨在保留健壮(适应度高)的个体,淘汰瘦弱(适应度低)的个体,增强种群整体质量。这一机制主要体现两个层面,一是性相食,即在交配过后父母个体只保留适应度较高的一者;二是子类相食,即生成的子类中筛选适应度最高的Ncr个个体进入下一代。
最后,为提高种群探索能力,防止算法陷入局部最优,随机选择Nmu个个体进行变异。变异操作通过随机交换个体xi中2个不同维度的元素xikxil(0≤k,ld,kl)实现。

2.3 改进黑寡妇算法

标准黑寡妇算法凭借其“交配—相食—变异”的机制在多类优化问题中表现出良好的性能,但仍存在一定不足。为提升其寻优性能,本文引入共享适应度、相似感知自适应交配、双模扰动变异与基于吸引法的边界修正机制。改进后的算法流程如图3所示。
图3 改进黑寡妇算法的寻优流程

Fig.3 Optimization procedures of IBWO algorithm

2.3.1 共享适应度

共享适应度概念源于进化生物学中的小生境思想,是为了缓解种群中因过度竞争而导致的早熟收敛问题。其核心理念:个体的适应度不仅取决于其自身的优劣程度,还需考虑其在解空间中与其他个体的相对位置关系,体现为对个体适应度的共享修正。其数学表达式如下
${\mathrm{f}}_{\mathrm{i}}^{share}$= $\frac{{\mathrm{f}}_{\mathrm{i}}}{1+{\mathrm{C}}_{\mathrm{i}}}$
式中:fi为个体xi的适应度值;Ci为个体xi的共享强度,用于衡量该个体在解空间中所处的拥挤程度,即
Ci= $\sum _{{\mathrm{x}}_{\mathrm{j}}\in \mathrm{N}\left(\mathrm{i}\right)}\left[1-{\left(\frac{dist({x}_{i},{x}_{j})}{\overline{\omega }}\right)}^{2}\right]$
式中:N(i)={xjdist(xi,xj)< $\overline{\omega }$}为个体xi的邻居个体集合; $\overline{\omega }$为决定影响范围的尺度系数,默认值为1.0;dist(xi,xj)为两个个体之间的距离,一般选择欧氏距离或海明距离。

2.3.2 相似感知自适应交配

在标准的黑寡妇算法中,交叉系数α设定为一个随机权重向量,这种随机机制忽视了父母个体的相似度,可能导致交配操作缺乏针对性,为此需基于个体相似度实现交叉系数的自适应调整。
当父母个体相似度较高时,应采用较大的交叉系数以增强子代的多样性;反之,当父母个体差异较大时,则应选取较小的交叉系数,从而控制解空间的扰动范围,避免全局搜索方向的偏离。则交叉系数α为
α=k1 $\frac{{x}_{i}^{\mathrm{T}}{x}_{j}}{\Vert {x}_{i}\Vert ·\Vert {x}_{j}\Vert }$+k2r
式中:k1为相似权重,默认值为0.8;k2为随机权重,默认值为0.2;r为各元素取值区间[0,1]的均匀随机向量。

2.3.3 双模扰动变异

原始变异操作使用的随机双维度交换策略虽然简单,但在处理一维问题时失效,且易因交换的2个维度的取值范围不同而超出解空间。为克服上述缺陷并提升算法性能,本文引入高斯变异与柯西变异算子,并结合历史最优解进行引导,构建新的变异机制。
δCauchy=tan(π(rand(0,1)-0.5)),
δGaussian~N(0,1),
Δs=γ ${\left(1-\frac{\mathrm{t}}{\mathrm{T}}\right)}^{\mathrm{p}}$,
xi=xi+0.5(δCauchy+δGaussian)(xbest-xis
式中:δGaussian和δCauchy分别为高斯与柯西扰动项;Δs为变异步长;γ为跨度系数,默认值为1.0;p为衰减系数,默认值为2.0;xbest为历史最优解。
高斯变异通过微幅扰动实现局部精细搜索,提升解的精度;柯西变异则因其长尾特性引入大幅扰动,有助于跳出局部最优,增强全局搜索能力。进一步地最优解引导机制增强搜索的方向性,加快收敛速度。最后,步长随迭代次数递减,使算法后期转化为精细探索,进一步提升精度。

2.3.4 基于吸引法的边界修正

在上述交配与变异的过程中,个体有可能超出预设的解空间。合理地对个体进行边界修正,有助于种群朝着最优解的方向进化。常见的上下限截断操作直接将越界个体映射至边界,造成解空间的不连续性,进而影响收敛速度。吸引法则能够更平滑地推动个体朝向边界,避免剧烈的数值跳动。对于上越界和下越界情况,基于吸引法的边界修正为
xij= $\left\{\begin{array}{l}u{b}_{\mathrm{j}}-\frac{u{b}_{\mathrm{j}}-{\mathrm{x}}_{\mathrm{i}\mathrm{j}}}{1+{\mathrm{e}}^{-\mathrm{\beta }(u{b}_{\mathrm{j}}-{\mathrm{x}}_{\mathrm{i}\mathrm{j}})}}, {\mathrm{x}}_{\mathrm{i}\mathrm{j}}>u{b}_{\mathrm{j}} ;\\ l{b}_{\mathrm{j}}+\frac{l{b}_{\mathrm{j}}-{\mathrm{x}}_{\mathrm{i}\mathrm{j}}}{1+{e}^{-\mathrm{\beta }(l{b}_{\mathrm{j}}-{\mathrm{x}}_{\mathrm{i}\mathrm{j}})}}, {\mathrm{x}}_{\mathrm{i}\mathrm{j}}<l{b}_{\mathrm{j}} 。\end{array}\right.$
式中β是控制引力强度的参数,个体距离边界越远,其所受的引力将越大,默认值为5.0。

2.3.5 算法性能评估

为评估改进黑寡妇优化算法的寻优性能,本文从CEC2017基准函数集中选取了6种测试函数,比较所提IBWO与主流遗传算法(Genetic Algorithm,GA)、粒子群算法(Particle Swarm Optimization,PSO)、人工蜂群算法(Artificial Bee Colony,ABC)及BWO在这些测试函数上的优化表现,结果如表2所示[13]。从测试函数适应度的收敛速度来看,IBWO下降最快,这验证了IBWO改进的有效性。
表2 6种测试函数的收敛情况

Table 2 Convergence performances of six test functions

测试函数 收敛曲线
$\begin{array}{l}{F}_{1}\left(x\right)=\stackrel{D}{\sum _{i=1}}{x}_{i}^{2},\\ x=[{x}_{1},{x}_{2},\dots,{x}_{D}{]}^{\mathrm{T}},\\ {x}_{i}\in \left[-\mathrm{5.12,5.12}\right],\\ D=10\end{array}$
$\begin{array}{l}{F}_{2}\left(x\right)=418.982\mathrm{ }9-\\ \stackrel{D}{\sum _{i=1}}{x}_{i}·\mathrm{s}\mathrm{i}\mathrm{n}\left(\sqrt{\left|{x}_{i}\right|}\right),\\ x=[{x}_{1},{x}_{2},\dots,{x}_{D}{]}^{\mathrm{T}},\\ {x}_{i}\in \left[-\mathrm{500,500}\right],\\ D=10\end{array}$
$\begin{array}{l}{F}_{3}\left(x\right)=({x}_{1}{-1)}^{2}+\\ \stackrel{D}{\sum _{i=2}}i{\left(2{x}_{i}^{2}-{x}_{i-1}\right)}^{2},\\ x=[{x}_{1},{x}_{2},\dots,{x}_{D}{]}^{\mathrm{T}},\\ {x}_{i}\in \left[-\mathrm{10,10}\right],\\ D=10\end{array}$
$\begin{array}{l}{F}_{4}\left(x\right)=\stackrel{D}{\sum _{i=1}}{x}_{i}^{2}+{\left(\stackrel{D}{\sum _{i=1}}0.5i{x}_{i}\right)}^{2}+\\ {\left(\stackrel{D}{\sum _{i=1}}0.5i{x}_{i}\right)}^{4},\\ x=[{x}_{1},{x}_{2},\dots,{x}_{D}{]}^{\mathrm{T}},\\ {x}^{i}\in \left[-\mathrm{5,10}\right],\\ D=10\end{array}$
$\begin{array}{l}{F}_{5}\left(x\right)=10D+\\ \stackrel{D}{\sum _{i=1}}\left({x}_{i}^{2}-10·\mathrm{c}\mathrm{o}\mathrm{s}\left(2\mathrm{\pi }{x}_{i}\right)\right),\\ x=[{x}_{1},{x}_{2},\dots,{x}_{D}{]}^{\mathrm{T}},\\ x\in \left[-\mathrm{5.12,5.12}\right],\\ D=10\end{array}$
$\begin{array}{l}{F}_{6}\left(x\right)=-20\mathrm{e}\mathrm{x}\mathrm{p}\left(-0.2\sqrt{\frac{1}{D}\stackrel{D}{\sum _{i=1}}{x}_{i}^{2}}\right)-\\ \mathrm{e}\mathrm{x}\mathrm{p}\left(\frac{1}{D}\stackrel{D}{\sum _{i=1}}\mathrm{c}\mathrm{o}\mathrm{s}\left(2\pi {x}_{i}^{2}\right)\right)+\\ 20+\mathrm{e},\\ x=[{x}_{1},{x}_{2},\dots,{x}_{D}{]}^{\mathrm{T}},\\ {x}_{i}\in \left[-\mathrm{32.768,32.768}\right],\\ D=10\end{array}$

2.4 优化结果验证

为验证所提出优化策略的有效性,本文将实时优化结果应用于九江市某污水处理厂,并对运行状况以进行评估。试验设计了4组对照方案:①试验组采用GPR-IBWO优化策略;②常规对照组采用厂站的现行策略;③算法对照组采用BWO求解优化问题(GPR-BWO);④与Liu等[14]提出的基于长短时记忆网络与粒子群优化(LSTM-PSO)的策略进行对比,以凸显所提策略的优越性。试验中,数据采样周期与曝气优化周期均设置为1 h,并连续运行30 d。
同时,为验证优化策略在不同进水条件下的适应性及对扰动的鲁棒性,本文选取2组具有显著水文特征差异的典型季节进行跨期对比:第一期为2024年6月10日—7月10日的丰水期工况,第二期为2024年12月7日—2025年1月6日的枯水期工况。两期的水文特征对比情况如图4所示,主要表现为丰水期的进水流量及水温相较于枯水期偏高。在试验过程中,系统将实时采集关键性能指标,包括鼓风机曝气能耗及出水水质参数,以量化评估不同运行策略的综合效能。
图4 丰水期与枯水期水文特征对比

Fig.4 Comparison of hydrological characteristics between wet and dry seasons

图5 丰水期三组运行策略的出水水质结果

Fig.5 Effluent water quality results under three operation strategies during wet season

图5图6展示了丰水期和枯水期污水处理厂出水水质中NH3-H浓度、TN浓度、TP浓度、COD、BOD5和SS浓度在4组策略下的变化情况。在丰水期GPR-IBWO、GPR-BWO和LSTM-PSO三种优化策略下的NH3-H浓度波动范围显著高于枯水期。与此同时,在GPR-BWO、LSTM-PSO和厂站现行策略下,TP浓度的超标现象在丰水期较枯水期更为频繁。这一结果表明,污水处理厂在丰水期的进水负荷波动较大,导致维持出水水质达标的难度增加。
图6 枯水期三组运行策略下的出水水质

Fig.6 Effluent water quality results under three operation strategies during dry season

不论在丰水期还是枯水期,优化后的NH3-H浓度均值,GPR-IBWO最高,其次为GPR-BWO,再次为LSTM-PSO,而现行策略的均值最低。然而,在TP和TN的均值方面,GPR-IBWO表现则为最低。这表明曝气流量对于NH3-H浓度的影响较为显著,此结果与溶氧脱氮的工艺原理相符,即NH3-H平均浓度的提升意味着曝气能耗的降低。
在出水水质达标方面,仅GPR-BWO在枯水期的一个时间点出现NH3-H浓度超标;而在丰水期,TP浓度在GPR-BWO、LSTM-PSO和现行策略下均存在不同程度超标,且超标幅度<10%。同时,现行策略在枯水期和丰水期均出现TN浓度的短期超标。与此相比,本文提出的GPR-IBWO能够确保所有出水水质均维持在限制值以下。尤其在NH3-H和TP这2个低浓度指标中,该策略有效避免了GPR-BWO、LSTM-PSO和现行策略中出现的尖峰超标现象。这归因于两点:一是GPR作为概率预测模型,能够提供LSTM这类点预测模型无法提供的均值和方差信息,进而构造更安全的带概率软约束优化问题;二是IBWO已在第2.3.5节中证明其相较于BWO和PSO具备更优的寻优性能,从而提升策略的稳定性和可靠性。此外,其他出水指标,包括COD、BOD5和SS浓度,在4种策略下的出水水质均低于排放限值,且无显著差异,说明曝气流量对其影响有限。
表3是不同季节下不同策略的30 d总曝气能耗对比情况。从季节性角度分析,丰水期的曝气能耗在所有策略中均高于枯水期,这主要是由于该时期污水处理厂的进水负荷较大,因此需要增加曝气能耗。在枯水期,GPR-IBWO在30 d内的总曝气能耗为9.89×105 kW·h,相较于厂站现行策略,节省了29.86%的单位成本;GPR-BWO的能耗节省比例为24.82%;而LSTM-PSO的能耗节省比例达到19.86%。在丰水期,GPR-IBWO实现了更强的节能作用,其能耗节省比例达41.62%,远高于GPR-BWO(27.70%)和LSTM-PSO(31.76%)。这一结果表明,所提优化策略在节能方面具有显著的有效性,能够根据厂站工况条件进行合理调整,从而进一步挖掘能源利用潜力。
表3 不同运行策略下的曝气能耗情况

Table 3 Aeration energy consumption under four operation strategies

所处季节 运行策略 总曝气能耗/
(kW·h)
节省比例/%
丰水期 厂站现行方式 1.48×106
LSTM-PSO 1.01×106 31.76
GPR-BWO 1.07×106 27.70
GPR-IBWO 8.64×105 41.62
枯水期 厂站现行方式 1.41×106
LSTM-PSO 1.13×106 19.86
GPR-BWO 1.06×106 24.82
GPR-IBWO 9.89×105 29.86

3 结论与展望

(1)基于高斯过程回归对污水处理厂进出水水质与曝气流量之间的关系进行建模,该模型能够在设定置信水平预测出水水质的概率分布。与真实值对比,模型预测均值偏差较小、吻合度高;预测区间可靠性良好,以较窄平均宽度实现93%以上真实值覆盖。
(2)针对标准黑寡妇优化算法的不足进行改进,包括引入共享适应度、相似感知自适应交配、双模扰动变异机制及基于吸引法的边界修正机制。试验结果表明,相较于多种主流智能优化算法及初始版本的黑寡妇算法,改进后的黑寡妇算法在搜索能力和收敛速度上更优。
(3)依托高斯过程回归模型,构建了以曝气能耗最小化为目标、以出水水质在给定置信水平下满足排放标准为约束的优化问题,并对所得曝气优化策略在污水处理系统中进行了应用验证。试验结果显示,即使在外部负荷波动的情况下,出水水质仍能够稳定控制在设定阈值以下,验证了优化策略对随机干扰的良好鲁棒性。同时,通过精确曝气调控,优化策略显著降低了能耗,实现了较传统粗放式运行方式更高的能源利用效率。此外,在与GPR-BWO及LSTM-PSO现有的预测-优化框架的对比分析中,所提策略性能更优,进一步验证其在污水处理优化中的先进性。
(4)在污水处理厂实际应用中,长期运行过程中因工况变化可能导致预测模型与实际系统偏差,进而影响优化策略的有效性,为工程部署带来挑战。为解决此问题,建议定期校准模型,利用实时数据更新参数,维持预测精度;或引入控制理论中的扰动观测器,动态估计并补偿系统偏差,增强策略鲁棒性和适应性,确保长期运行下的优化效果。
[1]
NIU K, WU J, QI L, et al. Energy Intensity of Wastewater Treatment Plants and Influencing Factors in China[J]. Science of The Total Environment, 2019, 670:961-970.

DOI

[2]
陈宁, 王晓东, 吴宇行. 活性污泥模型变量与参数的律定及改进应用研究[J]. 给水排水, 2022, 58(增刊2): 230-240.

(CHEN Ning, WANG Xiao-dong, WU Yu-hang. Study on the Regulation and Improvement of Variables and Parameters of Activated Sludge Model[J]. Water & Wastewater Engineering, 2022, 58(Supp. 2): 230-240. (in Chinese))

[3]
陈霖, 刘浩威, 王庆宏, 等. 基于机器学习算法的炼化污水厂出水水质预测模型研究[J]. 工业水处理, 2025, 45(7): 81-93.

DOI

(CHEN Lin, LIU Hao-wei, WANG Qing-hong, et al. Research on the Prediction Model of Effluent Quality in Petrochemical Industries Wastewater Treatment Plants Based on Optimized Machine Learning Algorithms[J]. Industrial Water Treatment, 2025, 45(7): 81-93. (in Chinese))

DOI

[4]
余铭铨, 师浩铭. 基于LSTM模型的污水处理厂出水总氮预测研究[J]. 山东科学, 2024, 37(6): 116-124.

DOI

(YU Ming-quan, SHI Hao-ming. Prediction of Effluent Total Nitrogen in Wastewater Treatment Using LSTM Neural Network[J]. Shandong Science, 2024, 37(6): 116-124. (in Chinese))

DOI

[5]
李志峰, 熊伟丽. 基于多目标麻雀算法的污水处理过程优化控制[J]. 控制工程, 2025, 32(1): 76-85.

(LI Zhi-feng, XIONG Wei-li. Optimal Control of Wastewater Treatment Process Based on Multi-objective Sparrow Algorithm[J]. Control Engineering of China, 2025, 32(1): 76-85. (in Chinese))

[6]
何正磊, 胡丁丁. 基于多智能体强化学习的造纸污水多目标优化[J]. 化工学报, 2025, 76(4): 1617-1634.

(HE Zheng-lei, HU Ding-ding. Multi-objective Optimization of Papermaking Wastewater Based on Multi-agent Reinforcement Learning[J]. CIESC Journal, 2025, 76(4): 1617-1634. (in Chinese))

[7]
王洪臣. 我国城镇污水处理行业碳减排路径及潜力[J]. 给水排水, 2017, 53(3): 1-3, 73.

(WANG Hong-chen. Path and Potential of Carbon Emission Reduction in Urban Sewage Treatment Industry in China[J]. Water & Wastewater Engineering, 2017, 53(3): 1-3, 73. (in Chinese))

[8]
杨淦翔, 万莉, 王航, 等. 污水处理厂能耗分析及节能降耗的措施与应用[J]. 资源节约与环保, 2021(10):12-14.

(YANG Gan-xiang, WAN Li, WANG Hang, et al. Energy Consumption Analysis and Energy-Saving Measures in Wastewater Treatment Plants: Applications and Practices[J]. Resources Economiaztion & Environmental Protection, 2021(10): 12-14. (in Chinese))

[9]
王耀健, 顾洁, 温洪林, 等. 基于在线高斯过程回归的短期风电功率概率预测[J]. 电力系统自动化, 2024, 48(11):197-207.

(WANG Yao-jian, GU Jie, WEN Hong-lin, et al. Short-term Wind Power Probability Prediction Based on Online Gaussian Process Regression[J]. Automation of Electric Power Systems, 2024, 48(11): 197-207. (in Chinese))

[10]
HAN H, QIAO J. Nonlinear Model-predictive Control for Industrial Processes: an Application to Wastewater Treatment Process[J]. IEEE Transactions on Industrial Electronics, 2014, 61(4): 1970-1982.

DOI

[11]
LI R, JIN Y. A Wind Speed Interval Prediction System Based on Multi-objective Optimization for Machine Learning Method[J]. Applied Energy, 2018, 228: 2207-2220.

DOI

[12]
HAYYOLALAM V, POURHAJI KAZEM A A. Black Widow Optimization Algorithm: A Novel Meta-heuristic Approach for Solving Engineering Optimization Problems[J]. Engineering Applications of Artificial Intelligence, 2020, 87:103249.

DOI

[13]
BREST J, MAUCEC M S, BOSKOVI B. Single Objective Real-parameter Optimization: Algorithm jSO[C]// 2017 IEEE Congress on Evolutionary Computation (CEC). June 5-8, 2017, Donostia, Spain. New York: IEEE Press, 2017: 1311-1318.

[14]
LIU Y, TIAN W, XIE J, et al. LSTM-based Model-predictive Control with Rationality Verification for Bioreactors in Wastewater Treatment[J]. Water, 2023, 15(9): 1779.

DOI

Outlines

/