
0 引言
1 问题描述与模型建立
1.1 目标函数
1.2 约束条件
2 耦合强化学习与差分进化的智能算法
2.1 标准DE算法
2.1.1 初始化
2.1.2 变 异
2.1.3 交 叉
2.1.4 选择
2.2 Q-learning算法
2.3 耦合强化学习与差分进化的智能算法
2.4 RLDE算法求解梯级水库发电调度优化问题
2.4.1 约束处理策略
2.4.2 具体求解流程
3 工程实例
3.1 实例概况
3.2 实例分析1
表2 采用不同缩放因子的DE算法优化结果Table 2 Optimization results of DE algorithm withdifferent scaling factors |
| 缩放因子F | 平均发电量/ (亿kW·h) | 最优发电量/ (亿kW·h) | 标准差/ (亿kW·h) |
|---|---|---|---|
| 0.8 | 2 150.35 | 2 158.06 | 6.05 |
| 0.6 | 2 132.22 | 2 149.95 | 10.77 |
| 0.4 | 2 067.76 | 2 100.91 | 23.20 |
| 0.2 | 2 020.30 | 2 045.15 | 22.77 |
表3 不同来水情况下各算法运行结果均值对比Table 3 Comparison of mean results of algorithms under different water supply scenarios |
| 来水 情况 | 算法 名称 | 平均值/ (亿kW·h) | 绝对提升量/ (亿kW·h) | 相对提升 量/% |
|---|---|---|---|---|
| DE | 2 150.35 | 39.65 | 1.84 | |
| 平水年 | AGA | 2 146.03 | 43.97 | 2.05 |
| RLDE | 2 190.00 | |||
| DE | 2 300.89 | 40.37 | 1.75 | |
| 丰水年 | AGA | 2 302.12 | 39.14 | 1.70 |
| RLDE | 2 341.26 | |||
| DE | 1 986.54 | 49.03 | 2.47 | |
| 枯水年 | AGA | 1 987.22 | 48.34 | 2.43 |
| RLDE | 2 035.56 |
注:绝对提升量及相对提升量均为RLDE算法相较其他算法的对比结果。 |
表4 不同来水情况下各算法运行统计结果Table 4 Statistical results of each algorithm under different water supply scenarios |
| 来水 情况 | 算法 名称 | 最优值 | 平均值 | 最差值 | 极差 | 标准 差 | 平均执行 时长/s |
|---|---|---|---|---|---|---|---|
| DE | 2 158.06 | 2 150.35 | 2 139.00 | 19.07 | 6.05 | 2.20 | |
| 平水年 | AGA | 2 161.90 | 2 146.03 | 2 133.64 | 28.25 | 9.50 | 3.10 |
| RLDE | 2 190.62 | 2 190.00 | 2 189.01 | 1.62 | 0.54 | 3.90 | |
| DE | 2 313.85 | 2 300.89 | 2 282.26 | 31.59 | 10.09 | 2.00 | |
| 丰水年 | AGA | 2 312.11 | 2 302.12 | 2 290.00 | 22.10 | 8.41 | 3.00 |
| RLDE | 2 343.21 | 2 341.26 | 2 339.93 | 3.28 | 1.00 | 3.70 | |
| 枯水年 | DE | 2 001.72 | 1 986.54 | 1 970.13 | 31.59 | 8.33 | 2.50 |
| AGA | 1 997.98 | 1 987.22 | 1 970.38 | 27.60 | 10.00 | 3.00 | |
| RLDE | 2 036.78 | 2 035.56 | 2 033.53 | 3.25 | 1.07 | 4.00 |
注:最优值、平均值、最差值、极差标准差单位均为亿kW·h。 |
3.3 实例分析2
表5 不同情景寻优过程对比Table 5 Comparison of optimization processes for different scenarios |
| 方案 | 不同进化代数梯级发电量/(亿kW·h) | 方法 | |||||||
|---|---|---|---|---|---|---|---|---|---|
| 1 | 100 | 200 | 300 | 400 | 450 | 480 | 500 | ||
| 1 | 有破坏 | 2 165.70 | 2 167.80 | 2 167.86 | 2 167.86 | 2 167.86 | 2 167.86 | 2 167.86 | DE |
| 2 | 1 936.83 | 2 122.12 | 2 149.32 | 2 160.41 | 2 164.98 | 2 165.05 | 2 168.33 | 2 168.33 | AGA |
| 3 | 1 928.94 | 2 168.51 | 2 191.21 | 2 195.72 | 2 199.34 | 2 199.96 | 2 200.13 | 2 200.29 | 简单RLDE |
| 4 | 1 928.94 | 2 168.51 | 2 191.21 | 2 195.72 | 2 199.34 | 2 200.01 | 2 200.20 | 2 200.33 | RLDE+步长策略 |
| 5 | 1 963.49 | 2 155.80 | 2 192.36 | 2 198.30 | 2 200.34 | 2 200.61 | 2 200.70 | 2 200.74 | RLDE +步长策略+ 初始化策略 |
