
0 引言
1 模型构建与评价
1.1 常用算法的优缺点
表1 常用算法及其优缺点对比Table 1 Comparison of common algorithms and their advantages and disadvantages |
| 名称 | 简称 | 用途 | 优点 | 缺点 | |
|---|---|---|---|---|---|
| 线性回归 | LR | 数据 拟合 | 结构简单,计算复杂度较低 | 应用场景有限,无法解决非线性问题 | |
| 多元线性 回归 | MLR | 可以考虑多个特征变量,模型结构简单,建模速度快 | 回归因子的选择具有不确定性,且对结果影响较大 | ||
| 后向传 播神经 网络 | BP | 数据 分类 及拟合 | 具有实现任何复杂非线性映射的功能,具有一定的自学习能力 | 学习速度较慢,容易陷入局部极值,预测结果具有较大的不确定性 | |
| 埃尔曼 神经 网络 | Elman | 动态反馈型网络,在计算能力及网络稳定性方面优于BP神经网络 | 训练速度慢;容易陷入局部极小点,预测结果具有一定的不确定性 | ||
| 径向基 神经 网络 | RBF | 逼近能力和学习速度均优于BP神经网络,结构简单、学习收敛速度快 | 计算复杂度较高,基函数选择具有经验性 | ||
| 广义回 归神经 网络 | GRNN | 具有很强的非线性映射能力和学习速度,样本较小时也具有自稳定性 | 由于全部样本参与每次计算,故计算复杂度和空间复杂度均较高 | ||
| 支持 向量机 | SVM | 小样本训练集上逼近能力和稳定性优势明显,具有优秀的泛化能力 | 基函数的选择需要一定的经验性 | ||
1.2 特征自适应优选模型
1.3 模型评价方法
2 分析与讨论
2.1 研究区域及数据
2.2 FAO模型结果分析
表2 不同模型预测结果对比Table 2 Comparison of prediction results among different models |
| 模型 名称 | 参与计算的 单元格数 | 参与计算的 单元格编号 | RMSE/ (m3·s-1) | R2 |
|---|---|---|---|---|
| LR | 40 | 全部 | 13.99 | 0.68 |
| MLR | 40 | 全部 | 10.50 | 0.76 |
| MLR-20 | 20 | {10~29} | 10.22 | 0.78 |
| PCA-MLR | 40 | 降维后的3维特征 | 10.09 | 0.79 |
| BP | 40 | 全部 | 14.44 | 0.64 |
| Elman | 40 | 全部 | 9.68 | 0.82 |
| RBF | 40 | 全部 | 11.16 | 0.77 |
| GRNN | 40 | 全部 | 10.09 | 0.83 |
| SVM | 40 | 全部 | 8.63 | 0.86 |
| FAO | 11 | {5,9,12,15,17,19, 21,24,26,28,35} | 6.06 | 0.93 |
2.3 讨论
2.3.1 不同算法的稳定性
2.3.2 FAO模型的适用性
图7 2023年FAO模型计算值与实测流量过程对比Fig.7 Comparison of FAO model calculated values and measured flow process in 2023 |
表3 不同计算模式测流精度对比Table 3 Comparison of FAO model’s accuracy with different calculation modes |
| 模型 名称 | FAO 计算模式 | 计算方法 | 输入变量 | RMSE/ (m3·s-1) | R2 |
|---|---|---|---|---|---|
| LR | 传统方法 | 线性 回归法 | 所有网格 流速均值 | 18.21 | 0.57 |
| MLR | 传统方法 | 多元线性 回归法 | 主流附近 20个网格 流速 | 16.34 | 0.65 |
| PCA | 无特征自 适应优选 | PCA特征降 维回归法 | 降维后的 3个特征 | 12.53 | 0.71 |
| SVM | 无PCA 算法 | 单一机器 学习算法 | 所有网格 流速 | 9.16 | 0.82 |
| FAO | 全模式 | 本文算法 | 优选的11个 网格流速 | 6.02 | 0.91 |
