图1为 LSTM 结构图,其中,
xt表示当前时间步的输入向量;
yt-1为上一个时间步的输出(即上一时刻的隐藏状态);
St-1代表上一个时间步的细胞状态(长期记忆,贯穿整个序列的 “记忆通道”);
ft是遗忘门的输出(由 Sigmoid 激活,范围(0,1),控制丢弃
St-1中信息的比例);
it为输入门的输出(由 Sigmoid 激活,范围(0,1),控制新信息存入细胞状态的比例);
${\stackrel{~}{S}}_{t}$表示候选细胞状态(由Tanh激活,范围(-1,1),是当前时间步的新信息候选);
Ot为输出门的输出(由 Sigmoid 激活,范围(0,1),控制细胞状态输出的比例);
St代表当前时间步的细胞状态(更新后的长期记忆,公式:
St=
ft☉
St-1+
it☉
${\stackrel{~}{S}}_{t}$,☉为元素乘);
yt为当前时间步的隐藏状态 / 输出(短期记忆,公式:
yt=
Ot☉(
St);
σ表示 Sigmoid 函数(用于门控,输出 “开关” 信号);tanh为双曲正切函数(用于调节信息强度,输出范围(-1,1)。LSTM作为基础模型,能够有效提取污水处理厂进水水质的时序特征,实现对未来水质指标的多步预测。使用LSTM进行预测的具体流程为: