LSTM神经网络输入输出究竟是怎样的?
创始人
2024-11-08 04:18:30
LSTM神经网络输入输出究竟是怎样的?

常规feedforward输入和输出:矩阵输入矩阵形状:(n_samples,dim_input)输出矩阵形状:(n_samples,dim_output)注:真正测试/训练的时候,网络的输入和输出就是向量而已。加入n_samples这个维度是为了可以实现一次训练多个样本,求出平均梯度来更新权重,这个叫做Mini-batchgradientdescent。如果n_samples等于1,那么这种更新方式叫做StochasticGradientDescent(SGD)。Feedforward的输入输出的本质都是单个向量。常规Recurrent(RNN/LSTM/GRU)输入和输出:张量输入张量形状:(time_steps,n_samples,dim_input)输出张量形状:(time_steps,n_samples,dim_output)注:同样是保留了Mini-batchgradientdescent的训练方式,但不同之处在于多了timestep这个维度。Recurrent的任意时刻的输入的本质还是单个向量,只不过是将不同时刻的向量按顺序输入网络。所以你可能更愿意理解为一串向量asequenceofvectors,或者是矩阵。

相关内容

热门资讯

“船长未来”公益基金在京启航 ... 央广网北京12月28日消息(记者 庞婷)12月27日,一场聚焦人工智能时代未来走向的高端对话与公益行...
赵何娟对话张雷:能源成本再降5... “人工智能,或许就是能量找到了自主意识。” 12月18日,在钛媒体2025 T-EDGE全球对话「赵...
武大AUI指数研究院徐鲁:AI... 12月26日,2025上证(无锡)新质生产力研讨会暨第七届上证最佳分析师评选颁奖仪式在江苏省无锡市举...
年度“牛股”:528只翻倍股出... 2025年的A股市场就将迎来收官,回首全年,A股市场产生了528只翻倍股,数量是2024年的4倍多。...
AI定格|2025·人间微光 2025,岁末回望,街头巷尾的善意悄然流淌,平凡日常的温暖直抵心房。 画面由AI生成 这一年的每一...