LSTM神经网络输入输出究竟是怎样的?
创始人
2024-11-08 04:18:30
LSTM神经网络输入输出究竟是怎样的?

常规feedforward输入和输出:矩阵输入矩阵形状:(n_samples,dim_input)输出矩阵形状:(n_samples,dim_output)注:真正测试/训练的时候,网络的输入和输出就是向量而已。加入n_samples这个维度是为了可以实现一次训练多个样本,求出平均梯度来更新权重,这个叫做Mini-batchgradientdescent。如果n_samples等于1,那么这种更新方式叫做StochasticGradientDescent(SGD)。Feedforward的输入输出的本质都是单个向量。常规Recurrent(RNN/LSTM/GRU)输入和输出:张量输入张量形状:(time_steps,n_samples,dim_input)输出张量形状:(time_steps,n_samples,dim_output)注:同样是保留了Mini-batchgradientdescent的训练方式,但不同之处在于多了timestep这个维度。Recurrent的任意时刻的输入的本质还是单个向量,只不过是将不同时刻的向量按顺序输入网络。所以你可能更愿意理解为一串向量asequenceofvectors,或者是矩阵。

相关内容

热门资讯

OpenAI面向早期AI创业者... AIPress.com.cn报道 1月9日,OpenAI宣布启动新一期 OpenAI Grove 计...
1月9日盛达资源涨6.08%,... 证券之星消息,1月9日盛达资源(000603)涨6.08%,收盘报34.7元,换手率5.88%,成交...
CES热议新词:“物理AI” 2026年美国拉斯维加斯消费电子展(CES)正在举行。作为国际消费电子领域的“风向标”,CES历来是...
AI技能成职场新筹码,报告显示... 当前,掌握AI技能已成为获得职场高薪的重要竞争力。 1月8日,猎聘大数据研究院发布的《2025年中国...
ETF盘中资讯|国产AI果然补... 1月9日,国产AI延续强势上涨态势,重点布局国产AI产业链的科创人工智能ETF华宝(589520)场...