なんとな～くしあわせ？の日記

「そしてそれゆえ、知識そのものが力である」 (Nam et ipsa scientia potestas est.) 〜フランシス・ベーコン

torch.nn.LSTMのややこしいパラメータ

機械学習 Python

torch.nn.LSTMのややこしいパラメータ

LSTMに渡すテンソルはどうするのが正しい？

LSTMに渡すinputは, ３次元のテンソル「文章の長さ × バッチサイズ × ベクトル次元数」, とQiitaにある
- PyTorchを使ってLSTMで文章分類を実装してみた - Qiita

StackOverflowで見ると「バッチサイズ × 文章の長さ × ベクトル次元数」とある
- python - Understanding input shape to PyTorch LSTM - Stack Overflow

公式ガイドで見ると、「文章の長さ × バッチサイズ × ベクトル次元数」とある

input of shape (seq_len, batch, input_size): tensor containing the features of the input sequence. The input can also be a packed variable length sequence.

結論

どっちやねん、と思ったがデフォルトでは「文章の長さ × バッチサイズ × ベクトル次元数」
`batch_first=True` に設定すると「バッチサイズ × 文章の長さ × ベクトル次元数」ということらしい

batch_first – If True, then the input and output tensors are provided as (batch, seq, feature). Default: False