Long short-term memory (1997) [pdf]
本論文は、再帰型ニューラルネットワークにおける長期依存関係の学習問題を解決するために、LSTM(Long Short-Term Memory)アーキテクチャを提案する。従来のRNNが勾配消失・爆発問題に悩まされていたのに対し、LSTMはメモリセルとゲート機構を導入することで、長期間にわたる情報の保持と学習を可能にした。この革新的なアーキテクチャは、現在では自然言語処理や音声認識をはじめとする多くの機械学習分野で広く採用されている基礎技術である。