728x90
sequence modeling 종류
Recurrent Neural Networks
tanh함수를 주로 사용함
tanh를 사용하는 이유
: gradient(미분값의 range가 0~1임)를 더 크게 가져가기 위해서임
** sigmoid는 미분값의 range가 0~0.2x밖에 안됨
Update Hidden State
아래와 같은 식을 통해 update함
728x90
'IT > 음성인식' 카테고리의 다른 글
Attention의 Q, K, V와 Transformer (0) | 2023.04.12 |
---|---|
Vanilla RNN & Seq2seq & attention (0) | 2023.04.05 |
Feed Forward Neural Net (0) | 2023.03.22 |
입/출력 end 복잡도 분석 (0) | 2023.03.15 |
음성인식 개론 - 특징 (0) | 2023.03.08 |