let us not love with words or tongue but actions and truth.

IT/음성인식

WFST Decoder

sarah0518 2023. 6. 7. 19:54

input symbol 있는 acceptor

 

input symbol이 없는 acceptor

 

weight 가중치를 적용한 acceptor

 

 

Weighted finite state transducer: 통역사

a: input symbol

x: output symbol

1: weight

 

 

Lexicon Transducer(L)

silence가 없는 L-transducer

 

silence가 있는 L-transducer

 

 

Context-dependency transducer(C)

짝을 맞추기위해 epsilon을 추가함

 

 

HMM topology transducer (H)

state 0은 160번째 cluster를 모델링한것이라는 뜻임

마이크에서 무슨 소리가 들어왔는지 몰라도,  

가지고 있는 학습자료를 통해 미리 만들어 놓을 수 있음

 

 

Utterance transducer(U)

Let S = U ◦ HCLG be called the search graph for an utterance

** HCLG는 마이크에서 무슨 소리가 들어왔는지 몰라도 미리 구축할 수 있음

 

 

HCLG를 생성하기 위한 알고리즘

1. Composition

2. Determinization

3. Minimization

 

'IT > 음성인식' 카테고리의 다른 글

Connectionist Temporal Classification  (0) 2023.06.14
언어 모델  (0) 2023.05.17
음향모델  (0) 2023.05.03
Multi-head attention  (0) 2023.05.03
Attention의 Q, K, V와 Transformer  (0) 2023.04.12