let us not love with words or tongue but actions and truth.

IT/음성인식 11

Feed Forward Neural Net

위의 경우 net(h1) = 0.05*0.15+0.10*0.20 + 1*0.35 out(h1) 는 아래와 같이 구함 ** epoch이 한번 돌때마다 weight가 업데이트 됨 Total error 계산방법 Back-propagation 예를 들어, 𝑤(ℎ1,𝑜1)를 update한다면 𝑤(ℎ1,𝑜1)값에서 아래 값을 빼서 update함 위의 편미분은 chain rule를 적용하여 아래와 같이 풀 수 있음 위의 우변 첫번째 항은 우변의 두번째 항은 마지막 우변의 세번째 항은 따라서,

IT/음성인식 2023.03.22

입/출력 end 복잡도 분석

2.1 음성 신호 저장 방법 및 시스템 입력 음성 신호의 저장 방법 (sampling rate: 16K, Sample 당 byte수 ) 1. sampling rate: 단위 시간당(초당) sampling의 횟수 음질이 안좋으면 sampling rate이 낮음 유선전화는 1초당 8k임 음성인식의 sampling rate: 16k (초당 16000번 sampling 하는 것임) 2. Sample 당 byte수 ⁻ Sample당 2byte 사용 2^16 = 65,536 (1초의 음성을 녹음하면 16000*2byte의 저장용량 필요) ** 참고 왜 window별로 feature를 추출하는가? 추출해야하는 항목들 - frequency, 증폭, 위성(sin곡선이 x축기준으로 얼마나 움직이는가) - stationar..

IT/음성인식 2023.03.15

음성인식 개론 - 특징

음성인식의 특징 음성(continuous)인식에서 각 문자열을 index의 열로 변환하는 경우 discrete한 열로 변환하는 작업임 → 대소비교가 불가능하다는 특징이 있음 언어 번역시 입력과 출력의 length는 다름 → 하지만 어느정도의 길이는 비슷하게 된다는 특징이 있음 음성에서는 입력 sequence에서 출력 sequence로 변형되는 경우 출력 sequence가 훨씬 짧다는 특징이 있음 → 출력 sequence는 20ms로 출력하기 때문임 음성인식률, 메모리 사용량, 반응속도와의 trade off관계가 있음 음성인식의 특징 결론 1. continuous한 입력 sequence(vector)를 discrete(단어 index의 열)한 것으로 변경하는 것임 → 입력 sequence에서 출력 sequ..

IT/음성인식 2023.03.08