• Short-Time Fourier Transform 특징
▫ Short-time windows
▫ Quasi-stationary
▫ Nonparametric
▫ No model-based
▫ Cf. model-based methods: Linear prediction, homomorphic filtering
The short-time transform
The short-time transform는 위의 수식과 같이 정의 되는데,
그 뜻은
1번은 2번으로 좌우 대칭 시킨 후, 3번과같이 n만큼 평행 이동(delay)시킨다는 내용임
Short-Time Fourier Transform
The short-time transform와 Short-Time Fourier Transform의 차이점은
아래 노란색으로 표시한 부분임
** 아래 내용 참고
Time and Frequency Decimation
Time-Frequency Resolution Tradeoffs
fn [m] = x[m] w[n-m]
: x[m]에 flipping하고 delay하는 window를 씌워주는 것임
1번은 왼쪽에서부터 고주파이다가 저주파로 변하는 형태인데,
이것을 분해하기위해 2번은 resolution을 매우 좁게,
3번은 적당히, 4번은 resolution을 넓게 가져간 것임
4번같은 경우, 봉우리에 저주파, 중간주파, 고주파가 나타나서
삐죽빼죽하게 나타나게 됨
따라서, 3번과 같이 적절한 windowing function을 선택해야함
→ windown 사이즈를 넓게하면 (b)와 같이 너무 퍼져 보일 수 있음
tradeoff의 결론
STFT : Time-frequency resolution trade-offs
▫ Uncertainty principle
▫ Short window : good temporal resolution but poor frequency resolution
▫ Long window : good frequency resolution but poor time resolution
tradeoff의 해결책
• Constant-Q resolution
▫ Time resolution increases and frequency resolution decreases with increasing frequency.
▫ Higher frequency, wider bandwidth
▫ This is the concept of the wavelet transform.
frequency가 증가함에 따라서 bandwith가 나빠지는데,
이러한 개념을 가지고 wavelet transform을 고안해냄.
Wavelet Transform
(설명 다시듣기...)
아래의 signal을 분석하기위해 가상 이상적인 결과는 5번과 같은 결과임
1~4은 어떠한 timewindowing도 적절히 5번과 같은 결과를 가져오지 못함
따라서 Wavelet Transform을 적용하는 방법으로 해결하려고 함
Continuous Wavelet Transform
basic wavelet h(t) 수식:
Time shift τ and the scaling factor a.
CWT의 정의
아래 그림에서 1~3 비교 다시듣기..ㅠㅠ
Discrete Wavelet Transform
scale(Tau) and shift(a)
아래내용 다시듣기....
Comparison of STFT and DWT
Gamma-Tone Filter
1) gamma모양의 파형에
2) 일정한 tone을 곱해주면
3) 3번과 같은 결과가 나오는데 이것을 gamma-tone filter라고 함
All -pole gamma -tone filter (APGF) : 구현이 쉬움
저주파에서는 아래그림과 같이 거의 constant하게 표현 됨
Mel-Frequency Filter Bank
• 0-1kHz: linearly-spaced center frequency (100Hz)
• 1kHz-8kHz: Mel-scaled center frequency
Summary(아래 내용 중요함)
• Filter bank
▫ Time-frequency resolution trade-offs
▫ Short window : good temporal resolution but poor frequency resolution
▫ Long window : good frequency resolution but poor time resolution
• Wavelet transform
▫ Low frequency region: High frequency resolution, low temporal resolution
▫ High frequency region: Low frequency resolution, high temporal resolution
▫ Dyadic (or octave) sampling
▫ Nonuniform filter bank
▫ Quadrature mirror filters(QMF)
→ 아래 그림과 같이 G와 H가 mirroring되어 있는 것임
'IT > 음성신호처리' 카테고리의 다른 글
Diphone Recording (0) | 2023.06.08 |
---|---|
Pitch & Vocoder (0) | 2023.05.25 |
Homomorphic Processing (0) | 2023.05.03 |
Psychoacoustics 심리음향 (0) | 2023.04.20 |
Sound Waves and Wave Equation (0) | 2023.04.13 |