let us not love with words or tongue but actions and truth.

IT/음성신호처리

Short-Time Fourier Analysis

sarah0518 2023. 5. 4. 22:06

• Short-Time Fourier Transform 특징

▫ Short-time windows

▫ Quasi-stationary

▫ Nonparametric

▫ No model-based

▫ Cf. model-based methods: Linear prediction, homomorphic filtering

 

 

 

The short-time transform

The short-time transform는 위의 수식과 같이 정의 되는데,

그 뜻은

1번은 2번으로 좌우 대칭 시킨 후, 3번과같이 n만큼 평행 이동(delay)시킨다는 내용임

 

 

 

Short-Time Fourier Transform

The short-time transform와 Short-Time Fourier Transform의 차이점은

아래 노란색으로  표시한 부분임

 

 

** 아래 내용 참고

 

 

Time and Frequency Decimation

 

Time-Frequency Resolution Tradeoffs

fn [m] = x[m] w[n-m]

:  x[m]에 flipping하고 delay하는 window를 씌워주는 것임

 

1번은 왼쪽에서부터 고주파이다가 저주파로 변하는 형태인데,

이것을 분해하기위해 2번은 resolution을 매우 좁게,

3번은 적당히, 4번은 resolution을 넓게 가져간 것임

4번같은 경우, 봉우리에 저주파, 중간주파, 고주파가 나타나서

삐죽빼죽하게 나타나게 됨

따라서, 3번과 같이 적절한 windowing function을 선택해야함

 

 

→ windown 사이즈를 넓게하면 (b)와 같이 너무 퍼져 보일 수 있음

 

 

tradeoff의 결론

STFT : Time-frequency resolution trade-offs

▫ Uncertainty principle

▫ Short window : good temporal resolution but poor frequency resolution

▫ Long window : good frequency resolution but poor time resolution

 

 

tradeoff의 해결책

• Constant-Q resolution

▫ Time resolution increases and frequency resolution decreases with increasing frequency.

▫ Higher frequency, wider bandwidth

▫ This is the concept of the wavelet transform.

frequency가 증가함에 따라서 bandwith가 나빠지는데, 

이러한 개념을 가지고 wavelet transform을 고안해냄.

 

 

 

Wavelet Transform

(설명 다시듣기...)

 

 

아래의 signal을 분석하기위해 가상 이상적인 결과는 5번과 같은 결과임

1~4은 어떠한 timewindowing도 적절히 5번과 같은 결과를 가져오지 못함

따라서 Wavelet Transform을 적용하는 방법으로 해결하려고 함

 

 

Continuous Wavelet Transform

basic wavelet h(t) 수식: 

Time shift τ and the scaling factor a.

 

 

CWT의 정의

 

 

아래 그림에서 1~3 비교 다시듣기..ㅠㅠ

 

 

 

 

Discrete Wavelet Transform

scale(Tau) and shift(a)

 

 

아래내용 다시듣기....

 

 

 

Comparison of STFT and DWT

 

 

 

Gamma-Tone Filter

1) gamma모양의 파형에

2) 일정한 tone을 곱해주면

3) 3번과 같은 결과가 나오는데 이것을 gamma-tone filter라고 함

 

 

All -pole gamma -tone filter (APGF) : 구현이 쉬움

저주파에서는 아래그림과 같이 거의 constant하게 표현 됨

 

 

Mel-Frequency Filter Bank

 0-1kHz: linearly-spaced center frequency (100Hz)

• 1kHz-8kHz: Mel-scaled center frequency

 

 

 

Summary(아래 내용 중요함)

• Filter bank

▫ Time-frequency resolution trade-offs

▫ Short window : good temporal resolution but poor frequency resolution

▫ Long window : good frequency resolution but poor time resolution

• Wavelet transform

▫ Low frequency region: High frequency resolution, low temporal resolution

▫ High frequency region: Low frequency resolution, high temporal resolution

▫ Dyadic (or octave) sampling

▫ Nonuniform filter bank

▫ Quadrature mirror filters(QMF)

아래 그림과 같이 G와 H가 mirroring되어 있는 것임

'IT > 음성신호처리' 카테고리의 다른 글

Diphone Recording  (0) 2023.06.08
Pitch & Vocoder  (0) 2023.05.25
Homomorphic Processing  (0) 2023.05.03
Psychoacoustics 심리음향  (0) 2023.04.20
Sound Waves and Wave Equation  (0) 2023.04.13