let us not love with words or tongue but actions and truth.

IT/음성신호처리

Sound Waves and Wave Equation

sarah0518 2023. 4. 13. 22:25

Spherical wave equation

3차원 좌표에서 구를 그리고, 그 구위의 point를

2개의 각도(x, y 의 각도와 높이를 알수있는 고도를 표시하는 각도)와 반지름으로 나타낼 수 있음

 

** pressure의 크기는 거리에 반비례함

 

Intensity:

단위 시간동안 단위면적을 지나는 sound의 energy의 양

 = pressure * velocity

그러므로 v=p/(ρc) 임

 

 

spherical wave에서는 아래와 같은 특성을 가짐

 

 

u와 v의 차이 참고

v: particle velocity

u: 면적 velocity

 

 

Decibel Sound Levels

 

 

Sound pressure level (SPL) and intensity level

W: watt임

10^(-12)는 사람이 들을수 있는 가장 낮은 에너지(작은소리)라고 생각하면 됨

N/m2: 단위면적당 힘을 나타낼 때 쓰는 단위

 

 

SPL of the sound wave

(40cm떨어져 있는 위치에서 1m2에 대한 SPL을 기준으로함)

 

Absorption: 

매질이 다른 2개를 통과하는 상황에서

일부는 통과 하게 되고, 일부는 반사됨 

이때, 흡수되는 소리도 있는데 주로 high frequency에서 더 많이 absorption이 일어남

( Absorption coefficients 이 크다 = 더 많이 흡수된다)

** 매질이 다른 것이 아니어도 공기중에서도 흡수가 일어남

   (하지만 너무 작게 흡수되어 보통 무시하는 요소임)

유리에서는 absorption이 거의 안 일어남

 

 

 

Pattern of reflections (잔향 = reverberation)

거리에 반비례하여 감소함(=exponentially)

 

 

Reverberation Time 

: 소리의 반사가 얼마나 심한지 측정할 수 있는 것

참고) RT60: 소리가 60db까지 줄어드는데 걸리는 시간을 뜻함

S: 표면적의 총합

V: 공간의 볼륨

a: 평균 Absorption coefficients

 

 

Reverberation의 특징

▫ When the reverberation energy is large, syllable onsets(=음절의 시작점) and identities

can be masked by decaying energy from previous syllables.

소리가 크면 그 다음 음절이 나왔을 때 그 다음 음절이 묻힐(=masking) 수 있다.

 Hurt intelligibility, particularly when combined with noise.

→ 반향이 발생하면 ( RT가 크면 intelligibility를 약화시킴)

 

 

Reverberation를 계산하는 법

echo response와 source signal의 선형 곱

 

 

Estimation of the impulse response in a real room

1. white noise나 pseudo random noise를 사용하여 계산

2. chirp를 사용

chirp 신호 모양: 시간에 따라 주파수가 달라짐

 

 

Reverberation 정리

- Reverberation은 loudness를 증가시킴

- loudness에 따라 Intelligibility가 증가하게 됨

- Early reflections 은 화자와 청자의 거리(=intimacy), 방의 사이즈를 추정하는데 도움이 됨

- Room acoustics: reverberation는 SNR을 증가시키면서 Intelligibility도 향상 시킴

                              Long reverberation hurts intelligibility

 

** loudness: 물리적인 값으로 소리의 에너지가 센지, 약한지 나타냄 (주관적임)

(intensity: 소리의 정도 및 크기)

** Intelligibility: 명료도

** Early reflections (in the first 80-100 ms)

** 초반의 반향은 syllable의 명료도를 증가시킴

 

 

 

음성신호에서의 반향문제 해결 방법

- Microphone arrays를 활용

1번끼리는 위상의 차이가 없으나, 2번(반향)은 위상의 차이가 있다는 것을 

중점으로 반향과 noise를 제거하는 방법을 사용함

 

 

'IT > 음성신호처리' 카테고리의 다른 글

Homomorphic Processing  (0) 2023.05.03
Psychoacoustics 심리음향  (0) 2023.04.20
Human Auditory System  (0) 2023.04.12
speech production  (0) 2023.04.07
wave basic  (0) 2023.04.06