let us not love with words or tongue but actions and truth.
728x90

IT 159

TCP/IP Network Model

각 계층에서 사용하는 주소들 통신에서의 주요 3개 기관 IEEE, 3GPP(1, 2계층 관련 기관) - 유선 IETF (3, 4 계층 관련 기관) - 무선 2계층 header + 3계층 header + 4계층 header가 붙어있음 2계층 header (Ethernet) 6+6+2로 구성되어있는데 처음 6은 destination physical address(상대방 물리적 주소) 임 중간 6은 source physical address(나의 물리적 주소) 임 마지막2은 type을 나타냄 이런 구조를 IEEE802.3( IEEE 802.3 Ethernet frame structure) 이라고 명명함 사용하는 범위: LAN(나름 가까운 범위)에서 사용함 Physical Address Physical Addr..

IT/사물인터넷 2023.03.21

음성신호처리 개론2

 Three spectral analysis techniques 1. FFT: contiunous spectrum을 contiunuous wave form으로 바꾸는 것 FFT를 하기위해 2의 지수승으로 바꿔야 됨(0으로 padding함) 그러면 DFT 보다 빠르게 처리할 수 있어서 Fast Fourier transform이라고 함 참고) DFT란? (Discrete Fourier transform) 입력 신호(wave form)를 디지털 신호로 바꾸는 것(=DFT)은 아래와 같음 1. sampling 함 2. sample을 discrete하게 변환하는 것임 2. LPC (linear predictive coding) filter의 coefficient를 분석하는 것 (vocal tract의 coeff..

입/출력 end 복잡도 분석

2.1 음성 신호 저장 방법 및 시스템 입력 음성 신호의 저장 방법 (sampling rate: 16K, Sample 당 byte수 ) 1. sampling rate: 단위 시간당(초당) sampling의 횟수 음질이 안좋으면 sampling rate이 낮음 유선전화는 1초당 8k임 음성인식의 sampling rate: 16k (초당 16000번 sampling 하는 것임) 2. Sample 당 byte수 ⁻ Sample당 2byte 사용 2^16 = 65,536 (1초의 음성을 녹음하면 16000*2byte의 저장용량 필요) ** 참고 왜 window별로 feature를 추출하는가? 추출해야하는 항목들 - frequency, 증폭, 위성(sin곡선이 x축기준으로 얼마나 움직이는가) - stationar..

IT/음성인식 2023.03.15

사물인터넷 및 Network model

[Introduction] 국내 주요 IoT망 기술 비교 대역폭은 고속도로의 폭과 같음 대역폭이 좁으면 전송 속도도 안나옴 20MHz정도면 4000억정도 투자하여 국가에서 주파수 대역을 임대함 LTE는 면역대역의 주파수이며 LoRa/NB-IoT는 비면허대역임 국외 주요 IoT망 기술 비교 1. Google Cloud IoT - MQTT 프로토콜 사용, Android OS(무거움)을 사용 2. NXP: 자동차 반도체칩에 주요 납품업체임(top2) NXP Modular IoT Framework - AWS platform을 사용함 NXP os가 따로 있고 그것을 AWS platform에 올리는 구조임 [Network model] https://www.youtube.com/@soclasstv/about 소클래스..

IT/사물인터넷 2023.03.14

음성신호처리 개론

음성 신호 기본 개념 vocal cord: 성대 amplitude: 진폭 frequency: 주파수 resonant: 공진주파수 Fourier 변환: 신호에서 sin주기를 나타내는 신호가 몇개가 있는지 분해해 내는 것 시간축에서 주기가 P일 때, 주파수 도메인에서는 주기가 1/p임 source를 입력받아 filter를 거쳐 speech sequence 형태로 바꾸는 것 filter는 time varying 특성이 있는데, 가나다를 발음 할 때마다 volcal tract과 혀의 위치가 바뀌기 때문임 (즉, filter = vocal tract) Analysis-synthesis system이란? ▫ Analyze the speech production mechanism. ▫ Separate the sour..

음성인식 개론 - 특징

음성인식의 특징 음성(continuous)인식에서 각 문자열을 index의 열로 변환하는 경우 discrete한 열로 변환하는 작업임 → 대소비교가 불가능하다는 특징이 있음 언어 번역시 입력과 출력의 length는 다름 → 하지만 어느정도의 길이는 비슷하게 된다는 특징이 있음 음성에서는 입력 sequence에서 출력 sequence로 변형되는 경우 출력 sequence가 훨씬 짧다는 특징이 있음 → 출력 sequence는 20ms로 출력하기 때문임 음성인식률, 메모리 사용량, 반응속도와의 trade off관계가 있음 음성인식의 특징 결론 1. continuous한 입력 sequence(vector)를 discrete(단어 index의 열)한 것으로 변경하는 것임 → 입력 sequence에서 출력 sequ..

IT/음성인식 2023.03.08

군집화

nominal data(명칭)는 거리측정이 불가능함 distance metric - 유클리디언 거리(L2-distance) - 맨하탄 거리(L1-distance) - Hamming 거리(이진 벡터에 적용 가능: 서로다른 비트의 개수) - 코사인 유사도(문서 검색 응용에서 주로 사용) 작을 수록 similarity가 커지는 것임 - 이진 특징 벡터의 유사도 점과 군집사이의 거리측정 1 점과 군집사이의 거리측정 2 아래 내용 시험! 두 군집 사이의 거리 동적거리 측정 방법 샘플마다 특징 벡터의 크기가 다른 경우  예) 온라인 필기 인식, DNA 열  (6.3 절의) 교정 거리 활용 = Levenshtein edit distance 군집화 알고리즘  계층 군집화: 군집 결과를 계층을 나타내는 덴드로그램으..

IT/패턴인식 2022.12.15

특징 선택

부류내 분산은 작고 부류간 분산은 크게 해줄수록 좋은 특징 벡터 즉, Sb/Sw 값이 큰게 좋은 것임 분별력을 측정하는 3가지 방법 1. 다이버전스 2. 훈련 샘플의 거리 3. 분류기 성능 KL 다이버전스 분별력이 큰 경우는 (b) 경우임 - 두 분포가 완전히 겹치면 위의 값을 1을 가짐 두 분포가 같다면(유사하다면) P(k)=Q(k)이므로 sum(P(k)) = 1이 됨 - KL 다이버전스는 거리개념과 유사하므로, 값이 클수록 분류가 잘 됨 훈련 샘플의 거리 구하는 방법 [훈련 샘플의 거리 구하는 예시] 분류기로서의 SVM 장점: 분류기에 딱 맞는 특징벡터를 찾아낼 수 있음 단점: 분류기 훈련시 계산시간이 많이 걸림 특징 선택 시, 고려해야할 것 1. 중복되는 특징벡터 사용시 단점 중복이 되므로 성능향상..

IT/패턴인식 2022.12.14
728x90