let us not love with words or tongue but actions and truth.
728x90

전체 글 178

Connectionist Temporal Classification

Connectionist Temporal Classification: End-to-End의 초석이 되는 모델 입력에 대한 출력의 alignment가 제공됨 각각의 입력에 대하여 time-synchronous 출력이 있고 loss를 구할 수 있으므로 학습 가능 입력에 대한 다양한 time-synchronous alignments들은 asynchronous unaligned “compressed” sequence로 표현 가능 가능한 경로는 위와 같이 표현 ◼하나의 most probable path만을 alignment로 사용할 경우 - 학습 초기 alignment의 영향을 크게 받음 - Neural network의 초기 output에 따라 잘못된 학습을 할 수 있음 ◼ CTC (Connectionist Te..

IT/음성인식 2023.06.14

시험전 총정리

주파수, bandwidth, wifi, Bluetooth, zigbee, (nfc), lte-m, NB-iot, [LoRA] 중요 LoRA에 관한것도 따로 시험 나옴 [진화] evolution에서는 3GPP의 진화만 알면됨 유럽중심의 이동통신 -> 2세대 -> 3세대(2000년 WCDMA) -> 4세대 **lte는 위의 2번과 3번을 service로 제공할 수 없음** [WIFI ] - 4개만 기억하면 됨 IEEE 802.11 표준 규격 IEEE 802.11ac (= WIFI 5) IEEE 802.11ax (=WIFI 6) 11ah: LoRA가 주로 사용 11af: 농어촌에서 주로 사용 채널 하나의 길이는 20MHz이고 대략 15MHz정도 겹치게 됨 DCF vs. PCF 비교  Distributed C..

IT/사물인터넷 2023.06.13

Diphone Recording

Diphone Recording시 주의할 점 내용이 바뀌지 않는 것에 주의해야함 (waveform의 chunk를 그대로 둬야함) Pitch Variation pitch period를 짧게 가져가는 방법으로, 중간부분을 잘라낸 뒤 적절한뒤 이어 붙이는 방법을 사용함 pitch가 높아진다 = pitch period가 짧아진다. Duration Variation ▫ To increase the duration by 10% you would repeat every 10th pitch cycle ▫ To reduce the duration by 10% you would delete every 10th pitch cycle 각 하나의 pitch period를 그대로 붙이거나 잘라내는 방법을 사용함 unvoiced ..

WFST Decoder

input symbol 있는 acceptor input symbol이 없는 acceptor weight 가중치를 적용한 acceptor Weighted finite state transducer: 통역사 a: input symbol x: output symbol 1: weight Lexicon Transducer(L) silence가 없는 L-transducer silence가 있는 L-transducer Context-dependency transducer(C) 짝을 맞추기위해 epsilon을 추가함 HMM topology transducer (H) state 0은 160번째 cluster를 모델링한것이라는 뜻임 마이크에서 무슨 소리가 들어왔는지 몰라도, 가지고 있는 학습자료를 통해 미리 만들어 놓을 ..

IT/음성인식 2023.06.07

5G

Scalable NR Numerology: 5G 시스템의 특징 ** NR: New Radio 아래 숫자 기억하기! LTE: 2GHz 5G: 3.5GHz (유럽은 28GHz) Wi-Fi : 2.4GHz, 5GHz 원래 1ms주기로 전송이 되지만 5g는 0.25ms/0.5ms단위의 주기로 유연하게 가져갈 수 있음 = 기지국의 scheduling 주기를 임의로 변화할 수 있다는 것을 뜻함 LTE는 1ms다음에 정보를 전달할수있지만 5G는 더 빠르게 정보를 전달 할 수 있는 것임 ** 즉 5G는 다양한 서비스에 대응할수 있음 (주로 0.5ms로 고정시켜서 사용함) MIMO in 3GPP ** 주파수가 올라가면 좋지 않음 (벽게 부딫히면 잘 간섭이 됨) 따라서 power를 높이기 위해 기지국의 안테나가 주로 8개..

IT/사물인터넷 2023.06.01

IoT DevicesHardware and Software

시험범위 아님! IoT Hardware 사물인터넷 디바이스 H/W 플랫폼 종류 아래와 같은 것들을 고려하여 사용할 플랫폼 종류를 선택함 - size - feature ( battery life, programming language (C, C++, MicroPython, ...) ..) - cost - Connectivity Top 8 IoT Hardware Platforms and Prototyping Kits 필요한 센서들 1. 동작인식센서 2. 위치 센서 3. 환경센서(온도/습도/조도 등) 4. 기타센서 - BCI(Brain Computer Interface)는 사람 뇌파의 종류와 변화 패턴 을 측정하여 사람의 의도를 파악하는 센싱기술의 하나임 IoT Software 1. 리눅스 2. TinyOS ..

IT/사물인터넷 2023.05.31

LPWAN-LoRA, LTE

LPWAN: Low-Power wide-area network 평소에는 power saving모드로 작동하다가, 필요시 정상작동 됨 왼쪽 Non 3GPP standards: 비표준 (오른쪽은 표준임) LoRa: - 900MHz(비면허대역)에서 사용되는 네트워크 - 간단한 모니터링 용으로 주로 사용됨 기지국에 LoRA단말에 데이터를 보낼 수 있는지에 대한 여부에 따라 class를 구별함 class A: (description 참조) 단말이 기지국에 reporting 할 때만, 기지국도 단말에 데이터를 보낼 수 있음 (power saving 성능이 좋음) class B: 단말이 주기적으로 깨어나기 때문에, 기지국도 regular하게 단말에 데이터를 보낼 수 있음 class C: 아무때나 보낼 수 있음 Lon..

IT/사물인터넷 2023.05.30

Pitch & Vocoder

signal에서 pitch는 노란색으로 표현한 부분임 ** Dudley’s slope filter 참고 Difficulties in Pitch Detection unvoiced sound에서는 pitch를 detection하기 힘듬 Difficulties in Pitch Detection 방법 Median Smoothing to Fix Errors  Sequence: 5, 6, 12, 7, 8 -> outlier: 12  New sequence: 5, 6, 7, 7, 8 -> median: 7 12가 outlier로 판단되므로, median값으로 대체하는 것임 이 방법을 pitch computation에 그대로 적용한 것임 Vocoders: voice coding ▫ Analysis-synthesis..

728x90