introduction: word representaiton Local representation vs. Distributed representation Local: one-hot encoding Distributed: continuous한 요소들의 벡터로 표현 (vectors in a continuous vector space) downstream task란? 아래그림에서 taget task를 뜻함 fine-tuning approach에서 각 task별 사용하는 방법들 예를들어 NLI(문장관계분석)을 하려면 2문장 가운데, 구분자를 넣어줌 (전체 문장 corpus에 구분자를 넣어준다는 뜻) BERT(Bidirectional Encoder Representations from Transformers) 양..