“한국어임베딩”(2020), 이기창, 에이콘출판주식회사의2장을 정리해본 내용입니다. 그전에 SVD에 대해서 간단히 알아보도록 하겠습니다. (간단히 하기위해 높임말 생략) SVD: Singular vector decomposition으로 특이값 분해라 한다. A라는 벡터를 SVD를 통해 아래와 같은 꼴로 만드는 것이다. 여기서 U와 V는 직교행렬임 (참고로 직교행렬이란, 모든 행벡터와 열벡터의 크기가 1인 것. 예를들어 단위(I) 벡터) U는 단어공간을 뜻함 U는 Ax(A^T)를 고유값 분해해서 얻어진 직교행렬이고, V는 (A^T) x A를 고유값 분해해서 얻어진 직교행렬이다. S는 대각행렬로 대각성분외에 모두 0인행렬이며, 대각성분에 특잇값(해당축의 중요도)이 큰 순서로 나열된다. 즉, S행렬의 특잇값이..