nominal data(명칭)는 거리측정이 불가능함 distance metric - 유클리디언 거리(L2-distance) - 맨하탄 거리(L1-distance) - Hamming 거리(이진 벡터에 적용 가능: 서로다른 비트의 개수) - 코사인 유사도(문서 검색 응용에서 주로 사용) 작을 수록 similarity가 커지는 것임 - 이진 특징 벡터의 유사도 점과 군집사이의 거리측정 1 점과 군집사이의 거리측정 2 아래 내용 시험! 두 군집 사이의 거리 동적거리 측정 방법 샘플마다 특징 벡터의 크기가 다른 경우 예) 온라인 필기 인식, DNA 열 (6.3 절의) 교정 거리 활용 = Levenshtein edit distance 군집화 알고리즘 계층 군집화: 군집 결과를 계층을 나타내는 덴드로그램으..