let us not love with words or tongue but actions and truth.
728x90

K-means 2

군집화

nominal data(명칭)는 거리측정이 불가능함 distance metric - 유클리디언 거리(L2-distance) - 맨하탄 거리(L1-distance) - Hamming 거리(이진 벡터에 적용 가능: 서로다른 비트의 개수) - 코사인 유사도(문서 검색 응용에서 주로 사용) 작을 수록 similarity가 커지는 것임 - 이진 특징 벡터의 유사도 점과 군집사이의 거리측정 1 점과 군집사이의 거리측정 2 아래 내용 시험! 두 군집 사이의 거리 동적거리 측정 방법 샘플마다 특징 벡터의 크기가 다른 경우  예) 온라인 필기 인식, DNA 열  (6.3 절의) 교정 거리 활용 = Levenshtein edit distance 군집화 알고리즘  계층 군집화: 군집 결과를 계층을 나타내는 덴드로그램으..

IT/패턴인식 2022.12.15

Classification with Network Information

가정 - friendship 네트워크와 판매할 상품이 있음 - 네트워크상에서 일정부분에 해당하는 사람들의 구매 여부에대한 정보가 주어짐 (아직까지 구매여부가 없는 사람들에 대해서 classification을 하는 것임) - 링크 정보를 활용하여 잠재적 고객을 예측하는 것이 목적 1로 표시된 v1, v2는 이미 구매의사가 있는 사람 0으로 표시된 v5는 구매의사가 없는 사람 v3, v4, v6의 구매의사를 예측해보자. 이때 위와 같이 vi노드가 구매할 확률은 N(vi) neighbor의 정보를 고려하여 결정됨 이때 사용하는 방법: wvRN Weighted-vote Relational-Neighbor (wvRN) vi의 neighbor인 vj를 고려하기위해 vj의 neighbor를 고려(회귀적인 모형임) P..

IT/SNS분석 2022.05.10
728x90