우리의 현실 데이터는 Imbalanced 된 data가 많이 존재하죠. 그래서 오늘은 Imbalanced 된 데이터를 분석하는 모델링에 대해서 알아보려고 합니다. 1. Isolation Forest 2. One Class SVM 위의 두개에 대해서 알아보려고 해요. 이론에 대해서 deep하게 설명하는 것은 저의 능력을 벗어나므로, 간단히 설명하면 실제 모든 True인 데이터에 대해 분류기를 training을 시킵니다. 그러다가 그 데이터셋과 다른 특징을 나타내는 data들이 들어오면 "기존것과의 패턴이 다르다"고 판단하여 분류해 내는 모형이라고 생각하시면 될거같아요. 이것이 바로 One Class Classification 모델의 기본 idea입니다. 두 모델의 가장 중요한 것은 hyper paramet..