let us not love with words or tongue but actions and truth.

Python 4

[그래프]산점도에 label 추가하기

지난번에 matplotlib을 활용해서 산점도 그래프 그리는 법을 알아봤습니다. 이번에는 산점도에 label을 추가하는 방법을 알아보고자 합니다. label 또는 텍스트를 추가한다는 말은 아래 그림과 같이 id1~3까지의 텍스트가 그림위에 표현 되는 것입니다. 그럼 matplotlib을 먼저 불러옵니다. 1 from matplotlib import pyplot as plt cs 지난번에 배웠던 산점도 그리는 코드를 기억하실까요? 2가지 방법으로 배웠는데, 첫번째는 case마다 직접 명시를 해주는 방법과 두번째로는 for문을 활용해 산점도를 그리는 방법이었어요. 오늘은 간단히 첫번째 방법으로 그려볼게요. (어차피 label을 입력할 때 for문을 써줘야 하기 때문에) 1 2 3 4 5 6 7 8 9 10 ..

IT/파이썬 2021.09.17

[그래프] subplot 활용하기

하나의 화면에 여러개의 그래프를 표시해야 할 때가 있습니다. 예를 들어볼까요. 1반부터 4반까지 있을 때, 4개의 학급의 과목점수 영어/수학/국어/사회 등의 점수분포를 비교해야 된다고 해보죠. 표로 각 반별 과목별 점수의 평균을 표현하게 되면 이렇게 되겠죠. 1반 2반 3반 4반 영어 80 82 83 73 수학 67 73 82 91 국어 73 72 83 82 사회 78 78 98 97 이러한 정보의 그래프를 표처럼 나타낼 수 있는 방법이 있습니다. 위의 그림을 보시면 각 반별 과목의 점수를 비교하기 쉽게 그려놓은 것을 볼 수 있습니다. 이렇게 그래프를 그릴 수 있게 해주는 것이 오늘 정리해볼 subplot이라는 함수입니다. subplot에서 꼭 기억하셔야 될 것은 subplot(행, 열, 순서)라는 것입..

IT/파이썬 2021.08.12

if문과 apply함수로 파생변수 만들기

지난번에 if문과 map함수로 파생변수 만들기를 연습해봤다면, https://sarah0518.tistory.com/69?category=984180 if문과 map함수로 파생변수 만들기 보통 SQL에 익숙하신 분들은 파생변수 만들때 case, when, then 문이 자동으로 생각나실거에요. 파이썬에서는 간단하게는 map함수를 쓰거나, 아니면 if문으로 파생변수를 새로 만들어서 컬럼으로 활용 sarah0518.tistory.com 이번에는 apply함수로 파생변수만들기를 해볼거에요. apply함수는 다양하게 쓰일 수 있는데, 이것도 지난번에 다뤘던 것처럼 applymap과 유사하다고 생각하면 됩니다. 가장 큰 차이점은 applymap은 dataframe에만 사용이 가능하지만, apply는 datafra..

IT/파이썬 2021.08.04

Imbalanced Dataset에서의 over sampling과 cross validation

지금 분석 하려고 하는 내용은 복잡하니, 개괄적인 내용만 미리 정리해보겠습니다. 우선 Imbalanced Dataset를 모델링시키기 위해서는 아래와 같은 순서로 진행합니다. StratifiedKFold기법을 적용하여, train과 test dataset으로 쪼개고 Train dataset의 Minority class를 over sampling하고 over sampling 된 traing dataset으로 모델을 Traning 시킨 후 원래 데이터의 test dataset을 통해 test한 후 모델설명력을 평균 내는 것 (cross validation의 원리) 왜 imbalanced dataset에서는 위와 같이 복잡하게 진행할까라고 하시는 분들은 아래 설명을 보시면 조금 이해가 될거 같습니다. www...

IT/파이썬 2020.12.09