let us not love with words or tongue but actions and truth.
728x90

IT 159

GridSearchCV 2탄 (for문 활용)

지난번과 동일한 GridSearchCV이지만 약간은 다른 방식으로 진행해보려고 합니다. sarah0518.tistory.com/50?category=984180 GridSearchCV 그리드서치 1탄 모델별로 best성능을 만들어 줄수있는 hyper parameter값을 찾아야 될 경우가 있을텐데요. 그때 유용하게 사용되는 Grid Search CV에 대해서 알아보도록 할게요. 우선 각 모델별로 가장 기본적인 모델을 sarah0518.tistory.com 지난번 내용을 잠깐 복습해보면, GridSearchCV를 통해 best_estimator_를 출력 하는 것으로 끝났습니다. 오늘은 GridSearchCV가 어떤 과정을 거쳐 best estimator를 도출하는지 그 과정을 살펴보는 코드를 짜려고 합니다..

IT/파이썬 2021.02.18

Azure DP-100 자격증 기출문제

우선 참고하실만한 사이트를 공유해 드릴게요! Google에서 Azure dp-100 sample questionsts이라고 검색하시면 여러개 사이트가 확인됩니다. 그중에 하나만 가져와봤어요. www.itexams.com/exam/DP-100 DP-100 by Microsoft Actual Free Exam Q&As - ITExams.com Case study - This is a case study. Case studies are not timed separately. You can use as much exam time as you would like to complete each case. However, there may be additional case studies and sections on ..

[그래프] pivot_table을 활용한 heatmap 그래프 그리기

아래 그래프는 수학과 영어점수 백분율에 따른 학생수입니다. 가장 진한 곳을 보면 수학점수가 하위(75%초과 100%이하)에 속하는 학생들은 영어점수가 나름 상위쪽인 50%해당에 분포하고 있네요. 이 부분에 속하고 있는 학생수가 가장 많기 때문에 색상은 진한색으로 표현이 된 것입니다. 파이썬으로 위와같은 히트맵 그래프를 그리는 법을 알아보려고 합니다. 하지만 그전에 pivot_table을 만드는 법을 잠깐 알아보려고 합니다. 아래와 같은 각 반별 수학점수 백분율그룹에 속하는 인원수를 나타내는 표가 있다고 하죠. 여기서는 그냥 백분율그룹별 인원수의 합계를 구하는 pivot table을 만들고자 합니다. 즉, 아래와 같은 테이블을 만들고 싶은 것이죠! 코드는 간단합니다. 1 math.pivot_table(va..

IT/파이썬 2021.02.09

Stack과 melt로 데이터 Transpose하기

오늘은 sas의 proc transpose와 유사하게 파이썬에서 stack / melt를 사용해서 동일한 효과를 내는 방법을 배워보려고합니다. 1. Stack 사용하기 보통 data를 Transpose하는 것으로는 pivot이나, melt를 쓰지만 set_index과 stack으로도 간단하게 transpose할 수 있어요. 아래와 같이 간단한 데이터가 있다고 볼게요. [원본데이터] 목표는 컬럼에 있는 v1-v4까지의 값들이 컬럼으로 들어가고 그에 해당하는 값들이 한 컬럼으로 들어가는 것입니다. id1=a인 값으로 예를 들어볼게요. 아래와 같이 id1=a인 값에서, 각 v1-v4가 하나의 컬럼, 그에 해당하는 값도 하나의 컬럼으로 들어가는 거죠. [output으로 만들고 싶은 데이터 형태] 1 stack[..

IT/파이썬 2021.02.06

[그래프] Bar 그래프 그리기

위의 그림처럼 Bar그래프를 그리는 방법을 소개하려고 해요. 지난번과 같이 한글을 사용하기 위해서는 꼭 나눔고딕체를 받아서 seabon set환경에 넣어주시면 됩니다. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 import matplotlib.pyplot as plt import seaborn as sns sns.set(font="NanumGothic", rc={"axes.unicode_minus":False, 'figure.figsize':(5,5)}, style='whitegrid') counter = df.groupby('class')['prize'].value_counts().unstack() percentage_dist = 100 * coun..

IT/파이썬 2021.02.02

[그래프] box-plot 그리기

오늘은 간단하게 box-plot그래프를 그리고, 색깔을 변경하고 그래프를 저장하는 방법을 간단히 알아볼게요. 위에 그림에서는 box-plot 개수가 2개이지만 만약 여러개라면, 그만큼 다양한 색상을 아래 color_dict에 추가해주면 됩니다. (단, '합격여부'라는 컬럼에 있는 컬럼명 그대로 넣어주기) for i in range(0,2):에서도 만약 여러개의 box-plot을 추가하실 거라면 뒤에 range 끝 값을 더 늘려주세요. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 #색상 정의 color_dict = dict({False: "grey", True: "blue"}) import matplotlib.pyplot as plt import seaborn as sn..

IT/파이썬 2021.01.27

if문과 map함수로 파생변수 만들기

보통 SQL에 익숙하신 분들은 파생변수 만들때 case, when, then 문이 자동으로 생각나실거에요. 파이썬에서는 간단하게는 map함수를 쓰거나, 아니면 if문으로 파생변수를 새로 만들어서 컬럼으로 활용할 수 있습니다. 아래와 같은 예시 데이터가 있다고 할때, 우리는 mon라는 컬럼을 활용해서 new_col이라는 컬럼을 생성해볼게요. 방법1. if문으로 파생변수 만들기 코드 복사하시라고 아래 편집해놨어요. 실제 test.shape[0]의 값은 6이니, 0~5까지의 range로 list의 length가 정해지게 해뒀어요. 또, def함수를 써서, new_col_creating이라는 함수를 선언했습니다. 1 2 3 4 5 6 7 8 9 10 11 12 temp=list(range(test.shape[0..

IT/파이썬 2021.01.25

AZURE DP-100자격증 시험 신청방법

AZURE DP-100자격증 신청 방법입니다! docs.microsoft.com/ko-kr/ 개발자 도구, 기술 설명서 및 코딩 예제 개발자와 기술 전문가용 Microsoft 설명서 및 학습을 위한 홈입니다. docs.microsoft.com 우선 위의 사이트에 접속해주세요. 아래와 같은 순서로 클릭해주신 다음에, 1. 상단의 Learn 클릭하기 2. 인증 > 인증 찾아보기 를 클릭해주세요. 3. 그 다음 왼쪽 필터에서 데이터 과학자 체크하시면 오른쪽에 dp-100시험관련 한 내용이 나타납니다! 지난번에 말씀드렸다시피 영어로 시험보시는걸 추천드려요. 한국어 번역이 매끄럽지 않은 부분이 있으니깐요~ 그 다음은 캡처까지는 할 내용은 아니어서 아래에 글로만 설명드려요. 시험 예약 버튼을 누르시면 1. 인증프로..

728x90