sns.factorplot('Pclass', 'Survived', hue='Sex', data=df_train, height=6, aspect=1.5) height는 표의 높이, aspect는 표의 가로 너비로 보인다. sns.factorplot(x='Sex', y='Survived', col='Pclass', data=df_train, satureation=.5, height=9, aspect=1); 위와 아래 그래프의 차이는 Sex를 hue로 뒀냐, column으로 뒀냐 차이인것 같다. warining에 따르면 factorplot은 조만간 없어지고 catplot으로 대체된다고 하니 알아두자. 출처 이유한님, "타이타닉 튜토리얼 1 - Exploratory data analysis, visualizat..
subplots 만들기 f, ax = plt.subplots(1, 2, figsize=(18,8)) 1행 2열의 도화지를 준비하는 과정이다. figsize는 도화지 크기이다. f는 전체 도화지에 대한 것이고 ax는 ax[0] 은 1행 1열, ax[1]은 1행 2열 팔레트를 의미한다. 파이 차트 넣기 df_train['Survived'].value_counts().plot.pie( explode=[0,0.1], autopct='%1.1f%%', ax=ax[0], shadow=True ) ax[0].set_title('Pie plot - Survived') ax[0].set_ylabel('') df_train['Survived'].value_counts() 각 레이블의 counts를 반환해준다. (시리즈로 ..
데이터를 살펴 볼 때 유용하다. for col in df_train.columns: msg = 'column : {:>10}\t Percent of NaN value : {:.2f}%'.format(col, 100*(df_train[col].isnull().sum()/df_train[col].shape[0])) print(msg) df_train 에서 col을 하나씩 뽑는다. df_train[col].isnull() 하면 Null 인지 아닌지 True 와 False로 하나씩 뽑는다. 합치면 True의 갯수만 나온다. (True면 Null) df_train[col].shap[0] 하면 전체 행의 갯수를 알려준다. ( df_train[col].isnull().sum() / df_train[col].shape..