정리하게 된 계기 from sklearn.cluster import KMeans # r,g,b 단위로 한줄로 reshape X = image.reshape(-1,3) # 비슷한 색상(군집) 8개로 모음 kmeans = KMeans(n_clusters=8,random_state=13).fit(X) # 센터값만 저장 segmented_img = kmeans.cluster_centers_[kmeans.labels_] # 센터 값을 이미지로 바꿔서 봄 segmented_img = segmented_img.reshape(image.shape) 답변 스터디 팀원 분께서 관련한 링크를 찾아 보내주셨다. 링크 : https://bytemeta.vip/repo/ageron/handson-ml2/issues/489 [QU..
EDA
sns.factorplot('Pclass', 'Survived', hue='Sex', data=df_train, height=6, aspect=1.5) height는 표의 높이, aspect는 표의 가로 너비로 보인다. sns.factorplot(x='Sex', y='Survived', col='Pclass', data=df_train, satureation=.5, height=9, aspect=1); 위와 아래 그래프의 차이는 Sex를 hue로 뒀냐, column으로 뒀냐 차이인것 같다. warining에 따르면 factorplot은 조만간 없어지고 catplot으로 대체된다고 하니 알아두자. 출처 이유한님, "타이타닉 튜토리얼 1 - Exploratory data analysis, visualizat..
y_position = 1.02 f, ax = plt.subplots(1, 2, figsize=(18, 8)) df_train['Pclass'].value_counts().plot.bar(color=['#CD7F32', '#FFDF00', '#D3D3D3'], ax=ax[0]) ax[0].set_title('Pclass 별 승객들 숫자', y=y_position) ax[0].set_ylabel('Count') sns.countplot('Pclass', hue='Survived', data=df_train, ax=ax[1]) ax[1].set_title('Pclass: Survived v.s. Dead', y=y_position) plt.show() ax[0] 에는 value_counts를 가지고 plot..
groupby df_train[['Pclass', 'Survived']].groupby(['Pclass'], as_index=True).count() df_train[['Pclass','Survived']].groupby(['Pclass']) 를 하면 groupby 객체가 하나 만들어집니다. groupby는 수많은 메소드를 가지고 있는데 가령, sum ( 그룹바이 별로 합친거 ) count( 그룹바이 별 갯수 ) mean( 그룹바이 별 평균 ), 자료가 바이너리 일 때는 결국 % 가 되겠다. as_index는 앞에 인덱스를 Pclass로 둘지 (True) 아니면 그냥 별도로 하나 만들지 (False) 입니다. as_index = True를 해야 그림을 그릴 때 편하겠다. crosstab pd.crosst..