- Missingno를 먼저 설치해줍니다.
conda install -c conda-forge missingno
- 라이브러리를 import 해주고
import missingno as msno
- 결측값 확인 (Matrix) : NaN의 분포
msno.matrix(df=df_train.iloc[:,:], figsize=(8,8), color=(0.8, 0.5, 0.2))
- 결측값 확인 (Bar) : NaN %
msno.bar(df=df_train.iloc[:,:], figsize=(8,8), color=(0.8, 0.5, 0.2))
p.s.
데이터 넘기는 인수에 굳이 df_train.iloc[:,:] 안적고 그냥 df_train 적어도 된다.
결국에는 그냥 데이터 전부 넘기겠습니다 의미기 때문
참고 :
'EDA' 카테고리의 다른 글
[SNS] Seaborn 의 factorplot을 이용해보자. (0) | 2022.07.19 |
---|---|
[SNS] seaborn을 가지고 만드는 막대차트 (0) | 2022.07.19 |
[Pandas] groupby, crosstab 사용하기 (0) | 2022.07.19 |
[plt] subplots 만들어서 파이차트와 countplot 차트 넣기 (0) | 2022.07.19 |
[Pandas] NaN 값 한눈에 보기 (0) | 2022.07.19 |