결측치 시각화 패키지
•
missingno
# matrix 로 결측치 간단히 시각화하기
missingno.matrix(df, figsize = (12,5))
# bar chart로 결측치 시각화하기
missingno.bar(df, figsize = (12,5))
SQL
복사
결측치 제거하기
•
df.dropna()
◦
결측치가 있는 열이나 행을 제거할 수 있다.
◦
inplace=True 로 원본 데이터프레임에 반영된다.
◦
axis 옵션으로 행 또는 열을 제거할지 지정한다.
▪
default → axis = 0(행 제거)
◦
subset 파라미터로 특정 열에 결측치가 있을 경우, 제거하도록 할 수 있다.
▪
df.dropna(subset=’변수’)
◦
how 파라미터로 결측치를 삭제하는 방법을 설정할 수 있다.
▪
df.dropna(how=’all’) : 모든 변수에서 결측치가 존재하는 행 삭제
결측치로 처리해야 될 값들 처리하기
사실상 결측치인데,
결측치 대체하기
특정 값으로 대체