Search

결측치 확인/ 처리하기

결측치 시각화 패키지

missingno
# matrix 로 결측치 간단히 시각화하기 missingno.matrix(df, figsize = (12,5)) # bar chart로 결측치 시각화하기 missingno.bar(df, figsize = (12,5))
SQL
복사

결측치 제거하기

df.dropna()
결측치가 있는 열이나 행을 제거할 수 있다.
inplace=True 로 원본 데이터프레임에 반영된다.
axis 옵션으로 행 또는 열을 제거할지 지정한다.
default → axis = 0(행 제거)
subset 파라미터로 특정 열에 결측치가 있을 경우, 제거하도록 할 수 있다.
df.dropna(subset=’변수’)
how 파라미터로 결측치를 삭제하는 방법을 설정할 수 있다.
df.dropna(how=’all’) : 모든 변수에서 결측치가 존재하는 행 삭제

결측치로 처리해야 될 값들 처리하기

사실상 결측치인데,

결측치 대체하기

특정 값으로 대체

머신러닝 전처리 정리