Search

Seaborn

distplot : 히스토그램

형식 : sns.distplot(df[’피처명’], kde = True, bins = None, ax)
~ kde : 그래프에 선을 출력할지의 여부(default = True)
~ bins : 출력할 막대그래프의 개수(=빈의 개수)
글꼴 설정은 다음과 같이 한다.
plt.rc('font',family = '글꼴이름')
Python
복사
일반적으로 데이터를 시각화할때는 데이터를 복사하여 복사본을 가지고 시각화한다.
dfcopy = df.copy()
Python
복사

stripplot / swarmplot : 범주형 데이터의 산점도

stripplot : 데이터 포인트를 중복해 범주별 분포를 그려준다.
< 옵션들 >
hue : 나타내고 싶은 범주형 데이터를 추가할 수 있다. → 데이터 포인트에 반영할 수 있음
dodge=False : hue 가 지정됐을 때 기본적으로 데이터포인트를 합쳐서 나타낸다.
True 로 설정할 경우, hue의 세부 범주에 따라 데이터들을 구분해서 나타낸다.
jitter=False : 기본적으로 데이터 포인트를 중복해서 데이터의 분포를 나타낸다.
True 로 설정할 경우, 가로축 위치에 변동을 줘서 데이터가 겹치지 않도록 구분해준다.
ex) ‘방 타입’ 별로 ‘월별 평균 리뷰 수’ 를 확인하고자 한다. 이때, 또 ‘지역’ 별로 포인트 색깔을 다르게 지정해주도록 한다.
sns.stripplot(x = 'room_type', y = 'reviews_per_month', data = df, hue = 'neighbourhood_group', palette = 'Set2')
Python
복사
swarmplot : 데이터의 분산까지 고려해서 데이터 포인트가 중복되지 않도록 그린다. 데이터가 퍼져 있는 정도를 입체적으로 확인할 수 있다.