Search

범주형 자료 시각화

도수분포표
원형그래프(파이 차트 / 도넛 차트)
막대그래프
파레토그림

1. 막대그래프

import matplotlib.pyplot as plt import seaborn as sns # target ratio 계산 target_ratio = round(train['Outcome'].value_counts(normalize=True) * 100, 2) plt.figure(figsize=(6,4)) ax = sns.countplot(x='Outcome', data=train) # 빈도수 # Annotate the bars with the percentage values for i, patch in enumerate(ax.patches): height = patch.get_height() ax.text(patch.get_x() + patch.get_width() / 2., height, '{:.2f}%'.format(target_ratio[i]), ha="center") plt.show()
Python
복사

4. 파레토그림

이탈리아 경제학자 파레토라는 사람이 발견한 현상인 ‘파레토 현상’ 을 파악하기 위한 그래프라고 보면 된다.
‘파레토 현상’ 은 전체 부의 80% 정도를 대략 20%의 사람이 가지고 있다는 것을 말한다.
이 20%를 중요한 소수 라고 부르고 80%를 사소한 다수 라고 부른다.
명목형 자료에서도 이런 정보는 중요한데, 예를 들어 자동차의 고장 원인이 보통 10가지 정도 있다고 할 때, 80% 정도의 고장은 점화플러그와 발전기 때문이라고 하자. 그렇다면 이 두가지가 중요한 소수가 되는 것이다.
파레토 그림은 이 중요한 소수를 찾는데 유용한 그래프로
막대그래프의 일종
상대도수의 크기가 큰 순서로 범주를 왼쪽에서 오른쪽으로 배열해서 만든다.
크기순서대로 배열된 범주에서 누적상대도수를 구해 각 범주의 막대 위 중앙에 표시하고 그 점들을 연결한다.

4-1. 파레토그림 특징

순위형 자료와 같이 순서가 있는 범주의 자료에는 유용하지 않다.