•
도수분포표
•
원형그래프(파이 차트 / 도넛 차트)
◦
•
막대그래프
•
파레토그림
1. 막대그래프
import matplotlib.pyplot as plt
import seaborn as sns
# target ratio 계산
target_ratio = round(train['Outcome'].value_counts(normalize=True) * 100, 2)
plt.figure(figsize=(6,4))
ax = sns.countplot(x='Outcome', data=train) # 빈도수
# Annotate the bars with the percentage values
for i, patch in enumerate(ax.patches):
height = patch.get_height()
ax.text(patch.get_x() + patch.get_width() / 2.,
height,
'{:.2f}%'.format(target_ratio[i]),
ha="center")
plt.show()
Python
복사
4. 파레토그림
이탈리아 경제학자 파레토라는 사람이 발견한 현상인 ‘파레토 현상’ 을 파악하기 위한 그래프라고 보면 된다.
‘파레토 현상’ 은 전체 부의 80% 정도를 대략 20%의 사람이 가지고 있다는 것을 말한다.
이 20%를 중요한 소수 라고 부르고 80%를 사소한 다수 라고 부른다.
명목형 자료에서도 이런 정보는 중요한데, 예를 들어 자동차의 고장 원인이 보통 10가지 정도 있다고 할 때, 80% 정도의 고장은 점화플러그와 발전기 때문이라고 하자. 그렇다면 이 두가지가 중요한 소수가 되는 것이다.
파레토 그림은 이 중요한 소수를 찾는데 유용한 그래프로
•
막대그래프의 일종
•
상대도수의 크기가 큰 순서로 범주를 왼쪽에서 오른쪽으로 배열해서 만든다.
•
크기순서대로 배열된 범주에서 누적상대도수를 구해 각 범주의 막대 위 중앙에 표시하고 그 점들을 연결한다.
4-1. 파레토그림 특징
•
순위형 자료와 같이 순서가 있는 범주의 자료에는 유용하지 않다.