Search

데이터 분포

정규성 검증

1.
시각적인 방법
a.
히스토그램
정규 분포의 모양과 유사한지 확인한다.
b.
QQplot
표본 데이터의 분위수와 정규 분포의 분위수를 비교해서 그래프를 그린다. 점들이 대략적으로 대각선에 위치하면 정규 분포를 따른다고 할 수 있다.
2.
통계적 검정
a.
Shapiro-Wilk 검정
표본 크기가 작을 때(n < 50) 주로 사용. w값이 출력되고, 1에 가까울수록 정규성을 갖는다고 본다. 하지만 통계적으로 p-value 로 정규성을 판단해서 0.05 보다 크면 정규성을 갖는다고 판단한다.
b. Kolmogorov-Smironov 검정
모집단 분포를 알고 있는 경우 사용한다.
c. Anderson-Darling 검정
Kolmogorov-Smironov 검정의 확장 버전으로 표본의 꼬리 부분에서 더 높은 가중치를 부여한다.