두 개(또는 그 이상)의 범주형 변수 간 교차 빈도표를 손쉽게 생성해주는 pandas 함수다.
주로 범주별 분포를 한눈에 보고 싶을 때, 또는 교차 분석(카이제곱 검정) 전처리 단계로 사용한다.
기본 문법
pd.crosstab(
index, # 행 방향으로 사용할 범주형 배열 또는 series
columns, # 열 방향으로 사용할 범주형 배열 또는 Series
values=None, # 셀에 채울 값(수치형), None이면 '빈도(frequency)'로 계산
aggfunc=None, # values가 지정된 경우 사용할 집계함수(e.g. sum, mean)
margins=False, # True이면 'All' 행,열 합계 추가
margins_name='All', # 합계 행,열 이름
normalize=False, # True 또는 'index'/'columns'/'all' 로 정규화 비율 산출
dropna=True # NaN 범주를 결과에서 제외 여부
)
Python
복사