Search

pd.crosstab

두 개(또는 그 이상)의 범주형 변수 간 교차 빈도표를 손쉽게 생성해주는 pandas 함수다. 주로 범주별 분포를 한눈에 보고 싶을 때, 또는 교차 분석(카이제곱 검정) 전처리 단계로 사용한다.

기본 문법

pd.crosstab( index, # 행 방향으로 사용할 범주형 배열 또는 series columns, # 열 방향으로 사용할 범주형 배열 또는 Series values=None, # 셀에 채울 값(수치형), None이면 '빈도(frequency)'로 계산 aggfunc=None, # values가 지정된 경우 사용할 집계함수(e.g. sum, mean) margins=False, # True이면 'All' 행,열 합계 추가 margins_name='All', # 합계 행,열 이름 normalize=False, # True 또는 'index'/'columns'/'all' 로 정규화 비율 산출 dropna=True # NaN 범주를 결과에서 제외 여부 )
Python
복사