주제
신규 임대아파트 주차 수요 분석
•
데이터 출처 : 한국토지주택공사, 마이홈포털
과업
공공 임대 아파트 단지의 등록 차량수(y)에 영향을 미치는 요인(x)을 분석
중점 사항
•
데이터 분석 프로세스
•
가설 수립 및 데이터 구조 생성
•
단변량, 이변량 분석을 통한 비즈니스 요인 분석
핵심 사항
아파트 단지 내 필요한 주차대수는
1.
법정주차대수
2.
장래주차수요
중 큰 값에 따라 결정한다.
데이터 변수 소개
•
준공 일자
임대주택 공사를 다 마친 날
•
단지내주차면수
단지내 주차가능공간 수
과제 핵심 사항
과제 수행 조건
데이터 단위는 단지별로 구성되어야 하는 것이 포인트다.
참고 - 전처리한 데이터 저장하기
•
.pkl 로 저장하기
◦
전처리한 데이터 형태 그대로 저장하고 다시 불러올 수 있다. (dataframe, list, numpy, Scaler, Model…)
◦
joblib.dump(data, ‘data_df.pkl’) : 저장
◦
data2 = joblib.load(’data_df.pkl’) : 불러오기
변수 분석
•
추가 변수
◦
면적당 임대료 / 임대보증금
•
임대료 0 , 임대보증금 0 데이터?
◦
임대아파트 모집 공고 전 데이터임을 확인 → 제거
건물형태, 승강기설치여부, 난방방식 결측치 처리
난방방식
건물형태