Search

시계열 분석

shift 개념

시계열 데이터의 인덱스는 시간이나 날짜를 나타내기 때문에 날짜 이동 등의 다양한 연산이 가능하다. 예를 들어 shift 연산을 사용하면 인덱스는 그대로 두고 데이터만 이동할 수도 있다.
아래와 같은 데이터가 있다고 할때,
date
PM-10
hour
0
2022-12-01:01
15.0
1
1
2022-12-01:02
12.0
2
2
2022-12-01:03
14.0
3
3
2022-12-01:04
15.0
4
4
2022-12-01:05
15.0
5
t = 4인 시계열 데이터 구조를 어떻게 만들 수 있을까?
 쿼리
for i in range(1,5): pm_10['PM-10_' + str(i)] = pm_10['PM-10'].shift(i) # shift 1 ~ 4까지 한 변수를 각각 만들어준다. # null 값은 제거한다 pm_10.dropna(inplace=True) # 모델링에 필요하지 않는 변수들 제거 pm_10 = pm_10.drop(['date','hour'], axis=1)
Python
복사
 결과
PM-10
PM-10_1
PM-10_2
PM-10_3
PM-10_4
4
15.0
15.0
14.0
12.0
15.0
5
16.0
15.0
15.0
14.0
12.0
6
14.0
16.0
15.0
15.0
14.0
7
21.0
14.0
16.0
15.0
15.0
8
25.0
21.0
14.0
16.0
15.0