Search

ARIMA / SARIMA / Prophet

전통적 시계열 모델

1.
ARIMA / SARIMA
특징: 자기상관성을 기반으로 주가 시계열의 흐름을 모델링
장점: 이해하기 쉽고 해석 가능성이 뛰어남, 시계열 데이터의 추세와 계절성을 잘 모델링
단점: 복잡한 비선형 패턴엔 한계가 있음
2.
Prophet
특징: 페이스북에서 개발한 시계열 예측 모델, 트렌드와 계절성을 자동으로 반영
장점: 사용이 편리하고, 결측치나 이상치에 강건함
단점: 비선형적이고 복잡한 패턴을 모두 잡아내기 어려움

전통적 머신러닝 기반 모델

1.
Random Forest
특징: 앙상블 기법을 이용하여 데이터의 비선형적 관계를 학습
장점: 오버피팅에 강하고, 일반화 성능이 좋음
단점: 시계열 데이터를 잘 처리하려면 특성(feature) 설계가 중요
2.
XGBoost, LightGBM
특징: Gradient boosting 기반의 강력한 예측 알고리즘
장점: 정확도가 높고, 최근 주가 예측 경진대회에서 우수한 성과를 보임(️)
단점: 특성(feature) 엔지니어링과 하이퍼파라미터 튜닝이 필수적임
3.
Support Vector Regression (SVR)
특징: 비선형 관계를 학습하여 주가의 변동성을 모델링
장점: 소규모 데이터에서도 안정적 예측
단점: 큰 데이터셋에서는 학습 속도가 느림

딥러닝 기반 모델 (최근 인기)

1.
LSTM / GRU (순환 신경망 계열)
특징: 이전 시점 데이터를 기억하여 현재 시점의 예측에 반영
장점: 시계열 데이터의 장기 의존성을 잘 학습함
단점: 과적합 위험이 있고, 연산 비용이 높음
2.
Transformer (Attention-based 모델)
특징: Attention 메커니즘을 이용하여 시계열 데이터의 장기 패턴 학습
장점: 최근 시계열 데이터 예측 분야에서 우수한 성과 (e.g., Informer, Autoformer 등)
단점: 데이터가 충분히 많아야 우수한 성능 발휘, 계산 자원이 많이 필요함

최신 주가 예측을 위한 심화 모델들

1.
Temporal Convolutional Networks (TCN)
특징: Convolution 연산을 활용하여 시계열 데이터 예측에 특화
장점: 병렬처리 가능하여 빠르고 정확함
단점: 구조적 이해가 까다롭고, 튜닝 필요성이 큼
2.
Graph Neural Networks (GNN)
특징: 기업 간 관계 또는 다양한 외부 데이터를 그래프 형태로 모델링하여 사용 가능
장점: 주가 간 상호 영향을 반영한 예측이 가능함
단점: 그래프 설계와 외부 데이터 활용이 복잡함
3.
강화학습 (Reinforcement Learning)
특징: 최적의 매매 전략을 학습할 수 있는 모델링 방식
장점: 예측 성능뿐 아니라 투자 전략 자체를 최적화 가능
단점: 학습이 어려우며, 많은 시행착오가 필요함

추천하는 조합 (성능이 입증된 조합)

기본적인 베이스라인으로 ARIMA, Prophet을 활용하여 데이터 특성 파악
전통 머신러닝 (XGBoost, LightGBM)과 딥러닝(LSTM, Transformer)을 병행하여 비교
좀 더 심화해서 모델을 개선할 경우, TCN 또는 GNN 등 최신 접근법을 실험