프로젝트 쿼리 내용을 확인하시려면 위 링크를 눌러주세요
Preview
•
목적 : Steam Player 내 Counter Strike: Global Offensive , Dota 2 , Team Fortress 2 의 유저수 예측을 위한 시계열 모델 개발
•
역할 : 데이터 추출 및 가공, 예측 모델 개발 및 시각화
•
성과 : 시계열 모델 개발 및 향후 1년의 유저수 예측
분석의 목적
Steam player 내의 탑 순위 게임(Counter Strike: Global Offensive , Dota 2 , Team Fortress 2 )의 오픈 데이터를 활용하여 시계열 분석을 진행한 후 향후 1년간의 평균 유저수를 예측하는 것이 프로젝트의 목표입니다.
결론
Counter Strike : Global Offensive , Dota2 , TeamFortress 2 각각 개별적인 시계열모델을 생성하였고 TeamFortress 2 의 시계열 모형이 그 중 가장 좋은 모델로 꼽을 수 있었습니다. ( AICc=-188.9 )
이외에 다음과 같은 결론을 확인할 수 있었습니다.
→ GlobalStrike 는 6개월간 꾸준히 증가하다가 그 이후로는 감소추세에 접어든다.
→ Dota2 는 7개월간 꾸준히 증가하다가 그 이후로는 정체기에 접어든다.
→ TeamFortress 2 는 증가추세가 보이지 않고 정체 상태다.
GlobalStrike 의 평균 예측 유저수
Dota 2의 평균 예측 유저수
TeamFortress 2의 평균 예측 유저수
개인적인 회고
이런 점을 배울 수 있었습니다.
•
시계열 데이터를 직접 찾고 분석에 적합한 데이터로 가공하는 과정을 경험했습니다.
•
계절성, 추세성, 변동성을 분석하고 자기상관관계를 통해 정상성을 검증하는 과정을 배울 수 있었습니다.
•
수동으로 찾은 모델과 자동 최적 모델을 비교하여 AICc 지표로 최적의 모델을 선택했습니다.
•
시계열 분석에 필요한 다양한 R 함수들을 사용해볼 수 있었습니다. ( decompose, adf.test, diff, ggtsdisplay, Arima, residuals, checkresiduals, forecast 등)
이런 점들을 보완하고 싶습니다.
•
특정 지표 값을 예측하는데 있어 높은 상관관계를 가지는 설명 변수들을 사전에 파악할 필요가 있습니다.
•
도메인 지식과 서비스에 대한 깊은 이해를 바탕으로 프로젝트를 착수할 필요가 있습니다.
•
전통적인 방식의 시계열 분석과 머신러닝을 통한 예측 분석을 비교하는 프로젝트를 수행하고 싶습니다.
•
시계열 예측의 정확성을 높이기 위해서는 특성이 최소 2개 이상이 되어야 한다는 것을 알 수 있었습니다.
•
게임서비스 측면에서의 구체적인 인사이트를 제공해보고 싶습니다.
시각화 자료
아래는 시계열 분석을 진행하면서 결과로 나온 시각화 자료들입니다.
시각화 자료