Search
🕹️

Steam users prediction

상태
완료
Colab 링크
Tools
R
2 more properties
프로젝트 쿼리 내용을 확인하시려면 위 링크를 눌러주세요
Preview
목적 : Steam Player 내 Counter Strike: Global Offensive , Dota 2 , Team Fortress 2 의 유저수 예측을 위한 시계열 모델 개발
역할 : 데이터 추출, 가공, 예측 모델 개발 및 시각화
성과 : 평균 유저수 예측 모델 개발 및 향후1년치 유저수 예측

 분석의 목적

Steam player 내의 특정 게임들(Counter Strike: Global Offensive , Dota 2 , Team Fortress 2 ) 의 평균 유저수 데이터를 활용하여 시계열 분석을 진행한 후 향후 1년간의 평균 유저수를 예측하는 것이 목적입니다.

 결론

Counter Strike : Global Offensive , Dota2 , TeamFortress 2 각각 개별적인 시계열모델을 생성하였고 TeamFortress 2 의 시계열 모형이 그 중에서도 가장 좋은 모델로 꼽을 수 있었습니다. ( AICc=-188.9 ) 이외에 다음과 같은 결론을 확인할 수 있었습니다. → GlobalStrike 는 6개월간 꾸준히 증가하다가 그 이후로는 감소추세에 접어든다. → Dota2 는 7개월간 꾸준히 증가하고 그 이후로는 정체기에 접어든다. → TeamFortress 2 는 눈에 띌만한 증가추세가 보이지 않고 지속해서 정체 상태다.
GlobalStrike 의 평균 예측 유저수
Dota 2의 평균 예측 유저수
TeamFortress 2의 평균 예측 유저수

 개인적인 회고

이런 것을 배울 수 있었습니다.
시계열 데이터를 직접 찾고 분석에 적합한 데이터로 가공하는 과정을 경험했습니다.
계절성, 추세성, 변동성을 분석하고 자기상관관계를 통해 정상성을 검증하는 과정을 배울 수 있었습니다.
수동으로 찾은 모델과 자동 최적 모델을 비교하여 AICc 지표로 최적의 모델을 선택했습니다.
시계열 분석에 필요한 다양한 R 함수들을 사용해볼 수 있었습니다. ( decompose, adf.test, diff, ggtsdisplay, Arima, residuals, checkresiduals, forecast 등)
이런 점들을 보완하고 싶습니다.
특정 지표 값을 예측하는데 있어 높은 상관관계를 가지는 설명 변수들을 사전에 파악할 필요가 있습니다.
도메인 지식에 대한 기본적인 이해를 바탕으로 프로젝트를 착수할 필요가 있습니다.
전통적인 방식의 시계열 분석과 머신러닝을 통한 예측 분석을 비교하는 프로젝트를 수행하고 싶습니다.
시계열 예측의 정확성을 높이기 위해서는 특성이 최소 2개 이상이 되어야 한다는 것을 알 수 있었습니다.
게임서비스 측면에서의 구체적인 인사이틀 제공해보고 싶습니다.

시각화 자료

아래는 시계열 분석을 진행하면서 결과로 나온 시각화 자료들입니다.
시각화 자료