목차
1.분석의 목적
US E-Commerce Records 2020 데이터에는 records 와 customer_stats , 총 2개의 테이블이 있습니다.
해당 e-commerce를 사용하는 고객의 카테고리를 만들어 Retention 분석하는 것을 1차 목표로 합니다.
구매력에 따른 RFM 분석으로 고객 세분화를 진행하고, 어떤 카테고리의 상품이 많이 팔리는지, 지역에 따라 어떤 매출 양상을 보이는지 확인해 타겟 마케팅 아이디어에 활용하는 것이 최종 목표입니다.
2. 데이터 설명
•
solvesql의 US E-Commerce Records 2020 데이터를 사용했습니다.
•
US E-Commerce Records 2020 데이터셋의 원본 출처는 Kaggle입니다.
•
데이터가 수집된 기간은 2020-01-02 ~ 2020-12-30 으로, 약 1년입니다.
데이터 셋 설명
•
테이블 : records , customer_stats
◦
records
◦
customer_stats
→ 한명의 고객이 다수의 주문을 할 수 있기때문에 customer_stats와 records는 1:N 관계
1) records : 주문 데이터
칼럼명 | 설명 | 데이터 타입 |
order_date | 주문 날짜 | date |
order_id : key | 주문 ID | string |
ship_mode | 배송 타입 | string |
customer_id | 고객 ID | string |
segment | 고객 타입 | string |
country | 국가 | string |
city | 도시 | string |
state | 주 | string |
postal_code | 우편 번호 | integer |
region | 지역 | string |
product_id | 상품ID | string |
category | 카테고리 | string |
sub_category | 서브카테고리 | string |
product_name | 상품명 | string |
sales | 매출 | number |
quantity | 수량 | integer |
discount | 할인 | number |
profit | 이익 | number |
2) customer_stats : 고객 데이터
컬럼명 | 설명 | 데이터 타입 |
customer_id : key | 고객 ID | string |
first_order_date | 첫 주문일 | date |
last_order_date | 마지막 주문일 | date |
cnt_orders | 주문 횟수 | integer |
sum_sales | 매출 합계 | number |
3.EDA
3-1. Retention 분석
AARRR 마케팅 데이터 분석 단계 중 가장 중요한 단계인 Retention 분석을 진행해봅니다. 해당 서비스의 특징을 고려해서 ‘롤링 리텐션’ 방법으로 분석을 진행했습니다.
롤링 리텐션을 선택한 이유
→ 매일같이 사용하는 SNS, 혹은 일정한 간격으로 이용하는 서비스가 아니라는 점을 참고해, 롤링 리텐션으로 결정했습니다. 다만, 이상치의 영향을 많이 받는 특징을 고려해 지표의 추이를 살펴보는 정도로만 참고하는데 의의를 두었습니다.
첫달 구매수 쿼리
첫 구매 후 다음달 이탈하지 않은 사용자 수
첫 주문 이후 마지막 기준 12월달까지 롤링 리텐션 비율
리텐션 차트를 통해 다음과 같이 예상할 수 있었습니다.
1.
기간에 따른 유지율을 봤을 때 초기에 떨어지는 속도가 느린반면 평균적으로 6개월 이상이 경과하면서 떨어지는 속도가 커집니다. 안정화 단계를 빠르게 만들어내기 위해 고객과의 지속적인 커뮤니케이션과 프로모션 이벤트를 꾸준히 하는 것이 필요해보입니다.
2.
60일이라는 동일한 기간을 놓고 봤을 때, 2월의 리텐션은 90%를 윗도는 매우 높은 값을 보였습니다. 2월에 주문한 고객들의 이용 동선을 확인할 필요가 있습니다.
3.
3월의 신규 주문 수가 가장 높았습니다. 어떤 이유로 가장 많은 주문 수가 발생했는지, 해당 월에 어떤 마케팅을 진행했는지 알아볼 필요가 있습니다.
4.
월 신규 주문 건수가 하락하는 추세입니다. 어떤 이유로 하락하고 있는건지 살펴볼 필요가 있습니다.
3-2. 코호트 분석
1.
시간에 따른 사용자의 유지와 이탈 패턴을 확인합니다.
2.
코호트 간의 상이한 행동 패턴을 확인해봅니다.
코호트는 다양한 목적과 기준으로 만들어볼 수 있습니다. 현 데이터셋에 만들어볼 수 있는 코호트를 아래와 같이 잡아봤습니다.
- 구매력별 코호트 → RFM 분석
- 배송 타입별 코호트
- 고객 타입별 코호트( 개인 / 기업 / home-office )
- 도시별 코호트
- 주별 코호트
- 지역 별 코호트
- 카테고리별 코호트
- 매출별 코호트
- 첫 구매 월별 코호트
- 주문 횟수 카테고리별 코호트
RFM 분석
WHY : RFM 분석을 진행한 이유
마케팅 관점에서 customer_stats 의 정보를 활용한다면 고객 세그먼트별 인사이트를 도출해낼 수 있을 것이라 판단했습니다.
주어진 데이터를 참고했을 때, 고객 세그먼트 방법 중 사용자 구매력에 따른 세그먼트를 활용할 수 있습니다. (첫 주문일, 마지막 주문일, 주문 횟수, 매출)의 정보가 담겨있기 때문입니다.
[RFM 분석의 기준]
•
Recency : 최근에 구매했는가
•
Frequency : 자주 구매했는가
•
Monetary : 얼마나 구매했는가
이커머스라는 서비스의 환경을 고려해서
Recency의 기준 : 2020년 12월 30일을 기준으로 마지막 주문일과의 간격
Frequency의 기준 : 2020년 12월 30일을 기준으로 고객의 총 주문 횟수
Monetary의 기준 : 2020년 12월 30일을 기준으로 고객이 주문한 총매출액
RFM을 분석하기 위한 세팅
•
Recency
→ 2020년은 최근 거래한(3달 이내) 고객 수가 더 많았습니다.
→ 구매자의 50% 이상이 12월 30일 기준 60일 이내로 상품을 구매했으며, 가장 높은 분포를 보이는 경과일 수는 15일에서 30일 사이로 확인(주문한 고객의 약 25%)됩니다.
select customer_id
,round(datediff(last_order_date,first_order_date) / (cnt_orders-1) ,2) as periods -- 구매 주기
from customer_stats
where cnt_orders >= 2;
SQL
복사
→ 상위 25%의 구입자는 1~51일 사이(2달 이내)의 구입 주기를 가지고 있습니다.
→ 상위 50%의 구입자는 1~80일 사이(3달 이내)의 구입 주기를 가지고 있습니다.
→ 1달 ~ 2달 사이의 구매 주기가 평균적으로 가장 많은 것으로 파악됐습니다.
•
Frequency : 얼마나 주문을 자주 했는지
select customer_id
,cnt_orders
from customer_stats;
SQL
복사
→ 주문 수가 1~3건 사이에 몰려있습니다.
→ 구매자의 50% 이상이 2회 이상 상품을 구매한 것을 확인할 수 있습니다.
•
Monetary
→ 꼬리가 오른쪽으로 긴 분포로 아웃라이어가 존재함을 예측할 수 있습니다.
→ 매출액의 편차는 1464 달러로 큰 편입니다.
→ 고객 중 절반이 총금액 약 600달러 이하로 소비하는 것을 확인했습니다.
따라서, 주문하는 금액은 고객별 편차가 심하나, 전반적으로 절반의 고객들은 해당 온라인 마켓에서 낮은 금액대의 상품을 구매하는 것으로 확인할 수 있었습니다.
RFM 기준값 설정
•
스케일
주문 고객 수가 693명으로 많지 않기때문에 일반적인 1-2개의 스케일을 사용합니다.
•
카테고리 분류 기준 ( 사분위수 사용 )
◦
사분위수를 사용한 이유는 RFM의 지표들만 봤을 때 모두 아웃라이어가 존재하고, 평균값과 편차가 크기 때문입니다.
◦
상위 25%를 1(중요고객), 그외 나머지 75%을 0(하위고객)으로 설정했습니다.
Recency | Frequency | Monetary | |
1(상위 25%) | 51일 이내 | 3회 이상 | 1335 달러 이상 |
0(하위 75%) | 52일 초과 | 2회 이하 | 1334 달러 미만 |
쿼리
쿼리
고객 유형 세분화와 관리 대상 세그먼트 결정
총 8개의 세그먼트에서 관리 대상군은 4개로 선정했습니다. 비용 대비 마케팅 투자를 했을 때 효과가 보일 집단들로 추렸습니다.
recency | frequency | monetary | 고객 수 | 고객 유형 | 설명 |
1 | 1 | 1 | 66 | VIP | 서비스를 적극적으로 사용하는 필수 고객 |
1 | 0 | 1 | 30 | 우량후보(F) | 구매력이 높은 고객, Frequency 지수를 개선할 필요가 있는 고객 |
0 | 1 | 1 | 47 | 떠난 VIP | 제품을 자주 구매하고, 구매력도 높지만 최근에 방문하지 않은 고객. 이탈 우려가 있는 고객 |
1 | 1 | 0 | 112 | 우량후보(M) | 구매 빈도가 높은 고객, Monetary 지수를 개선할 필요가 있는 고객 |
0 | 0 | 1 | 30 | 기타 | 관찰이 필요한 고객군 |
0 | 1 | 0 | 68 | 기타 | 관찰이 필요한 고객군 |
1 | 0 | 0 | 107 | 기타 | 관찰이 필요한 고객군 |
0 | 0 | 0 | 233 | 저수익성 고객 | 구입 가능성도 낮고, LTV도 낮을 것으로 예측되는 고객군 |
세그먼트별 고객수 구하는 쿼리
결과
관리 고객의 영향도 파악
쿼리
이제, 고객 세그먼트별 매출액 점유율이 어떻게 되는지 확인해봅니다.
•
중요 고객군의 매출액 점유율은 전체 매출의 67.14%를 차지합니다. 그만큼 관리 고객의 가치가 높다고 판단됩니다.
쿼리
RFM 분석의 한계점
1. 고객의 복잡한 구매 패턴을 단순히 3가지 요인으로만 분석한다는 점
2. 실제 서비스에 활용하기 어려운 부분이 있다는 점
3-3. LTV 계산하기
LTV는 “고객 평생 가치” 라고 부른다.
한 명의 고객이 기업과 거래를 시작한 다음 이를 멈출 때까지의 기간을 “고객 라이프 사이클”이라고 한다.
LTV는 한 명의 고객이 “고객 라이프 사이클 기간 동안 기업에 얼마만큼의 이익을 가져왔는가”를 정량적으로 합한 것입니다.
LTV가 높다는 것은 결국 고객이 장기적으로 기업의 제품을 계속 선택하고 있다는 것을 말합니다. 즉, 충성도가 높은 고객군일수록 LTV가 높게 나옵니다.
계산식은 다음을 사용하겠습니다.
•
이익×거래 기간(라이프타임)× {1 / (1 + 할인율)} (현재 가치 계수)
- rfm_avg_profit : 고객군별 평균 이익
- rfm_avg_term : 고객군별 평균 거래 기간
- rfm_avg_discount : 고객군별 평균 할인율
- rfm_ltv : 고객군별 LTV
쿼리
일반적으로 LTV를 늘리기 위한 대응방안은 아래와 같습니다.
1) 객단가를 올린다
2) 구매 빈도를 높인다
3) 계속 이용하도록 유도한다
promising_VIP_F 고객군의 경우, 2)가 적합한 대안으로 보입니다. VIP_left 고객군의 경우에는 서비스를 사용한지 꽤 됐으므로 3)의 방법으로 적절하게 대응하면 좋을 것 같습니다.
3-4. 기존의 segment와 연관지어 인사이트 얻어보기
기존 segment(Consumer, Coporate, Home Office)별로 앞서 만든 RFM 세그먼트들이 어떻게 분포하는지 확인해봤습니다.
- vip_pct : VIP고객중 해당 segment의 비율
- promising_vip_m_pct : 구매 빈도가 높은 핵심 고객 중 해당 segment의 비율
- promising_vip_f_pct : 구매력이 높은 핵심 고객 중 해당 segment의 비율
- vip_left_pct : 이탈 우려가 있는 VIP 고객 중 해당 segment의 비율
쿼리
인사이트
1.
모든 RFM 고객군에서 개인과 기업 고객이 약 80 ~ 90%를 차지하는 것을 확인했습니다.
→
Action
이벤트성 할인 또는 프로모션 진행 시 개인과 기업고객군에 중점을 두어서 진행할 수 있습니다.
2.
구매 빈도가 높은 핵심 고객군 중 60% 이상이 개인 고객에 해당합니다. 또한 구매 금액이 높은 핵심 고객 중 절반 이상이 개인 고객입니다.
→
Action
개인 소비자가 가장 빈번하게, 큰 금액을 주문하는 것으로 확인됩니다. 가격을 단순히 올리는 방식보다는 묶음 판매나 연관판매 등으로 기업과 home office 고객의 구매력을 높이는 대안을 고려해볼 수 있습니다.
3-5. 상품 카테고리 분석을 통해 매출 인사이트 찾기
어떤 상품이 인기가 많은지, 또 얼마나 많이 팔리고 있는지 확인해봤습니다.
쿼리
1. 가장 많이 팔린 물건은 office supplies 카테고리내에서도 Binders가 가장 많이 팔렸습니다.
2. 두번째로 많이 팔린 물건은 Paper, 세번째는 Art 가 많이 팔렸습니다.
3. binder → paper → furnishings → phones 순으로 고객이 많이 찾는 상품의 카테고리를 알 수 있었습니다.
각 세부카테고리에서 개인, 기업 그리고 홈오피스 고객이 주문한 건수와 비율을 확인해보겠습니다.
category | sub_category | 고객수 | 수량 | 개인구매수 | 기업구매수 | 홈오피스구매수 | 개인구매수비율 | 기업구매수비율 | 홈오피스비율 |
Office Supplies | Binders | 335 | 2067 | 168 | 103 | 64 | 0.4654 | 0.5049 | 0.5 |
Office Supplies | Paper | 305 | 1702 | 157 | 94 | 54 | 0.4349 | 0.4608 | 0.4219 |
Office Supplies | Art | 223 | 1101 | 123 | 56 | 44 | 0.3407 | 0.2745 | 0.3438 |
Furniture | Furnishings | 248 | 1097 | 133 | 67 | 48 | 0.3684 | 0.3284 | 0.375 |
Technology | Phones | 244 | 1090 | 118 | 73 | 53 | 0.3269 | 0.3578 | 0.4141 |
Technology | Accessories | 216 | 1079 | 111 | 59 | 46 | 0.3075 | 0.2892 | 0.3594 |
Office Supplies | Storage | 237 | 1022 | 115 | 73 | 49 | 0.3186 | 0.3578 | 0.3828 |
Furniture | Chairs | 149 | 674 | 73 | 46 | 30 | 0.2022 | 0.2255 | 0.2344 |
Office Supplies | Appliances | 147 | 654 | 80 | 50 | 17 | 0.2216 | 0.2451 | 0.1328 |
Office Supplies | Labels | 104 | 448 | 61 | 25 | 18 | 0.169 | 0.1225 | 0.1406 |
Furniture | Tables | 96 | 390 | 44 | 28 | 24 | 0.1219 | 0.1373 | 0.1875 |
Furniture | Bookcases | 73 | 276 | 46 | 19 | 8 | 0.1274 | 0.0931 | 0.0625 |
Office Supplies | Fasteners | 63 | 249 | 35 | 15 | 13 | 0.097 | 0.0735 | 0.1016 |
Office Supplies | Envelopes | 68 | 241 | 26 | 29 | 13 | 0.072 | 0.1422 | 0.1016 |
Office Supplies | Supplies | 58 | 192 | 33 | 17 | 8 | 0.0914 | 0.0833 | 0.0625 |
Technology | Machines | 30 | 121 | 8 | 13 | 9 | 0.0222 | 0.0637 | 0.0703 |
Technology | Copiers | 22 | 73 | 9 | 6 | 7 | 0.0249 | 0.0294 | 0.0547 |
쿼리
1. 홈 오피스 고객과 기업 고객의 주문 건수 절반 이상이 binders 카테고리에서 발생하는 것을 확인했습니다.
2. 이외의 카테고리 상품별 구매 비율에 특이사항은 보이지 않았습니다.
3-6. 지역별 구매 현황 분석하기
records 테이블에는 city(도시), state(주), region(지역) 데이터가 존재합니다. 해당 데이터들을 활용해서 어떤 지역에서 해당 서비스를 많이 사용하는지, 어떤 상품을 주로 구매하고, 어떤 소비자군이 분포하는지 확인해보도록 하겠습니다.
쿼리
1. 뉴욕 > 캘리포니아 > 워싱턴 > 펜실베니아 > 일리노이 > 텍사스순으로 주문이 많이 발생하는 것을 확인했습니다. 하지만, 해당 주들은 미국 내 높은 인구수를 차지하기 때문에 의미있는 결과는 아니라고 판단했습니다.
2. 미국 내 인구수 3위인 플로리다의 경우는 그에 반해 총주문수가 32건으로 뉴욕에 비해 약 10배 차이가 나며 저조한 것을 확인했습니다. 이유는 현 데이터만으로는 파악하기 힘들어 보입니다.
쿼리
인기 상품 카테고리는 지역별로 동일한 것을 확인할 수 있었습니다.
쿼리
일리노이 시카고 : others(19)→ promising_VIP_M(17) → Hiberating(12) → VIP_left(8) → VIP(7)
뉴욕주 뉴욕시티 : others(39) → promising_VIP_M(31) → Hiberating(25) → VIP(18) → VIP_left(12) → promising_VIP_F(8)
펜실베니아 필라델피아 : promising_VIP_M(30) → Hiberating(17) → others(16) → VIP_left(13) → VIP(11)
캘리포니아 로스앤젤레스 : others(33) → Hiberating(31) → promising_VIP_M(28) → VIP(13) → VIP_left(10)
캘리포니아 샌프란시스코 : others(26) → promising_VIP_M(18) → Hiberating(16) → VIP(14) → promising_VIP_F(8) , VIP_left(8)
워싱턴 시애틀 : others(21) → Hiberating(15) → promising_VIP_M(14) → VIP(13) → VIP_left(11)
눈에 띄는 결과 중에 하나가 필라델피아 지역입니다.
타지역은 others 인 핵심 고객이 아닌 고객이 가장 많은 반면,
필라델피아는 구매 빈도가 높은 고객군(우량후보F)이 타지역 대비 상대적으로 많습니다.
뉴욕 은 전체 지역 중 주문수가 가장 많지만 상대적으로 핵심 고객이 많지는 않습니다.
로스앤젤레스 지역은 인구 수에 비해 저수익성 고객이 많고, 핵심 고객이 적은 것으로 파악됐습니다.
4. 대응 방안
1. 떠나간 VIP(VIP_left) 의 재획득 전략
2. 기존 VIP(VIP) 의 로얄티 획득 전략
3. 리타겟팅 전략
4-1. 떠나간 VIP의 재획득 전략
•
타겟 고객 : VIP_left
•
기대효과 : 이탈위기 고객의 구매 재활성화
떠난 VIP는 과거 VIP였던 만큼 중요하지만 이탈 위험이 큰 고객입니다. 이들을 재획득하고 활성화하기 위해 지속적으로 커뮤니케이션하여 충성고객으로 만드는 것이 중요합니다.
잠깐
떠나간 VIP는 얼마나 중요할까요?
쿼리
•
전체 매출 영향도( VIP vs VIP_left)
RFM 유형 | 전체 고객 수 | 매출액 합계 | 고객 당 평균 매출액 | 전체 주문 수 | 고객 당 평균 주문 수 | 주문 당 평균 매출액 |
떠난 VIP | 47 | 149446.49 | 3179.71 | 174 | 3.7 | 858.89 |
VIP | 66 | 181789.33 | 2754.38 | 276 | 4.18 | 658.66 |
고객 1명당 평균 매출액, 주문건수당 평균 매출액이 VIP 보다 VIP_left 고객군이 더 크다는 점에서 복귀한다면 큰 LTV를 가져다줄 수 있다고 볼 수 있습니다.
•
Recency 비교해보기
쿼리
VIP_left 의 마지막 주문일로부터 경과일수의 중앙값은 95일로 중요 고객군 중 가장 길지만 이전의 구매 주기는 가장 짧았던(중앙값 : 56일) 고객이라는 사실을 확인할 수 있습니다.
즉, 떠난 VIP는 구매력뿐만 아니라 서비스를 적극적으로 활용하는 유저였다는 것을 파악할 수 있습니다.
VIP_left 의 타겟 대응 전략은 다음과 같이 생각해볼 수 있습니다.
고객의 구매 데이터를 참고한 개인 메세지나 이메일, sns 로 마케팅할 수 있습니다.
고객군이 VIP_left 이면서 구매를 가장 많이 한 유저(SJ-20125)를 예시로 마케팅 대안을 제시해보겠습니다.
고객 아이디 : SJ-20125
고객 정보
•
고객 세그먼트 : Home Office
•
2020 3월 23일 ~ 2020 9월 26일 까지 구매기록이 있음
•
총 주문 금액 2,338 달러 , 주문수 7건
구입 상품 정보
•
세 카테고리(Office Supplies, Furniture, Technology) 모두 구매경험이 있음
•
전체 7번의 구매 중 4번 Office Supplies(사무용품)을 구매하였고 주문 수량도 20으로 가장 많았음
•
가구와 전자제품은 사무용품에 비해 주문 횟수와 주문량이 적지만 단가가 높아 각각 사무용품에 비해 주문 금액이 8배, 16배 이상임
•
바인더, 의자, 종이류의 주문 횟수는 모두 2로 이후 구매 가능성이 있음
•
같은 카테고리 내 동일한 상품을 주문하지 않고 모두 다른 상품(product_id)을 구매하였음
쿼리
4-2. 기존 VIP의 로열티 획득 전략
•
타겟 : VIP
•
기대효과 : 로열티 확보 | 추가 고객 유도 | 잠재 VIP 이동 유도
VIP는 LTV가 가장 높을 것으로 예상되는 고객으로, 지속적으로 서비스를 이용할 수 있게끔 하는 것이 중요합니다. 또한 VIP에 대한 높은 서비스는 잠재 VIP를 VIP로 유도하는 효과를 낳기도 합니다.
일반적으로 다양한 특별 혜택 제공, 결제 할인 쿠폰팩 등의 방식으로 로얄티를 확보합니다. 더 나아가 AI를 활용해서 고객 행동 분석을 통한 교차판매 전략 마케팅을 제공하는 것도 정확하고 효율적인 대안입니다.
1. 무료 배송 서비스 제공하기
VIP 고객의 배송 서비스 사용 형태를 파악해봤습니다.
결론>> 고객군별 사용하는 배송서비스의 큰 차이를 확인하지 못했습니다. 거의 모든 고객군이 기본 배송 서비스를 사용한다는 것으로 보아 배송 업그레이드 마케팅 대안보다는 배송 무료 혜택을 VIP 고객군을 대상으로 먼저 진행해보고 향후 영향력을 파악하는 것이 좋을 것 같습니다.
쿼리
2. 묶음 패키지 할인 제공하기
쿼리
바인더, 종이가 VIP고객군이 가장 많이 구매하는 상품이라는 것을 확인할 수 있었습니다.
두번째로는 많이 구매하는 상품군들은 전자제품 중에서도 악세사리류나 휴대폰을 많이 구매한다는 것을 확인할 수 있습니다.
3. 고객군별 할인 쿠폰팩에 차등을 두어 VIP 고객군 유지하기
다음의 예시는 ‘현대홈쇼핑’의 멤버십 제도입니다. 고객 멤버십별로 제공하는 할인 쿠폰팩과 적립 포인트에 차등을 두는 마케팅을 활용하고 있습니다.
4-3. 리타겟팅 전략 : 방문을 유도하는 혜택 제공
•
타겟 : 우량후보F(promising_VIP_F) , Others(신규고객)
•
기대효과 : 재방문 유도 및 활성 사용자 비율 증가
이커머스 시장에서는 고객의 구매력(Monetary) 보다도 사용률(Frequency)을 더욱 중요하게 판단하는 경우가 많습니다.
위의 promising_VIP_F은 구매력이 갖춰진 고객이지만 상대적으로 이용 빈도는 낮습니다. 해당 고객군에게 좋은 구매 경험을 제공한다면 높은 LTV를 가져다줄 가능성이 높습니다.
중요하게 보아야 할 데이터 수치는 평균 주문 주기(frequency)와 마지막 구매일로부터의 평균 경과일수(recency) 입니다.
마지막 주문일로부터의 경과일수보다 평균 주문 주기가 더 길다면 평균 주문 주기를 더 줄일 수 있도록 구매를 유도하는 마케팅을 제공할 수 있습니다.
5. 결론
5-1. 요약
•
이 프로젝트의 목적은 고객군을 새로 정의하고 분석하여 그에 맞는 마케팅 대안을 제시하기 위한 것입니다.
•
RFM, LTV 지표를 통해 관리 고객군(VIP, 떠나간 VIP, 우량후보F, 우량후보M)을 선정했습니다.
•
지역별 고객군의 분포 양상을 확인했습니다.
◦
문제점 : 핵심 고객 분포율(특히 VIP)이 떨어집니다. 지역마다 특이점이 나타나지 않았습니다.
◦
목표 : 고객의 리텐션을 끌어올려 활성 이용자수의 점유율을 높이는 것이 중요해보입니다.
•
고객군별 LTV를 계산하여 핵심 고객 중 ‘우량후보F’ 군과 ‘떠나간VIP’ 군의 중요성을 확인하였습니다.
◦
목표 : 리텐션을 높이고 구매 빈도수를 늘리는 대안을 제시했습니다.
•
대표적인 3가지 대안을 제시하여 고객의 RFM 지표를 개선하는 대안을 제시하였습니다.
◦
재획득 전략 : ‘떠나간 VIP’ 군을 타겟으로 하여 개인화된 메세지나 메일등으로 서비스를 재사용할 수 있게 유도하는 전략
◦
로얄티 획득 전략 : ‘VIP’ 군을 타겟으로 하여 로열티를 확실하게 확보하고 유지할 수 있도록 배송 무료 혜택이나 묶음 패키지 할인 혜택을 제공하는 전략
◦
리타겟팅 전략 : ‘우량후보 F’ 즉, 잠재VIP가 될 수 있거나 신규고객들을 대상으로 하여 재구매할 수 있도록 구매 전후를 관리하는 전략
5-2. 추후 진행해볼 STEP
•
A/B테스트 : 앞서 제시한 여러 대안 중 하나를 실제 A/B 테스트로 실험해보고 결과를 통해 효과를 분석해볼 수 있습니다.
•
유입 채널 데이터 분석 : 고객들의 유입 채널 데이터가 존재한다면 채널 별로 추가 분석을 진행해볼 수 있습니다. 채널별로 구체적인 마케팅 대안을 제시할 수 있습니다.
•
퍼널 분석 : 해당 서비스의 퍼널별 데이터가 존재한다면 고객들이 어떤 구간에서 이탈하고 어떤 패턴 형태가 전환율이 높은지, 고객들이 유도한 루트로 사용하고 있는지 추적해 볼 수 있습니다. 이를 토대로 고객의 행동을 더욱 구체적으로 분석하여 서비스를 개선할 수 있습니다.
•
장기적인 비교 분석 : 현재 데이터는 약 1년치의 데이터밖에 되지 않기 때문에 장기간에 걸쳐서 데이터를 쌓아분석한다면 고객군의 변화 추이를 자세히 관찰하고 정확도를 높일 수 있을 것입니다.
6. 마무리하며
잘해낼 수 있었던 부분들
•
고객 분석 프로젝트를 가볍게나마 완성했습니다.
•
직접 데이터를 보면서 내가 원하는 분석 방향성에 맞게 가공하고 결과를 만들어낼 수 있었습니다.
•
제안 프로젝트의 개괄적인 흐름과 구성을 경험해볼 수 있었습니다.
•
초기 프로젝트의 어려움을 다른 분석가분들의 velog, tistory 등을 참고하여 도움을 얻을 수 있었습니다.
어려웠거나 앞으로 개선이 필요한 부분들
•
혼자 하려다보니 너무 많은 시간을 할애했고 분석 과정에 대해 스스로 확신하지 못하는 경우도 있었습니다.
•
추가적인 데이터가 없어 개인적인 추측이나 근거 없는 대안을 제시하는 것에 대한 아쉬움이 있었습니다.
◦
실험테스트를 진행해본다거나 추가적인 데이터를 분석하여 신뢰성을 강화하는 것이 필요할 것 같습니다.