Search

US E-Commerce RFM 분석 프로젝트

상태
완료
github 링크
없음
Colab 링크
Tableau 링크
없음
Tools
SQL
Excel
목차

1.분석의 목적

US E-Commerce Records 2020 데이터에는 recordscustomer_stats , 총 2개의 테이블이 있습니다. 해당 e-commerce를 사용하는 고객의 카테고리를 만들어 Retention 분석하는 것을 1차 목표로 합니다. 구매력에 따른 RFM 분석으로 고객 세분화를 진행하고, 어떤 카테고리의 상품이 많이 팔리는지, 지역에 따라 어떤 매출 양상을 보이는지 확인해 타겟 마케팅 아이디어에 활용하는 것이 최종 목표입니다.

2. 데이터 설명

solvesql의 US E-Commerce Records 2020 데이터를 사용했습니다.
US E-Commerce Records 2020 데이터셋의 원본 출처는 Kaggle입니다.
데이터가 수집된 기간은 2020-01-02 ~ 2020-12-30 으로, 약 1년입니다.
데이터 셋 설명
테이블 : records , customer_stats
records
customer_stats
→ 한명의 고객이 다수의 주문을 할 수 있기때문에 customer_statsrecords1:N 관계
1) records : 주문 데이터
칼럼명
설명
데이터 타입
order_date
주문 날짜
date
order_id : key
주문 ID
string
ship_mode
배송 타입
string
customer_id
고객 ID
string
segment
고객 타입
string
country
국가
string
city
도시
string
state
string
postal_code
우편 번호
integer
region
지역
string
product_id
상품ID
string
category
카테고리
string
sub_category
서브카테고리
string
product_name
상품명
string
sales
매출
number
quantity
수량
integer
discount
할인
number
profit
이익
number
2) customer_stats : 고객 데이터
컬럼명
설명
데이터 타입
customer_id : key
고객 ID
string
first_order_date
첫 주문일
date
last_order_date
마지막 주문일
date
cnt_orders
주문 횟수
integer
sum_sales
매출 합계
number

3.EDA

3-1. Retention 분석

AARRR 마케팅 데이터 분석 단계 중 가장 중요한 단계인 Retention 분석을 진행해봅니다. 해당 서비스의 특징을 고려해서 ‘롤링 리텐션’ 방법으로 분석을 진행했습니다.
롤링 리텐션을 선택한 이유
→ 매일같이 사용하는 SNS, 혹은 일정한 간격으로 이용하는 서비스가 아니라는 점을 참고해, 롤링 리텐션으로 결정했습니다. 다만, 이상치의 영향을 많이 받는 특징을 고려해 지표의 추이를 살펴보는 정도로만 참고하는데 의의를 두었습니다.
첫달 구매수 쿼리
첫 구매 후 다음달 이탈하지 않은 사용자 수
첫 주문 이후 마지막 기준 12월달까지 롤링 리텐션 비율
리텐션 차트를 통해 다음과 같이 예상할 수 있었습니다.
1.
기간에 따른 유지율을 봤을 때 초기에 떨어지는 속도가 느린반면 평균적으로 6개월 이상이 경과하면서 떨어지는 속도가 커집니다. 안정화 단계를 빠르게 만들어내기 위해 고객과의 지속적인 커뮤니케이션과 프로모션 이벤트를 꾸준히 하는 것이 필요해보입니다.
2.
60일이라는 동일한 기간을 놓고 봤을 때, 2월의 리텐션은 90%를 윗도는 매우 높은 값을 보였습니다. 2월에 주문한 고객들의 이용 동선을 확인할 필요가 있습니다.
3.
3월의 신규 주문 수가 가장 높았습니다. 어떤 이유로 가장 많은 주문 수가 발생했는지, 해당 월에 어떤 마케팅을 진행했는지 알아볼 필요가 있습니다.
4.
월 신규 주문 건수가 하락하는 추세입니다. 어떤 이유로 하락하고 있는건지 살펴볼 필요가 있습니다.

3-2. 코호트 분석

1.
시간에 따른 사용자의 유지와 이탈 패턴을 확인합니다.
2.
코호트 간의 상이한 행동 패턴을 확인해봅니다.
코호트는 다양한 목적과 기준으로 만들어볼 수 있습니다. 현 데이터셋에 만들어볼 수 있는 코호트를 아래와 같이 잡아봤습니다. - 구매력별 코호트 → RFM 분석 - 배송 타입별 코호트 - 고객 타입별 코호트( 개인 / 기업 / home-office ) - 도시별 코호트 - 주별 코호트 - 지역 별 코호트 - 카테고리별 코호트 - 매출별 코호트 - 첫 구매 월별 코호트 - 주문 횟수 카테고리별 코호트

RFM 분석

WHY : RFM 분석을 진행한 이유 마케팅 관점에서 customer_stats 의 정보를 활용한다면 고객 세그먼트별 인사이트를 도출해낼 수 있을 것이라 판단했습니다. 주어진 데이터를 참고했을 때, 고객 세그먼트 방법 중 사용자 구매력에 따른 세그먼트를 활용할 수 있습니다. (첫 주문일, 마지막 주문일, 주문 횟수, 매출)의 정보가 담겨있기 때문입니다.
[RFM 분석의 기준]
Recency : 최근에 구매했는가
Frequency : 자주 구매했는가
Monetary : 얼마나 구매했는가
이커머스라는 서비스의 환경을 고려해서 Recency의 기준 : 2020년 12월 30일을 기준으로 마지막 주문일과의 간격 Frequency의 기준 : 2020년 12월 30일을 기준으로 고객의 총 주문 횟수 Monetary의 기준 : 2020년 12월 30일을 기준으로 고객이 주문한 총매출액
  2020-12-30일을 기준으로 recency를 판별할 수 있는 기본 세팅을 진행합니다.
RFM을 분석하기 위한 세팅
Recency
 위의 쿼리 결과에서 last_term에 해당하는 분포를 시각화했습니다.
→ 2020년은 최근 거래한(3달 이내) 고객 수가 더 많았습니다. → 구매자의 50% 이상이 12월 30일 기준 60일 이내로 상품을 구매했으며, 가장 높은 분포를 보이는 경과일 수는 15일에서 30일 사이로 확인(주문한 고객의 약 25%)됩니다.
 고객 별 평균 구매 주기 계산해보기
select customer_id ,round(datediff(last_order_date,first_order_date) / (cnt_orders-1) ,2) as periods -- 구매 주기 from customer_stats where cnt_orders >= 2;
SQL
복사
→ 상위 25%의 구입자는 1~51일 사이(2달 이내)의 구입 주기를 가지고 있습니다. → 상위 50%의 구입자는 1~80일 사이(3달 이내)의 구입 주기를 가지고 있습니다. → 1달 ~ 2달 사이의 구매 주기가 평균적으로 가장 많은 것으로 파악됐습니다.
Frequency : 얼마나 주문을 자주 했는지
  2020년 12월 30일을 기준으로 frequency를 구하겠습니다.
select customer_id ,cnt_orders from customer_stats;
SQL
복사
주문 수가 1~3건 사이에 몰려있습니다. → 구매자의 50% 이상이 2회 이상 상품을 구매한 것을 확인할 수 있습니다.
Monetary
2020년 12월 30일을 기준으로 Monetary 를 구해봅니다.
→ 꼬리가 오른쪽으로 긴 분포로 아웃라이어가 존재함을 예측할 수 있습니다. → 매출액의 편차는 1464 달러로 큰 편입니다. → 고객 중 절반이 총금액 약 600달러 이하로 소비하는 것을 확인했습니다. 따라서, 주문하는 금액은 고객별 편차가 심하나, 전반적으로 절반의 고객들은 해당 온라인 마켓에서 낮은 금액대의 상품을 구매하는 것으로 확인할 수 있었습니다.
RFM 기준값 설정
스케일
주문 고객 수가 693명으로 많지 않기때문에 일반적인 1-2개의 스케일을 사용합니다.
카테고리 분류 기준 ( 사분위수 사용 )
사분위수를 사용한 이유는 RFM의 지표들만 봤을 때 모두 아웃라이어가 존재하고, 평균값과 편차가 크기 때문입니다.
상위 25%를 1(중요고객), 그외 나머지 75%을 0(하위고객)으로 설정했습니다.
분류 기준 표
Recency
Frequency
Monetary
1(상위 25%)
51일 이내
3회 이상
1335 달러 이상
0(하위 75%)
52일 초과
2회 이하
1334 달러 미만
왜 Recency의 기준을 구매 이후 51일로 잡았는지
쿼리
고객별 세분화 결과
쿼리
고객 유형 세분화와 관리 대상 세그먼트 결정
총 8개의 세그먼트에서 관리 대상군은 4개로 선정했습니다. 비용 대비 마케팅 투자를 했을 때 효과가 보일 집단들로 추렸습니다.
recency
frequency
monetary
고객 수
고객 유형
설명
1
1
1
66
VIP
서비스를 적극적으로 사용하는 필수 고객
1
0
1
30
우량후보(F)
구매력이 높은 고객, Frequency 지수를 개선할 필요가 있는 고객
0
1
1
47
떠난 VIP
제품을 자주 구매하고, 구매력도 높지만 최근에 방문하지 않은 고객. 이탈 우려가 있는 고객
1
1
0
112
우량후보(M)
구매 빈도가 높은 고객, Monetary 지수를 개선할 필요가 있는 고객
0
0
1
30
기타
관찰이 필요한 고객군
0
1
0
68
기타
관찰이 필요한 고객군
1
0
0
107
기타
관찰이 필요한 고객군
0
0
0
233
저수익성 고객
구입 가능성도 낮고, LTV도 낮을 것으로 예측되는 고객군
세그먼트별 고객수 구하는 쿼리
결과
RFM 세그먼트 라벨링
관리 고객의 영향도 파악
현재 2020년 12월 30일을 기준으로 관리가 필요한 고객은 225명(VIP, VIP_left, promising_VIP_F, promising_VIP_M), 전체 고객 수의 약 36.8% 입니다.
쿼리
이제, 고객 세그먼트별 매출액 점유율이 어떻게 되는지 확인해봅니다.
중요 고객군의 매출액 점유율은 전체 매출의 67.14%를 차지합니다. 그만큼 관리 고객의 가치가 높다고 판단됩니다.
쿼리
RFM 분석의 한계점 1. 고객의 복잡한 구매 패턴을 단순히 3가지 요인으로만 분석한다는 점 2. 실제 서비스에 활용하기 어려운 부분이 있다는 점

3-3. LTV 계산하기

LTV는 “고객 평생 가치” 라고 부른다.
한 명의 고객이 기업과 거래를 시작한 다음 이를 멈출 때까지의 기간을 “고객 라이프 사이클”이라고 한다.
LTV는 한 명의 고객이 “고객 라이프 사이클 기간 동안 기업에 얼마만큼의 이익을 가져왔는가”를 정량적으로 합한 것입니다.
LTV가 높다는 것은 결국 고객이 장기적으로 기업의 제품을 계속 선택하고 있다는 것을 말합니다. 즉, 충성도가 높은 고객군일수록 LTV가 높게 나옵니다.
계산식은 다음을 사용하겠습니다.
이익×거래 기간(라이프타임)× {1 / (1 + 할인율)} (현재 가치 계수)
고객군별 LTV 결과표
- rfm_avg_profit : 고객군별 평균 이익 - rfm_avg_term : 고객군별 평균 거래 기간 - rfm_avg_discount : 고객군별 평균 할인율 - rfm_ltv : 고객군별 LTV
쿼리
promising_VIP_F 고객군의 LTV 가 약 6400, VIP_left 고객군의 LTV는 약 1800으로 1,2등을 차지했습니다. 이 고객군을 중심으로 한 마케팅의 개선이 필요하다고 판단했습니다.
일반적으로 LTV를 늘리기 위한 대응방안은 아래와 같습니다.
1) 객단가를 올린다
2) 구매 빈도를 높인다
3) 계속 이용하도록 유도한다
promising_VIP_F 고객군의 경우, 2)가 적합한 대안으로 보입니다. VIP_left 고객군의 경우에는 서비스를 사용한지 꽤 됐으므로 3)의 방법으로 적절하게 대응하면 좋을 것 같습니다.

3-4. 기존의 segment와 연관지어 인사이트 얻어보기

기존 segment(Consumer, Coporate, Home Office)별로 앞서 만든 RFM 세그먼트들이 어떻게 분포하는지 확인해봤습니다.
- vip_pct : VIP고객중 해당 segment의 비율 - promising_vip_m_pct : 구매 빈도가 높은 핵심 고객 중 해당 segment의 비율 - promising_vip_f_pct : 구매력이 높은 핵심 고객 중 해당 segment의 비율 - vip_left_pct : 이탈 우려가 있는 VIP 고객 중 해당 segment의 비율
쿼리
인사이트
1.
모든 RFM 고객군에서 개인과 기업 고객이 약 80 ~ 90%를 차지하는 것을 확인했습니다. → Action
이벤트성 할인 또는 프로모션 진행 시 개인과 기업고객군에 중점을 두어서 진행할 수 있습니다.
2.
구매 빈도가 높은 핵심 고객군 중 60% 이상개인 고객에 해당합니다. 또한 구매 금액이 높은 핵심 고객 중 절반 이상이 개인 고객입니다.
Action
개인 소비자가 가장 빈번하게, 큰 금액을 주문하는 것으로 확인됩니다. 가격을 단순히 올리는 방식보다는 묶음 판매나 연관판매 등으로 기업과 home office 고객의 구매력을 높이는 대안을 고려해볼 수 있습니다.

3-5. 상품 카테고리 분석을 통해 매출 인사이트 찾기

어떤 상품이 인기가 많은지, 또 얼마나 많이 팔리고 있는지 확인해봤습니다.
쿼리
1. 가장 많이 팔린 물건은 office supplies 카테고리내에서도 Binders가 가장 많이 팔렸습니다. 2. 두번째로 많이 팔린 물건은 Paper, 세번째는 Art 가 많이 팔렸습니다. 3. binder → paper → furnishings → phones 순으로 고객이 많이 찾는 상품의 카테고리를 알 수 있었습니다.
각 세부카테고리에서 개인, 기업 그리고 홈오피스 고객이 주문한 건수와 비율을 확인해보겠습니다.
category
sub_category
고객수
수량
개인구매수
기업구매수
홈오피스구매수
개인구매수비율
기업구매수비율
홈오피스비율
Office Supplies
Binders
335
2067
168
103
64
0.4654
0.5049
0.5
Office Supplies
Paper
305
1702
157
94
54
0.4349
0.4608
0.4219
Office Supplies
Art
223
1101
123
56
44
0.3407
0.2745
0.3438
Furniture
Furnishings
248
1097
133
67
48
0.3684
0.3284
0.375
Technology
Phones
244
1090
118
73
53
0.3269
0.3578
0.4141
Technology
Accessories
216
1079
111
59
46
0.3075
0.2892
0.3594
Office Supplies
Storage
237
1022
115
73
49
0.3186
0.3578
0.3828
Furniture
Chairs
149
674
73
46
30
0.2022
0.2255
0.2344
Office Supplies
Appliances
147
654
80
50
17
0.2216
0.2451
0.1328
Office Supplies
Labels
104
448
61
25
18
0.169
0.1225
0.1406
Furniture
Tables
96
390
44
28
24
0.1219
0.1373
0.1875
Furniture
Bookcases
73
276
46
19
8
0.1274
0.0931
0.0625
Office Supplies
Fasteners
63
249
35
15
13
0.097
0.0735
0.1016
Office Supplies
Envelopes
68
241
26
29
13
0.072
0.1422
0.1016
Office Supplies
Supplies
58
192
33
17
8
0.0914
0.0833
0.0625
Technology
Machines
30
121
8
13
9
0.0222
0.0637
0.0703
Technology
Copiers
22
73
9
6
7
0.0249
0.0294
0.0547
쿼리
1. 홈 오피스 고객과 기업 고객주문 건수 절반 이상binders 카테고리에서 발생하는 것을 확인했습니다. 2. 이외의 카테고리 상품별 구매 비율에 특이사항은 보이지 않았습니다.

3-6. 지역별 구매 현황 분석하기

records 테이블에는 city(도시), state(주), region(지역) 데이터가 존재합니다. 해당 데이터들을 활용해서 어떤 지역에서 해당 서비스를 많이 사용하는지, 어떤 상품을 주로 구매하고, 어떤 소비자군이 분포하는지 확인해보도록 하겠습니다.
  먼저 간단하게 각 지역마다 얼만큼 주문 건수가 발생했는지 확인해봤습니다.
쿼리
1. 뉴욕 > 캘리포니아 > 워싱턴 > 펜실베니아 > 일리노이 > 텍사스순으로 주문이 많이 발생하는 것을 확인했습니다. 하지만, 해당 주들은 미국 내 높은 인구수를 차지하기 때문에 의미있는 결과는 아니라고 판단했습니다. 2. 미국 내 인구수 3위인 플로리다의 경우는 그에 반해 총주문수가 32건으로 뉴욕에 비해 약 10배 차이가 나며 저조한 것을 확인했습니다. 이유는 현 데이터만으로는 파악하기 힘들어 보입니다.
 각 지역마다 어떤 상품 카테고리가 많이 팔렸는지 확인해봤습니다.
쿼리
인기 상품 카테고리지역별로 동일한 것을 확인할 수 있었습니다.
 각 지역마다 어떤 고객군들이 분포하고 있는지 확인해보겠습니다.
쿼리
일리노이 시카고 : others(19)→ promising_VIP_M(17) → Hiberating(12) → VIP_left(8) → VIP(7)
뉴욕주 뉴욕시티 : others(39) → promising_VIP_M(31) → Hiberating(25) → VIP(18) → VIP_left(12) → promising_VIP_F(8)
펜실베니아 필라델피아 : promising_VIP_M(30) → Hiberating(17) → others(16) → VIP_left(13) → VIP(11)
캘리포니아 로스앤젤레스 : others(33) → Hiberating(31) → promising_VIP_M(28) → VIP(13) → VIP_left(10)
캘리포니아 샌프란시스코 : others(26) → promising_VIP_M(18) → Hiberating(16) → VIP(14) → promising_VIP_F(8) , VIP_left(8)
워싱턴 시애틀 : others(21) → Hiberating(15) → promising_VIP_M(14) → VIP(13) → VIP_left(11)
눈에 띄는 결과 중에 하나가 필라델피아 지역입니다. 타지역others 인 핵심 고객이 아닌 고객이 가장 많은 반면, 필라델피아구매 빈도가 높은 고객군(우량후보F)이 타지역 대비 상대적으로 많습니다. 뉴욕 은 전체 지역 중 주문수가 가장 많지만 상대적으로 핵심 고객이 많지는 않습니다. 로스앤젤레스 지역은 인구 수에 비해 저수익성 고객이 많고, 핵심 고객이 적은 것으로 파악됐습니다.

4. 대응 방안

 추가로 만들어 본 고객 세그먼트별 대응 방안을 생각하여 아래와 같이 정리해봤습니다.
1. 떠나간 VIP(VIP_left) 의 재획득 전략 2. 기존 VIP(VIP) 의 로얄티 획득 전략 3. 리타겟팅 전략

4-1. 떠나간 VIP의 재획득 전략

타겟 고객 : VIP_left
기대효과 : 이탈위기 고객의 구매 재활성화
떠난 VIP는 과거 VIP였던 만큼 중요하지만 이탈 위험이 큰 고객입니다. 이들을 재획득하고 활성화하기 위해 지속적으로 커뮤니케이션하여 충성고객으로 만드는 것이 중요합니다.
잠깐   떠나간 VIP는 얼마나 중요할까요?
쿼리
전체 매출 영향도( VIP vs VIP_left)
RFM 유형
전체 고객 수
매출액 합계
고객 당 평균 매출액
전체 주문 수
고객 당 평균 주문 수
주문 당 평균 매출액
떠난 VIP
47
149446.49
3179.71
174
3.7
858.89
VIP
66
181789.33
2754.38
276
4.18
658.66
고객 1명당 평균 매출액, 주문건수당 평균 매출액VIP 보다 VIP_left 고객군이 더 크다는 점에서 복귀한다면 큰 LTV를 가져다줄 수 있다고 볼 수 있습니다.
Recency 비교해보기
쿼리
VIP_left 의 마지막 주문일로부터 경과일수의 중앙값은 95일로 중요 고객군 중 가장 길지만 이전의 구매 주기는 가장 짧았던(중앙값 : 56일) 고객이라는 사실을 확인할 수 있습니다.
즉, 떠난 VIP는 구매력뿐만 아니라 서비스를 적극적으로 활용하는 유저였다는 것을 파악할 수 있습니다.
VIP_left 의 타겟 대응 전략은 다음과 같이 생각해볼 수 있습니다.
  개인화 마케팅 전략을 생각해볼 수 있습니다.  VIP 이메일, SMS, 알림톡 등을 활용해서 필수 고객임을 어필하거나 고객 맞춤 상품을 추천해준다거나 할인 쿠폰등으로 적극적으로 관심을 유도하는 것이 필요합니다.
 고객 맞춤 마케팅 제안은 다음과 같이 할 수 있을 것입니다.
고객의 구매 데이터를 참고한 개인 메세지나 이메일, sns 로 마케팅할 수 있습니다.
고객군이 VIP_left 이면서 구매를 가장 많이 한 유저(SJ-20125)를 예시로 마케팅 대안을 제시해보겠습니다.
고객 아이디 : SJ-20125
고객 정보
고객 세그먼트 : Home Office
2020 3월 23일 ~ 2020 9월 26일 까지 구매기록이 있음
총 주문 금액 2,338 달러 , 주문수 7건
구입 상품 정보
세 카테고리(Office Supplies, Furniture, Technology) 모두 구매경험이 있음
전체 7번의 구매 중 4번 Office Supplies(사무용품)을 구매하였고 주문 수량도 20으로 가장 많았음
가구와 전자제품은 사무용품에 비해 주문 횟수와 주문량이 적지만 단가가 높아 각각 사무용품에 비해 주문 금액이 8배, 16배 이상임
바인더, 의자, 종이류의 주문 횟수는 모두 2로 이후 구매 가능성이 있음
같은 카테고리 내 동일한 상품을 주문하지 않고 모두 다른 상품(product_id)을 구매하였음
쿼리

4-2. 기존 VIP의 로열티 획득 전략

타겟 : VIP
기대효과 : 로열티 확보 | 추가 고객 유도 | 잠재 VIP 이동 유도
VIP는 LTV가 가장 높을 것으로 예상되는 고객으로, 지속적으로 서비스를 이용할 수 있게끔 하는 것이 중요합니다. 또한 VIP에 대한 높은 서비스는 잠재 VIP를 VIP로 유도하는 효과를 낳기도 합니다.
일반적으로 다양한 특별 혜택 제공, 결제 할인 쿠폰팩 등의 방식으로 로얄티를 확보합니다. 더 나아가 AI를 활용해서 고객 행동 분석을 통한 교차판매 전략 마케팅을 제공하는 것도 정확하고 효율적인 대안입니다.
 VIP 의 주문수, 마지막 주문일로부터 경과일수, 주문 주기 등을 타 고객군과 비교해봤습니다.
 VIP 주문수는 우량후보M, 떠나간VIP 와 주문수는 크게 다르지 않습니다. 또, 2020년 12월 30일 기준으로 봤을 때 마지막 주문 경과일수도 크게 다르지 않습니다. 하지만, 평상시 주문 주기를 보면 타 분류군보다 짧은 것을 확인할 수 있습니다. 하지만, 주문주기의 중위값이 약 74일로 개선이 필요한 부분이라고 판단했습니다.
VIP가 더 자주 서비스를 사용하도록 하려면 어떻게 하는 것이 좋을까요
 VIP의 고객군들의 구매 특성을 확인한 후, 그에 맞는 마케팅 대안을 제시해봤습니다.
1. 무료 배송 서비스 제공하기
VIP 고객배송 서비스 사용 형태를 파악해봤습니다.
결론>> 고객군별 사용하는 배송서비스의 큰 차이를 확인하지 못했습니다. 거의 모든 고객군기본 배송 서비스를 사용한다는 것으로 보아 배송 업그레이드 마케팅 대안보다는 배송 무료 혜택을 VIP 고객군을 대상으로 먼저 진행해보고 향후 영향력을 파악하는 것이 좋을 것 같습니다.
쿼리
2. 묶음 패키지 할인 제공하기
 먼저, VIP 고객이 어떤 종류의 상품을 많이 구매하는지 확인해보겠습니다.
쿼리
바인더, 종이가 VIP고객군이 가장 많이 구매하는 상품이라는 것을 확인할 수 있었습니다. 두번째로는 많이 구매하는 상품군들은 전자제품 중에서도 악세사리류나 휴대폰을 많이 구매한다는 것을 확인할 수 있습니다.
 평소 많이 구매하는 상품군들의 묶음 패키지 할인 이벤트로 마케팅을 기획하여 VIP 고객군에게 긍정적인 구매 경험을 제공하는 것이 어떨까요?
3. 고객군별 할인 쿠폰팩에 차등을 두어 VIP 고객군 유지하기
다음의 예시는 ‘현대홈쇼핑’의 멤버십 제도입니다. 고객 멤버십별로 제공하는 할인 쿠폰팩과 적립 포인트에 차등을 두는 마케팅을 활용하고 있습니다.
 멤버십(회원 등급)에 따라 결제 쿠폰팩을 다양하게 차별화두어 마케팅을 적용해볼 수도 있을 것 같습니다.

4-3. 리타겟팅 전략 : 방문을 유도하는 혜택 제공

타겟 : 우량후보F(promising_VIP_F) , Others(신규고객)
기대효과 : 재방문 유도 및 활성 사용자 비율 증가
이커머스 시장에서는 고객의 구매력(Monetary) 보다도 사용률(Frequency)을 더욱 중요하게 판단하는 경우가 많습니다.
위의 promising_VIP_F구매력이 갖춰진 고객이지만 상대적으로 이용 빈도는 낮습니다. 해당 고객군에게 좋은 구매 경험을 제공한다면 높은 LTV를 가져다줄 가능성이 높습니다.
그렇다면 구매 주기가 길거나 이용 빈도수가 적은 고객군을 어떻게 끌어들이면 좋을까요
중요하게 보아야 할 데이터 수치는 평균 주문 주기(frequency)마지막 구매일로부터의 평균 경과일수(recency) 입니다.
마지막 주문일로부터의 경과일수보다 평균 주문 주기가 더 길다면 평균 주문 주기를 더 줄일 수 있도록 구매를 유도하는 마케팅을 제공할 수 있습니다.

5. 결론

5-1. 요약

이 프로젝트의 목적은 고객군을 새로 정의하고 분석하여 그에 맞는 마케팅 대안을 제시하기 위한 것입니다.
RFM, LTV 지표를 통해 관리 고객군(VIP, 떠나간 VIP, 우량후보F, 우량후보M)을 선정했습니다.
지역별 고객군의 분포 양상을 확인했습니다.
문제점 : 핵심 고객 분포율(특히 VIP)이 떨어집니다. 지역마다 특이점이 나타나지 않았습니다.
목표 : 고객의 리텐션을 끌어올려 활성 이용자수의 점유율을 높이는 것이 중요해보입니다.
고객군별 LTV를 계산하여 핵심 고객 중 ‘우량후보F’ 군과 ‘떠나간VIP’ 군중요성을 확인하였습니다.
목표 : 리텐션을 높이고 구매 빈도수를 늘리는 대안을 제시했습니다.
대표적인 3가지 대안을 제시하여 고객의 RFM 지표를 개선하는 대안을 제시하였습니다.
재획득 전략 : ‘떠나간 VIP’ 군을 타겟으로 하여 개인화된 메세지나 메일등으로 서비스를 재사용할 수 있게 유도하는 전략
로얄티 획득 전략 : ‘VIP’ 군을 타겟으로 하여 로열티를 확실하게 확보하고 유지할 수 있도록 배송 무료 혜택이나 묶음 패키지 할인 혜택을 제공하는 전략
리타겟팅 전략 : ‘우량후보 F’ 즉, 잠재VIP가 될 수 있거나 신규고객들을 대상으로 하여 재구매할 수 있도록 구매 전후를 관리하는 전략

5-2. 추후 진행해볼 STEP

A/B테스트 : 앞서 제시한 여러 대안 중 하나를 실제 A/B 테스트로 실험해보고 결과를 통해 효과를 분석해볼 수 있습니다.
유입 채널 데이터 분석 : 고객들의 유입 채널 데이터가 존재한다면 채널 별로 추가 분석을 진행해볼 수 있습니다. 채널별로 구체적인 마케팅 대안을 제시할 수 있습니다.
퍼널 분석 : 해당 서비스의 퍼널별 데이터가 존재한다면 고객들이 어떤 구간에서 이탈하고 어떤 패턴 형태가 전환율이 높은지, 고객들이 유도한 루트로 사용하고 있는지 추적해 볼 수 있습니다. 이를 토대로 고객의 행동을 더욱 구체적으로 분석하여 서비스를 개선할 수 있습니다.
장기적인 비교 분석 : 현재 데이터는 약 1년치의 데이터밖에 되지 않기 때문에 장기간에 걸쳐서 데이터를 쌓아분석한다면 고객군의 변화 추이를 자세히 관찰하고 정확도를 높일 수 있을 것입니다.

6. 마무리하며

잘해낼 수 있었던 부분들
고객 분석 프로젝트를 가볍게나마 완성했습니다.
직접 데이터를 보면서 내가 원하는 분석 방향성에 맞게 가공하고 결과를 만들어낼 수 있었습니다.
제안 프로젝트의 개괄적인 흐름과 구성을 경험해볼 수 있었습니다.
초기 프로젝트의 어려움을 다른 분석가분들의 velog, tistory 등을 참고하여 도움을 얻을 수 있었습니다.
어려웠거나 앞으로 개선이 필요한 부분들
혼자 하려다보니 너무 많은 시간을 할애했고 분석 과정에 대해 스스로 확신하지 못하는 경우도 있었습니다.
추가적인 데이터가 없어 개인적인 추측이나 근거 없는 대안을 제시하는 것에 대한 아쉬움이 있었습니다.
실험테스트를 진행해본다거나 추가적인 데이터를 분석하여 신뢰성을 강화하는 것이 필요할 것 같습니다.