마케팅, 추천 시스템, 의료 등에서 특정 개입(예: 광고, 쿠폰, 치료 등)이 개별 고객에게 실제로 긍정적인 영향을 주었는지를 예측하기 위한 모델
단순히 반응을 예측하는 것이 아니라, 개입이 "없었을 경우"와 "있었을 경우"를 비교하여 차이를 추정하는 데 목적
개념
기존의 예측 모델은 고객이 어떤 행동을 할 확률을 예측하는 반면,
업리프트 모델은 고객이 처치를 받았을 때와 받지 않았을 때의 반응 차이, 즉 순수한 인과 효과를 추정한다.
ex) 광고 A를 본 그룹과 보지 않은 그룹을 비교하여, 광고가 실제로 구매에 얼마나 영향을 줬는지 추정
필요한 이유
•
모든 고객에게 광고를 보내는 것은 비용이 들고, 때로 부정적인 영향을 줄 수도 있다.
•
즉, 진짜로 ‘광고를 통해 더 많이 반응을 하는 고객’만을 타겟으로 하기 위해 필요하다.
•
이를 통해 ROI(투자 대비 수익) 극대화 가능
작동 원리
•
입력 데이터
◦
고객 특성(인구통계학적 데이터, 인서비스 데이터 등)
◦
처리 여부
◦
결과
•
기본 방식
◦
처리 그룹(실험군)과 비처리 그룹(대조군)을 나눠서 각각 별도로 모델을 훈련
◦
이후 각 고객에 대해 다음을 예측
▪
처리 시 성공 확률
▪
비처리 시 성공 확률
▪
이 둘의 차이 = 업리프트 값
모델링 방법
방법 | 설명 |
Two-Model Approach | 처리군과 대조군 각각에 대해 별도 예측 모델 생성 후 차이를 비교 |
Class Transformation (e.g., Uplift Random Forest) | 특수한 목적에 맞게 라벨을 변환하여 한 번에 모델링 |
Meta-Learner (T-Learner, S-Learner, X-Learner) | 인과 추론 방법론 기반으로 업리프트 추정 |
Causual Forests / Uplift Trees | 트리 기반 모델로 처치 효과에 최적화된 분할 기준 사용 |
모델 활용 예시
•
마케팅 : 쿠폰 발송 대상 고객 선별
•
의료 : 특정 치료가 효과가 있을 환자 선별
•
보험/금융 : 리텐션 방지 캠페인 최적화
유의사항
•
무작위 실험(랜덤화) 데이터가 있어야 인과 추론 정확도가 높아짐
•
샘플 수가 많아야 편향과 분산 문제를 줄일 수 있음
•
처리 효과가 드러나지 않는 ‘확신반응자’나 ‘절대무반응자’는 타겟팅에 비효율적
오퍼월 광고에서의 적용
사용자 유형 | 광고 X 상태 | 광고 O 상태 | 업리프트 |
A (적극 참여자) | 참여 | 참여 | 0 (광고 필요 없음) |
B (설득 가능자) | 미참여 | 참여 | +1 (광고 효과 있음!) |
C (무반응자) | 미참여 | 미참여 | 0 |
D (부정적 반응자) | 참여 | 미참여 | -1 (광고가 오히려 방해!) |
→ 업리프트 모델은 B같은 고객을 찾아서 광고 노출 타겟으로 삼고, A, C, D에게는 리워드 낭비 없이 비용을 줄이는 게 핵심
1.
데이터 수집
•
인구통계학적 데이터
•
인게임 데이터
•
광고 노출 여부(노출/비노출 그룹)
•
광고 결과(미션 완료 여부)
2.
모델링
•
uplift random forest, T-Learner, X-Learner 등으로 모델링
•
사용자별 광고로 인한 실제 효과(업리프트 값) 추정
3.
타겟 세분화
•
업리프트가 높은 사용자에게만 광고/리워드 노출
•
예산 절감 + 전환율 향상
광고 모델 개발을 위한 사전 테스트 캠페인 설계 가이드
실험 설계 목적 정하기
목적 | 설명 |
모델 학습용 데이터 수집 | 광고 노출 유무가 행동(미션 참여, 구매 등)에 어떤 영향을 주는가 파악 |
타겟 세그먼트 탐색 | 어떤 고객군이 업리프트가 높은지 미리 확인 |
UX 반응 관찰 | 비노출 유저의 불만 여부, 이탈 여부 탐색 |
실험군(처리군) / 대조군(비처리군) 무작위 배정
구분 | 설명 |
처리군 | 오퍼월 광고에 노출되는 그룹 |
대조군 | 오퍼월 광고에 노출되지 않는 그룹 |
•
초반 테스트라면 50:50 배정이 일반적
•
이후에는 비즈니스 리스크 줄이기 위해 70(처리):30(대조) 등 조정 가능
•
사용자 ID 해시, 가입 시점, 앱 이용 빈도 등 무작위 기준 필요
•
동일 시기에 동일 조건 하에 실험이 이뤄져야 함 (시간, 프로모션 통제 중요)
실험 변수 정의 및 로그 수집 세팅
변수 | 예시 |
유저 특성 | 가입일수, 리워드 잔고, 미션 히스토리 등 |
처리 여부 | 광고 노출 여부 (1/0) |
반응 여부 | 오퍼월 미션 참여, 전환, 결제 등 |
보상 여부 | 포인트 지급 여부 |
리텐션 지표 | 일/주 단위 방문 여부 |
UX 반응 | 이탈률, 피드백 로그, 페이지 체류 시간 등 (가능하면!) |
→ 오퍼월은 행동 전환이 빠르게 일어나기도 하지만, 지속 효과 확인도 중요
데이터 확보 후 성과 비교 분석
항목 | 분석 예시 |
전환율 차이 | 처리군 vs 대조군 전환율 비교 (CTR, CPA, 구매율 등) |
행동 변화 | 참여 미션 수, 평균 보상 획득량 등 |
반응 세그먼트 분석 | 유저 특성별 효과 차이 시각화 (예: 앱 설치 일수별 업리프트 차이) |
장기 효과 | 실험 후 7일/14일 리텐션 차이, 이탈률 비교 |
업리프트 모델 학습 데이터셋 구성
최종 변수 구성 |
user_id |
treatment (1=광고 노출, 0=미노출) |
response (1=참여함, 0=미참여) |
feature_1, feature_2, …., feature_n (유저 특성) |
→ 이걸 바탕으로 uplift random forest, T-Learner, X-Learner 등에 학습시켜 개별 유저별 "광고 효과" 예측값 추정 가능
추가 팁: UX/운영 리스크 줄이는 방식
리스크 | 대응 방법 |
광고 미노출 유저 불만 | “오늘은 참여 가능한 미션이 없습니다” 등의 안내 페이지 설계 |
수익 손실 우려 | 실험 규모를 소규모 샘플로 제한 (예: 전체 유저의 10%) |
UX 왜곡 | 동일 시기에 다른 프로모션, 이벤트는 최소화하여 실험의 순도 유지 |