Search

업리프트 모델

마케팅, 추천 시스템, 의료 등에서 특정 개입(예: 광고, 쿠폰, 치료 등)이 개별 고객에게 실제로 긍정적인 영향을 주었는지를 예측하기 위한 모델 단순히 반응을 예측하는 것이 아니라, 개입이 "없었을 경우"와 "있었을 경우"를 비교하여 차이를 추정하는 데 목적

개념

기존의 예측 모델은 고객이 어떤 행동을 할 확률을 예측하는 반면,
업리프트 모델은 고객이 처치를 받았을 때와 받지 않았을 때의 반응 차이, 즉 순수한 인과 효과를 추정한다.
ex) 광고 A를 본 그룹과 보지 않은 그룹을 비교하여, 광고가 실제로 구매에 얼마나 영향을 줬는지 추정

필요한 이유

모든 고객에게 광고를 보내는 것은 비용이 들고, 때로 부정적인 영향을 줄 수도 있다.
즉, 진짜로 ‘광고를 통해 더 많이 반응을 하는 고객’만을 타겟으로 하기 위해 필요하다.
이를 통해 ROI(투자 대비 수익) 극대화 가능

작동 원리

입력 데이터
고객 특성(인구통계학적 데이터, 인서비스 데이터 등)
처리 여부
결과
기본 방식
처리 그룹(실험군)과 비처리 그룹(대조군)을 나눠서 각각 별도로 모델을 훈련
이후 각 고객에 대해 다음을 예측
처리 시 성공 확률
비처리 시 성공 확률
이 둘의 차이 = 업리프트 값

모델링 방법

방법
설명
Two-Model Approach
처리군과 대조군 각각에 대해 별도 예측 모델 생성 후 차이를 비교
Class Transformation (e.g., Uplift Random Forest)
특수한 목적에 맞게 라벨을 변환하여 한 번에 모델링
Meta-Learner (T-Learner, S-Learner, X-Learner)
인과 추론 방법론 기반으로 업리프트 추정
Causual Forests / Uplift Trees
트리 기반 모델로 처치 효과에 최적화된 분할 기준 사용

모델 활용 예시

마케팅 : 쿠폰 발송 대상 고객 선별
의료 : 특정 치료가 효과가 있을 환자 선별
보험/금융 : 리텐션 방지 캠페인 최적화

유의사항

무작위 실험(랜덤화) 데이터가 있어야 인과 추론 정확도가 높아짐
샘플 수가 많아야 편향과 분산 문제를 줄일 수 있음
처리 효과가 드러나지 않는 ‘확신반응자’나 ‘절대무반응자’는 타겟팅에 비효율적

오퍼월 광고에서의 적용

사용자 유형
광고 X 상태
광고 O 상태
업리프트
A (적극 참여자)
참여
참여
0 (광고 필요 없음)
B (설득 가능자)
미참여
참여
+1 (광고 효과 있음!)
C (무반응자)
미참여
미참여
0
D (부정적 반응자)
참여
미참여
-1 (광고가 오히려 방해!)
→ 업리프트 모델은 B같은 고객을 찾아서 광고 노출 타겟으로 삼고, A, C, D에게는 리워드 낭비 없이 비용을 줄이는 게 핵심
 적용 방식 예시
1.
데이터 수집
인구통계학적 데이터
인게임 데이터
광고 노출 여부(노출/비노출 그룹)
광고 결과(미션 완료 여부)
2.
모델링
uplift random forest, T-Learner, X-Learner 등으로 모델링
사용자별 광고로 인한 실제 효과(업리프트 값) 추정
3.
타겟 세분화
업리프트가 높은 사용자에게만 광고/리워드 노출
예산 절감 + 전환율 향상

광고 모델 개발을 위한 사전 테스트 캠페인 설계 가이드

 실험 설계 목적 정하기

 
목적
설명
모델 학습용 데이터 수집
광고 노출 유무가 행동(미션 참여, 구매 등)에 어떤 영향을 주는가 파악
타겟 세그먼트 탐색
어떤 고객군이 업리프트가 높은지 미리 확인
UX 반응 관찰
비노출 유저의 불만 여부, 이탈 여부 탐색

 실험군(처리군) / 대조군(비처리군) 무작위 배정

구분
설명
처리군
오퍼월 광고에 노출되는 그룹
대조군
오퍼월 광고에 노출되지 않는 그룹
비율
초반 테스트라면 50:50 배정이 일반적
이후에는 비즈니스 리스크 줄이기 위해 70(처리):30(대조) 등 조정 가능
무작위 분배 기준:
사용자 ID 해시, 가입 시점, 앱 이용 빈도 등 무작위 기준 필요
동일 시기에 동일 조건 하에 실험이 이뤄져야 함 (시간, 프로모션 통제 중요)

실험 변수 정의 및 로그 수집 세팅

변수
예시
유저 특성
가입일수, 리워드 잔고, 미션 히스토리 등
처리 여부
광고 노출 여부 (1/0)
반응 여부
오퍼월 미션 참여, 전환, 결제 등
보상 여부
포인트 지급 여부
리텐션 지표
일/주 단위 방문 여부
UX 반응
이탈률, 피드백 로그, 페이지 체류 시간 등 (가능하면!)
 데이터 수집 기간 : 최소 1~2주 이상 확보 권장
→ 오퍼월은 행동 전환이 빠르게 일어나기도 하지만, 지속 효과 확인도 중요

데이터 확보 후 성과 비교 분석

항목
분석 예시
전환율 차이
처리군 vs 대조군 전환율 비교 (CTR, CPA, 구매율 등)
행동 변화
참여 미션 수, 평균 보상 획득량 등
반응 세그먼트 분석
유저 특성별 효과 차이 시각화 (예: 앱 설치 일수별 업리프트 차이)
장기 효과
실험 후 7일/14일 리텐션 차이, 이탈률 비교

업리프트 모델 학습 데이터셋 구성

최종 변수 구성
user_id
treatment (1=광고 노출, 0=미노출)
response (1=참여함, 0=미참여)
feature_1, feature_2, …., feature_n (유저 특성)
→ 이걸 바탕으로 uplift random forest, T-Learner, X-Learner 등에 학습시켜 개별 유저별 "광고 효과" 예측값 추정 가능

추가 팁: UX/운영 리스크 줄이는 방식

리스크
대응 방법
광고 미노출 유저 불만
“오늘은 참여 가능한 미션이 없습니다” 등의 안내 페이지 설계
수익 손실 우려
실험 규모를 소규모 샘플로 제한 (예: 전체 유저의 10%)
UX 왜곡
동일 시기에 다른 프로모션, 이벤트는 최소화하여 실험의 순도 유지