참고 서적 - 그로스 해킹
1) 실험 설계
1-1. 가설 설정
가설은 독립 변수와 종속 변수가 무엇인지 정의하고, 종속 변수의 목표 수준을 정하는 형태로 이뤄진다.
ex)
1-2. 실험 집단/통제 집단
가장 중요한 점은 통제 변수 관리와 엄격한 기준에 따른 샘플링이다.
1-3. 독립 변수
독립 변수의 구체적인 수준을 어떻게 정의할 것인지 결정하는 과정이 중요.
1-4. 종속 변수
종속 변수의 현재 수준을 측정하고, 실험을 통해 정확하게 어느 정도의 변화를 원하는지 정의해야 한다.
1-5. 통제 변수
독립 변수를 제외하고 종속 변수에 영향을 미칠 수 있는 ‘제 3의 변수’ 다.
실험 설계에 경험이 없으면, 이 통제 변수를 정의하고, 관리하는 데 가장 큰 어려움을 겪고,
실험 성패가 통제 변수를 잘 관리하느냐에 달린 경우가 많다.
1-6. 샘플 크기
A. 실험 집단과 통제 집단 샘플링
ex) 회원 번호를 단순히 홀/짝 으로 나누기, 가입 시간을 홀/짝으로 나누기 등은 통제 변수인 가입 경로 를 고려하지 않았다.
ex ) 여행 상품 추천 알고리즘 2개 중 어떤 것이 더 효과적인지 검증하고자 한다. → 고객 대상을 동일하게 만들어주기 위한 통제 변수에는 어떤 것이 있을까?
1.
여행의 목적
a.
출장
b.
휴가
….
2.
여행지
a.
국가와 지역을 동일하게
B. 샘플 크기 설정하기
샘플 크기 계산기가 존재하는데, 온라인상에서 쉽게 볼 수 있다.
계산에 고려되는 변수들은 아래와 같다.
•
검정력
•
유의수준
•
검증하고자 하는 가설
2) 실험 설계 시 유의사항
순차 테스트는 A/B test 가 아니다.
3) 실험 결과를 분석하는 방법
통계적으로는 p - value를 보는 것이 일반적이다.
하지만, 실무적인 유의성은 이와 함께 비용, 가치를 추가적으로 고려해야 한다.
‘95 % 의 신뢰수준에서 A 조건의 (성과지표) 가 B 조건의 (성과지표) 보다 유의미하게 높다’ ≠
A 조건의 (성과지표)가 B 조건의 (성과지표)보다 높을 확률이 95% 다.
⭕️ 올바른 예시 ⭕️
‘A 조건과 B 조건 상의 성과 지표에 차이가 없다’ 라고 95% 의 확률로 가정했을 때, p - value 를 계산했는데 95% 신뢰 구간 밖의 수치가 나왔다면, 5% 라는 아주 작은 극단적인 수치값이 나온 것이므로 ‘A 조건과 B 조건 상의 결과에는 차이가 있다’ 라고 해석하면 쉽다.
비용, 가치(효과가 미치는 크기 또는 영향력)를 잘 판단해서 진행하든, 롤백하든 한다.
Case.
•
통제 조건 → 구매 전환율 3%
•
실험 조건 → 구매 전환율 3.5%
•
p < 0.01
→ 전환율은 0.5% 상승, 통계적으로도 유의미한 수치가 나왔다.
[ 가정 1 ]
•
해당 서비스의 DAU(월활성유저수) 는 1,000명
•
ARPPU(결제 유저당 평균 매출) 는 10,000원
[ 실험 조건을 적용했을 때 ]
→ 매출 : 1000 * 0.005 * 10,000 = 일 50,000원의 추가 매출 발생
[가정 2]
•
해당 서비스의 DAU(월활성유저수) 는 1,000,000명
•
ARPPU(결제 유저당 평균 매출) 는 10,000원
[ 실험 조건을 적용했을 때 ]
→ 매출 : 1,000,000 * 0.005 * 10,000 = 일 5,000만원의 추가 매출 발생
A/B test 는 어제 최적이었지만, 오늘은 그 결과가 유효하지 않을 수 있다. → 지속적인 모니터링의 중요성
️
또한, 전역적인 최적화가 아니라, 국지적인 최적화 방법이라는 것을 명심하자!