ctr-model
TL;DR
- 클릭률 예측(CTR Prediction) 모델은 Point-wise, Pair-wise, List-wise, Hybrid 방식으로 나뉨.
- Point-wise는 개별 클릭 확률을 예측하는 방식으로, 간단하지만 상대적 순위를 반영하지 않음.
- Pair-wise는 두 샘플을 비교하여 순위를 학습하는 방식으로, 랭킹 모델에 적합하지만 계산량이 많음.
- List-wise는 목록 전체를 최적화하는 방식으로, 성능이 뛰어나지만 높은 연산 비용이 발생함.
- Hybrid 모델은 여러 접근 방식을 조합하여 성능을 극대화하는 방식.
CTR 예측 모델의 주요 방식
1. Point-wise Approach
- 개별 샘플의 클릭 확률을 독립적으로 예측하는 방식.
- 예제:
P(y=1 | x)
, 특정 샘플이 클릭될 확률 예측. - 대표 모델: Logistic Regression, DeepFM, Wide & Deep, XGBoost.
- 장점: 간단하고 해석이 쉬움, 대규모 데이터 처리 가능.
- 단점: 샘플 간 상대적 순위를 고려하지 않음.
- Production 적용 방식: 추천될 모든 아이템에 대해 개별 추론을 수행한 후, 예측값을 기반으로 정렬하여 랭킹을 결정함.
2. Pair-wise Approach
- 두 개의 샘플을 비교하여 더 높은 순위를 찾는 방식.
- 예제:
(x_i, x_j, y_i, y_j) → P(y_i > y_j | x_i, x_j)
. - 대표 모델: RankNet, BPR(Bayesian Personalized Ranking).
- 장점: 순위 학습이 가능하며 검색 및 추천 시스템에 적합함.
- 단점: 많은 쌍을 생성해야 하므로 계산 비용이 큼.
- Production 적용 방식: 모든 가능한 아이템 쌍
(n^2)
을 비교하여 상대적인 랭킹을 학습함. 실시간 서빙 시 일부 샘플만 비교하여 연산량을 줄이는 방식이 활용됨.
3. List-wise Approach
- 전체 목록을 고려하여 최적의 정렬을 학습하는 방식.
- 예제:
P(rank | X)
, 여러 개의 항목을 한 번에 입력하여 정렬 학습. - 대표 모델: ListNet, LambdaMART, GBDT 기반 모델.
- 장점: 글로벌 최적화 가능, Pair-wise보다 효율적임.
- 단점: 높은 계산 비용, 데이터에 따라 학습이 어려움.
- Production 적용 방식: 전체 아이템 목록을 한 번에 처리하여 최적의 정렬을 생성하므로 연산량이 큼. 일반적으로 배치 예측으로 사용됨.
4. Hybrid Approach (Deep Learning 기반 모델)
- 여러 접근 방식을 결합하여 더 나은 성능을 목표로 함.
- 예제: Wide & Deep, DeepFM, DIN, DIEN, ESMM 등.
- 대표 기법:
- Wide & Deep: Wide(Logistic Regression) + Deep(MLP) 조합.
- DeepFM: Factorization Machine(FM) + MLP.
- DIN: 사용자 클릭 이력을 활용하여 동적 관심도 반영.
- 장점: Feature Engineering 자동화, 높은 성능.
- 단점: 모델이 복잡하여 학습 및 서빙 비용 증가.
- Production 적용 방식: Point-wise 또는 Pair-wise 방식과 결합하여 사용되며, 대규모 데이터에서 효율적으로 동작하도록 최적화가 필요함.
어떤 모델을 선택해야 할까?
- Point-wise: 개별 광고의 클릭 확률을 예측해야 하는 경우.
- Pair-wise: A/B 테스트나 랭킹이 중요한 경우.
- List-wise: 검색/추천 시스템에서 다수의 아이템을 최적 정렬할 때.
- Hybrid(Deep Learning 기반): 대량의 데이터를 활용하여 높은 성능을 원할 때.