Right-Censoring이란?
DSP(Demand-Side Platform) 입장에서 경매 결과 데이터는 비대칭적입니다.
| 경매 결과 | 관측 가능한 정보 | 수식 |
|---|---|---|
| 낙찰 (Win) | 실제 Clearing Price w_i | w_i 직접 관측 |
| 패찰 (Lose) | "내 입찰가 b_i보다 높았다"는 사실만 | W_i > b_i (하한만 알 수 있음) |
패찰한 경매에서는 경쟁자가 $2.01을 입찰했는지, $10.00을 입찰했는지 알 수 없습니다. 내 입찰가 오른쪽(이상)의 분포가 잘려있으므로 이를 Right-Censoring이라 부릅니다.
Censored Likelihood의 핵심
Win: PDF 사용 — 관측된 가격의 likelihood를 직접 최대화
Lose: Survival Function 사용 — "시장가 > 내 입찰가"의 likelihood를 최대화
Lose 데이터를 버리지 않고, 그 안에 담긴 하한 정보(lower bound)를 Survival Function으로 학습에 포함시키는 것이 Censored Regression의 핵심입니다. 두 논문(Ghosh et al., Zhou et al.) 모두 이 형태의 손실 함수를 기반으로 합니다.
실험해볼 시나리오
시나리오 1: 입찰가를 낮추면?
My Bid를 $1.00으로 낮춰보세요. 관측률이 급감하고, Naive 추정의 오차가 극단적으로 커집니다. Censored Regression조차 정보가 부족해져 정확도가 떨어지는 것을 확인할 수 있습니다. 이것이 탐색-활용(Exploration-Exploitation) 딜레마입니다.
시나리오 2: 입찰가를 높이면?
My Bid를 $4.00 이상으로 올려보세요. 거의 모든 경매에서 이기므로 관측률이 90%+가 됩니다. Naive와 Censored의 차이가 줄어듭니다 — 데이터가 충분하면 Censoring 문제가 완화됩니다. 하지만 현실에서 이렇게 높은 입찰가는 수익성이 없습니다.
시나리오 3: 시장 분산이 클 때
Market σ를 1.0으로 키워보세요. 시장 불확실성이 크면 Naive 추정의 오차도 커지고, Censored Regression의 보정 효과가 더 두드러집니다.