Censored Data in RTB

	Naive 추정 (Win 데이터만)	실제 값 (God View)	오차
Mean	-	-	-
Median	-	-	-

Naive 추정
(Win 데이터만)

실제 값
(God View)

오차

Mean

Median

	실제	Naive	오차	Censored	오차
Mean	-	-	-	-	-
Median	-	-	-	-	-

실제

Naive

오차

Censored

오차

Mean

Median

	의학 (Survival Analysis)	RTB (Bid Shading)
관측 가능	연구 기간 내 사망한 환자의 수명	낙찰(Win)한 경매의 시장 가격
Censored	연구 종료 시 생존한 환자 (수명 미관측)	패찰(Lose)한 경매 (시장가 미관측)
부분 정보	"최소 T년은 살았다"	"시장가 > 내 입찰가 $b"
해결 기법	Kaplan-Meier, Cox PH	Censored Regression, MCNet

의학 (Survival Analysis)

RTB (Bid Shading)

관측 가능

연구 기간 내 사망한 환자의 수명

낙찰(Win)한 경매의 시장 가격

Censored

연구 종료 시 생존한 환자 (수명 미관측)

패찰(Lose)한 경매 (시장가 미관측)

부분 정보

"최소 T년은 살았다"

"시장가 > 내 입찰가 $b"

해결 기법

Kaplan-Meier, Cox PH

Censored Regression, MCNet

Right-Censoring이란?

DSP(Demand-Side Platform) 입장에서 경매 결과 데이터는 비대칭적입니다.

경매 결과	관측 가능한 정보	수식
낙찰 (Win)	실제 Clearing Price w_i	w_i 직접 관측
패찰 (Lose)	"내 입찰가 b_i보다 높았다"는 사실만	W_i > b_i (하한만 알 수 있음)

패찰한 경매에서는 경쟁자가 $2.01을 입찰했는지, $10.00을 입찰했는지 알 수 없습니다. 내 입찰가 오른쪽(이상)의 분포가 잘려있으므로 이를 Right-Censoring이라 부릅니다.

Censored Likelihood의 핵심

L = Σ(wins) log P(w_i | x) + Σ(losses) log Pr(W > b_i | x)

Win: PDF 사용 — 관측된 가격의 likelihood를 직접 최대화
Lose: Survival Function 사용 — "시장가 > 내 입찰가"의 likelihood를 최대화

Lose 데이터를 버리지 않고, 그 안에 담긴 하한 정보(lower bound)를 Survival Function으로 학습에 포함시키는 것이 Censored Regression의 핵심입니다. 두 논문(Ghosh et al., Zhou et al.) 모두 이 형태의 손실 함수를 기반으로 합니다.

실험해볼 시나리오

시나리오 1: 입찰가를 낮추면?

My Bid를 $1.00으로 낮춰보세요. 관측률이 급감하고, Naive 추정의 오차가 극단적으로 커집니다. Censored Regression조차 정보가 부족해져 정확도가 떨어지는 것을 확인할 수 있습니다. 이것이 탐색-활용(Exploration-Exploitation) 딜레마입니다.

시나리오 2: 입찰가를 높이면?

My Bid를 $4.00 이상으로 올려보세요. 거의 모든 경매에서 이기므로 관측률이 90%+가 됩니다. Naive와 Censored의 차이가 줄어듭니다 — 데이터가 충분하면 Censoring 문제가 완화됩니다. 하지만 현실에서 이렇게 높은 입찰가는 수익성이 없습니다.

시나리오 3: 시장 분산이 클 때

Market σ를 1.0으로 키워보세요. 시장 불확실성이 크면 Naive 추정의 오차도 커지고, Censored Regression의 보정 효과가 더 두드러집니다.

Controls