Modeling Delayed Feedback in Display Advertising 논문을 읽고 내용을 정리한다. 논문에서 풀고자 하는 문제 Click 이후에 발생하는 Conversion Rate의 추정 cost-per-conversion(CPA) payment model에서 ad-exchange나 DSP는 impression의 가치를 추정해야한다. impression의 가치인 eCPM(expected Cost Per Mile)은 다음과 같이 계산된다. @@ \begin{align} eCPM & = CPA \times Pr(conversion, click) \\ & = CPA \times Pr(click) \times Pr(Conversion | click) \end{align} @@ 문제는 Clic..
ML을 실무에 적용하다 보면 만나게 되는 도전과제 중 하나는 모형이 내놓는 결과에 대한 해석이다. 아무리 예측력이 좋은 ML 모형이라고 하더라도 실제 액션을 취하려면 왜 이런 예측 과정에 대한 이해가 필수적이다. 모형의 동작 방식에 대한 이해가 가능해야 사용자 입장에서 그 결과를 “신뢰”하고 사용할 수 있다. 또한 모델에 대한 해석은 모델을 만드는 과정에서도 매우 중요한 정보이다. 모델을 만드는 분석가나 엔지니어의 입장에서도 모형이 왜 이렇게 작동하는지 이해해야 모델을 배포하기 이전에 결함을 인지하고 개선할 수 있다. 문제는 대부분의(특히 예측 성능이 좋은) ML 모형이 Black box라는 점에 있다. 지난 몇년간 다양한 분야에서 ML을 폭넓게 활용하려는 시도들과 함께 이러한 문제를 해결하기 위한 접근..