Základní info
Workshop zaměřený na aplikaci statistických metod analýzy přežití v data miningu. Analýza přežití pochází z oblasti biologie a oproti tradičním data miningovým přístupům pracuje přímo s faktorem času jako cílovou proměnnou. To umožňuje vytvářet reálnějíší odhady v oblastech jako modelování životního cyklu zákazníka, hodnoty zákazníka (lifetime value), odchodu zákazníků (churn, attrition), odezev na kampaň (response), rizik, apod.
Obsah kurzu
Survival Data
- v čase se měnící proměnné odvozené z historie zákazníka
- elementy analýzy přežívání: pravděp. rozdělení času do události, více modelovaných rizik (competing risks), vysvětlující proměnné závislé na čase, cenzorovaná data
- základní neparametrický odhad funkce hazardu a přežití (hazard function, survival function)
Flexibilní modely funkce hazardu
- vícenásobná logistická regrese pro data cenzorovaná zprava
- spline regrese a neuronové sítě
- aplikace na velké objemy dat
Prediktivní modelování
- prediktivní skórování
- odhad střední zbývající doby (mean residual lifetime)
- validace výsledků