Care sunt cateva motive care sa justifice preprocesarea datelor?
In principiu 80% din timpul acordat modelarii este pe preprocesarea informatiilor
Cum putem clasifica datele?
Ce presupune denormalizarea?
Denormalizarea presupune combinarea mai multor tabele intr-un singur raport
Pe baza unui primary key
Ce presupune problema inferentei clientilor refuzati/acceptati?
Aceasta are loc atunci cand esantionam doar pe baza clientilor acceptati/refuzati
Din lipsa de date
Cum abordam valorile lipsa?
Cum se schimba valoare WoE in functie de distributiile de buni/rai?
Daca distributia de buni > rai atunci WoE va fi pozitiv
Daca distributia de buni < rai atunci WoE va fi negativ
Ce reprezinta IV?
IV calculeaza puterea de predictie a unei variabile
Masoara diferenta absoluta dintre distributia clientilor buni si distributia clientilor rai
Care sunt cateva aplicatii pentru IV?