Normalisierung Flashcards

(6 cards)

1
Q

Warum ist Normalisierung/Standardisierung wichtig in der Data Science?
+ Beispiel

A
  • Einzelne Merkmale haben in mehrdimensionalen Datensätzen oft sehr unterschiedliche Wertebereiche
  • Numerisch kleinere Werte werden gegenüber numerisch größeren vernachlässigt
  • zB Alter des Kreditnehmers und Summe des Kredits
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Beschreibe die min-max Normalisierung

A
  • Min- und Maxwert werden mit 0 und 1 ersetzt
  • Ausreißer fallen danach noch genauso ins Gewicht
  • Gut für Daten die keine Normalverteilung haben
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wie wird die statistische Normalisierung noch genannt?

A

z-score Standardisierung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Beschreibe die z-score Standardisierung kurz

A
  • Verteilung der Daten erhält Mittelwert von 0
  • Standardabweichung von 1
  • Ursprüngliche Verteilung wird gewahrt
  • Weniger von Ausreißern beeinflusst
  • Gut bei normalverteilten Daten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wie erfolgt die l² Normaliserung?

A

Durch die euklidische Norm (Distanz vom Ursprung zu einem Vektor)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Bei welchen Algorithmen muss man normalisieren?

A
  • distanzbasierte Algorithmen (k-NN, k-means)
  • Algorithmen die Gradientenverfahren verwenden (zB Neuronale Netze)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly