Deskriptive Statistik Flashcards

(27 cards)

1
Q

Warum nutzen wir Statistik?

A
  • Messdaten reduzieren und komprimieren
  • Ergebnisse Darstellen und Kommunizieren
  • Gesetzmäßigkeiten und Strukturen ausfindig und sichtbar machen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist deskriptive Statistik?

A
  • beschreibende Statistik
  • empirische Daten zusammenfassen
  • Durch Kennzahlen, Tabellen und Grafiken darstellen und ordnen
  • bei umfangreichem Datenmaterial essenziell, da dies sonst nicht überblickt werden kann
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was will man mit der deskriptiven Statistik darstellen?

A
  • Absolute Ausprägung einer oder mehrerer Variablen
  • Wie verhält sich eine Variable in Abhängigkeit von anderen Variablen
  • Wie verhält sich die Ausprägung von einer der mehreren Variablen in Abhängigkeit der Innersubjekt-Faktoren
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was sind Lagemaße?

A
  • wie sieht es im Mittel aus?
  • Gibt es unterschiedliche Subgruppen oder Profile in den erhobenen Daten?
  • Begriffe: Modus, Median, Arithmetisches Mittel
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was sind Streuungsmaße oder Dispersionsmaße?

A
  • Wie sehr weichen einzelne Werte vom Mittel ab
  • Sind die Unterschiede in den Subgruppen vom Zufall verschieden?
  • Sind die Unterschiede bedeutsam (statistisch vom Zufall verschieden?)
  • Begriffe: Standardabweichung, Varianz, Standardfehler, Konfidenzintervalle
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was sind Zusammenhangsmaße?

A
  • Gibt es Zusammenhänge in den Daten bzw. zwischen den Variablen?
  • Begriff: Kovarianz, Pearson- und Spearman Korrelation
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was ist der Modus/Modalwert?

A
  • Häufigster Wert der Verteilung
    (x̄M, D)
  • erfordert nur nominal skalierte Daten, nutzt keine Ordnungseigenschaft
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist der Median?

A

-Mitte der Verteilung
- 50% der Daten liegen unterhalb, 50% liegen oberhalb des Medians
- Stabil gegen Ausreißer
- (Md)
- erfordert ordinal skalierte Daten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was ist das Arithmetische Mittel?

A
  • Mittelwert
  • wird am häufigsten Verwendet
  • erfordert metrisches Skalenniveau
  • reagiert stark auf Ausreißer
  • Wert existiert nicht immer in den Daten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was ist der Interquartilsabstand?

A
  • IRQ: Q25% - Q75%
  • analog zu Median als Q50%
  • Unempfindlich gegen Ausreißer
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was beschreibt die Varianz?

A
  • beschreibt die Streuung der Messwerte zum Mittelwert
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was ist das Vorgehen bei der Varianz?

A
  • Summe der Abweichungsquadrate der Messwerte vom Mittelwert
  • Warum? Quadriere verhindert negative Werte
  • Normiert auf die Anzahl der Elemente
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist die empirische Standardabweichung?

A
  • Quadratwurzel aus der Varianz
  • Misst die durchschnittliche Abweichung vom Mittelwert der Stichprobe
  • Ziel: Quantifizierung der Streuung der Datenpunkte um den Mittelwert
  • Standardabweichung ist unabhängig von der Stichprobengröße
  • Gleiche Einheit wie in der Stichprobe
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was ist der Standardfehler?

A
  • SE
  • Definition: Standardfehler misst die Genauigkeit mit der die Werte der Stichprobe den Wert der Grundgesamtheit schätzen
  • Normierung über Anzahl der Datenpunkte/Messwerte
  • Je größer der Stichprobenumfang, desto kleiner der Standardfehler
  • Je kleiner die Varianz in der Stichprobe, desto kleiner der Standardfehler
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was sind Konfidenzintervalle?

A
  • sie zeigen die Schätzgenauigkeit
    Ein Konfidenzintervall ist ein aus Stichprobendaten berechneter Wertebereich, der mit einer festgelegten Konfidenzwahrscheinlichkeit den wahren Parameter der Grundgesamtheit überdeckt.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wie berechnet man Konfidenzintervalle?

A
  • man muss das gewünschte Konfidenzintervall definieren
  • man muss den z score zum Konfidenzintervall bestimmen
  • M und SD bestimmen und die Stichprobengröße N
  • dann den oberen und unteren Rand des Konfidenzinetrvalls berechnen
17
Q

Wann wird ein Konfidenzintervall breiter?

A

das Konfidenzniveau steigt (z. B. 99 % statt 95 %),
die Streuung der Daten groß ist,
die Stichprobe klein ist;

18
Q

Wann wird das Konfidenzintervall schmaler?

A
  • die Stichprobe größer ist,
  • die Daten weniger streuen.
19
Q

Was ist die Range?

A
  • Das ist die Spannbreite
  • Distanz von Minimum und Maximum
20
Q

Was sind Quartile?

A
  • Daten in 4 gleich große Bereiche aufteilen
21
Q

Was ist die Interquartile Range?

A

-Abstand zwischen dem 1. und dem 4. Quartil

22
Q

Was sind Percentile?

A

Perzentile teilen eine geordnete Datenmenge in 100 gleich große Teile.
Sie geben an, wie viel Prozent der Beobachtungen kleiner oder gleich einem bestimmten Wert sind.

23
Q

Was genau ist das Anscombe Quartett?

A

Das Anscombe-Quartett ist eine Sammlung von vier Datensätzen mit gleichen statistischen Kennzahlen, die jedoch grafisch sehr unterschiedliche Muster zeigen und damit die Bedeutung der Datenvisualisierung demonstrieren.

24
Q

Worauf muss man beim Erstellen von Diagrammen achten?

A
  • dass Diagramme möglichst selbsterklärend sind
  • vollständig und eindeutig beschriftet sind
  • Skalenumfang vollständig abgebildet ist
  • Bedeutung von großen und kleinen Werten eindeutig ist
  • gute Lesbarkeit
25
Was zeigen Boxplots?
* Übersichtliche Darstellung verschiedener Lage und Streuungsmaße in einer Visualisierung * Boxplot zeigen häufig - Median, 25%- und 75% Perzentil (unteres/oberes Quartil) - „Whiskers“ (Standardfehler oder Konfidenzintervalle) - Ausreißer
26
Was sind Violinen Plots?
- Verteilung der Daten wird dargestellt - Vermittelt ein Gefühl von Minimum und Maximum der Verteilung, Streuung, Außreißer, …
27
Was sind Streuungsfächer?
* Kann sich eignen, wenn man sehr viele Daten gleichzeitig visualisieren muss Streuungsfächer besteht aus * einem Kreis als Skala * einer Durchmesserlinie zur Anzeige des Medians * Kreissegment (dem Fächer) zur Anzeige der Quartile * zwei Federn zur Anzeige der Extremwerte