Deskriptive Statistik Flashcards

(87 cards)

1
Q

Was sind die Grundformen der Statistik?

A

Deskriptive Statistik - Beschreiben von Daten
* Bsp.: Wie groß sind die Teilnehmenden in dieser Veranstaltung?

Explorative Statistik - Suche nach Struktur in Daten
* Bsp.: Welche Faktoren stehen im Zusammenhang mit der Größe?

Induktive Statistik - Rückschluss von Eigenschaften einer Stichprobe auf Eigenschaften einer Grundgesamtheit
* Bsp.: Wie groß sind Münchener Studierende (geschätzt auf Basis der Größe der Teilnehmenden dieser Veranstaltung)?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Deskriptive Statistik - Definition

A

„Vorliegende Daten werden in geeigneter Weise beschrieben, aufbereitet und zusammengefasst. Mit ihren Methoden verdichtet man quantitative Daten zu Tabellen, graphischen Darstellungen und Kennzahlen.“

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was ist das Ziel der deskriptiven Statistik?

A

Ziel ist die möglichst informative
* Beschreibung
* Zusammenfassung
* und Darstellung
der Daten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Welche Schritte beinhaltet der Prozess der Versuchsplanung und Durchführung?

A

-Fragestellung
-Hypothesen
-Operationalisierung
-Erhebung
-Analyse
-Interpretation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Welche Eigenschaften hat die Fragestellung?

A
  • …steht zu Beginn jeder Forschungsarbeit: „Was möchte ich herausfinden?“
  • … ist meist sehr breit und vage formuliert.
  • Beispiel: Wie wirkt sich die Nutzung eines Mobiltelefons auf die Verkehrssicherheit aus?
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was sind Hypothesen?

A
  • Konkrete, untersuchbare Ableitungen aus der Fragestellung
  • Vorhersagen, welche mit empirischen Beobachtungen verglichen werden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Welche Arten von Hypothesen gibt es?

A

1) Unterschiedshypothesen
(z.B. „Personen, die während einer Fahrsimulatoraufgabe ein Mobiltelefon nutzen, fahren besser oder schlechter als Personen, die kein Mobiltelefon nutzen.“)

2) Zusammenhangshypothesen
(z.B. „Je häufiger Personen während einer Fahrsimulatoraufgabe ein Mobiltelefon nutzen, desto besser oder schlechter fahren sie.“)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist die typische Aussagenform von Hypothesen?

A
  • „Wenn X, dann trifft Y zu.“
  • „Wenn nicht X, dann trifft auch Y nicht zu.“
    -> Aussagenform erlaubt Überprüfung bzw. Falsifikation
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was ist Operationalisierung?

A

Zuordnung von beobachtbaren Phänomenen und empirischen Indikatoren zu den Begriffen der Hypothese
-> Messbarmachung der Merkmale der Hypothese

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Merkmalsträger - Definition

A

untersuchte Objekte
Beispiel: Mietwohnungen, Versuchspersonen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Merkmal bzw. Variable - Definition

A

zu messende Eigenschaft
Beispiel: Nettomiete, Geschlecht

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Merkmalsausprägungen - Definition

A

mögliche Symbole des Merkmals bzw. konkreter Wert des Merkmals eines Merkmalsträgers
Beispiel: (Nettomiete =) 1500 €, (Geschlecht =) weiblich

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Beobachtung bzw. Messung - Definition

A

empirische Feststellung einer Merkmalsausprägung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Welche Typen von Merkmalen gibt es?

A

Diskrete bzw. diskontinuierliche Merkmale:
-Endliche Anzahl an Ausprägungen
-Bsp. Studiengänge, Augenzahl beim Würfel

Stetige bzw. kontinuierliche Merkmale:
-Theoretisch unendlich viele Ausprägungen
-Bsp. Körpergröße, Gewicht

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Messen - Definition

A

Messen ist die Zuordnung von Zahlen zu Merkmalsausprägungen von Objekten nach festgelegten Regeln und zwar so, dass das numerische Relativ dem empirischen Relativ entspricht.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was sagt das Skalenniveau aus?

A

Das Skalenniveau vorliegender Daten entscheidet über
* …zulässige Aussagen
* …zulässige Transformationen
* …die Auswahl statistischer Verfahren

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Welche Skalen gibt es?

A

-Absolut
-Verhältnis
-Intervall
-Ordinal
-Nominal

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Was sind Kardinalskalen oder metrische Skalen?

A

Absolut-, Verhältnis- und Intervallskala

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

empirisches Relativ - Definition

A

Beobachtete Merkmalsausprägung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

numerisches Relativ - Definition

A

Zahlen als Repräsentation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Nominalskala - Definition

A

Eine Nominalskala ordnet den Objekten eines empirischen Relativs Zahlen so zu, dass Objekte mit gleicher Merkmalsausprägung gleiche Zahlenund Objekte mit unterschiedlicher Merkmalsausprägung verschiedene Zahlen erhalten.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Welche Struktur muss bei der Nominalskala erhalten bleiben?

A

Die Struktur, die erhalten werden muss, ist die Gleichheit und Unterscheidbarkeit der Elemente auf der empirischen Seite.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Injektive Transformationen - Definition

A

Injektive Funktionen sind genau die Funktionen f: X → Y, bei denen für alle x₁, x₂ ∈ X gilt: Aus f(x₁) = f(x₂) folgt x₁ = x₂.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Was ist ein Beispiel für eine Nominalskala?

A
  • Geschlecht
  • Rückennummern von Sportlern
  • Landessprachen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Ordinalskala - Definition
Eine Ordinalskala ordnet den Objekten eines empirischen Relativs Zahlen so zu, dass von je zwei Objekten das Objekt mit der größeren Merkmalsausprägung die größere Zahl erhält.
26
Welche Struktur muss bei der Ordinalskala erhalten bleiben?
Die Struktur, die erhalten werden muss, ist die Rangreihe der Elemente auf der empirischen Seite.
27
Was ist ein Beispiel für eine Ordinalskala?
* Platz beim Marathonlauf * Schulnoten
28
Monotone Transformationen - Definition
Streng monoton steigend (bzw. fallend) sind genau die Funktionen f: X → Y, bei denen für alle x₁, x₂ ∈ X gilt: Aus x₁ > x₂ folgt f(x₁) > f(x₂) (bzw. aus x₂ < x₁ folgt f(x₂) > f(x₁)).
29
Was lässt sich über Mittelwerte in der Ordinalskala sagen?
Mittelwerte sind bedeutungslos, da die Abstände zwischen den Zahlen bedeutungslos sind.
30
Intervallskala - Definition
Eine Intervallskala ordnet den Objekten eines empirischen Relativs Zahlen so zu, dass die Rangordnung der Zahlendifferenzen zwischen je zwei Objekten der Rangordnung der Merkmalsunterschiede zwischen je zwei Objekten entspricht.
31
Welche Struktur muss bei der Intervallskala erhalten bleiben?
Die Struktur, die erhalten werden muss, sind die Differenzen zwischen den Elementen auf der empirischen Seite.
32
Was lässt sich über den Nullpunkt einer Intervallskala aussagen?
Eine Intervallskala hat keinen natürlichen Nullpunkt.
33
Was ist ein Beispiel für eine Intervallskala?
* Temperatur in °Celsius oder °Fahrenheit * IQ-Werte
34
Lineare Transformationen - Definition
Y = a + b ∙ X (Bsp. Fahrenheit = 32 + 1.8 × Celsius)
35
Verhältnisskala - Definition
Eine Verhältnisskala ordnet den Objekten eines empirischen Relativs Zahlen so zu, dass das Verhältnis zwischen je zwei Zahlen dem Verhältnis der Merkmalsausprägungen der jeweiligen Objekte entspricht.
36
Welche Struktur muss bei der Verhältnisskala erhalten bleiben?
Die Struktur, die erhalten werden muss, ist das Verhältnis der Elemente auf der empirischen Seite.
37
Was lässt sich über den Nullpunkt einer Verhältnisskala aussagen?
Eine Verhältnisskala hat einen natürlichen Nullpunkt.
38
Was ist ein Beispiel für eine Verhältnisskala?
* Größe * Gewicht * Temperatur in Kelvin
39
multiplikative Transformationen - Definition
Y = k × X
40
Absolutskala - Definition
Eine Absolutskala ordnet den Objekten eines empirischen Relativs Zahlen derart zu, dass eine Zahl der Merkmalsausprägung der Anzahl der jeweiligen Objekte entspricht.
41
Welche Struktur muss bei der Absolutskala erhalten bleiben?
Die Struktur, die erhalten werden muss, ist die Ausprägung der Elemente auf der empirischen Seite.
42
Was ist ein Beispiel für eine Absolutskala?
Häufigkeiten, z.B. Kinderzahl
43
Welche Transformationen sind für die Nominalskala erlaubt?
Injektive Transformationen
44
Welche Transformationen sind für die Ordinalskala erlaubt?
Monotone Transformationen
45
Welche Transformationen sind für die Intervallskala erlaubt?
Lineare Transformationen
46
Welche Transformationen sind für die Verhältnisskala erlaubt?
multiplikative Transformationen
47
Welche Transformationen sind für die Absolutskala erlaubt?
Es sind keine Transformationen (bzw. nur Identitätstransformationen) erlaubt.
48
Was lässt sich über den Informationsgehalt von Skalen aussagen?
Das Skalenniveau einer Messung bestimmt den Informationsgehalt: Je höher das Skalenniveau, desto mehr Informationen werden abgebildet und desto genauere Aussagen können getroffen werden.
49
Was lässt sich über die erlaubten Transformationen von Skalen aussagen?
Die erlaubten Transformationen werden von Nominal- zu Verhältnisskala immer restriktiver.
50
Was ist die Aufgabe deskriptiver Statistik bezogen auf Daten?
* Reduktion der Daten auf das Wesentliche (bestimmt durch Fragestellung) * Möglichst informative und sachangemessene Darstellung
51
Wie werden Variablen symbolisiert und die Realisationen (konkreten Ausprägungen) der Variable gekennzeichnet?
* Variablen werden mit Großbuchstaben symbolisiert, häufig X oder Y. * Die Realisationen (konkreten Ausprägungen) der Variable werden dann mit den entsprechenden Kleinbuchstaben gekennzeichnet, also x oder y.
52
Was ist die Absolute Häufigkeit H?
Absolute Häufigkeit H für die Ausprägung xᵢ: Wie viele Objekte haben die jeweilige Merkmalsausprägung? -> Hₙ(xᵢ)
53
Was ist die Relative Häufigkeit?
Absolute Häufigkeit an der Anzahl der Merkmalsträger relativiert -> hₙ(xᵢ) = Hₙ(xᵢ) / n
54
Was ist die Kumulierte Häufigkeit?
Häufigkeiten werden geordnet aufsummiert
55
Was ist für die kumulierte Häufigkeit im Bezug auf das Skalenniveau zu beachten?
Nur für mindestens ordinalskalierte Daten möglich.
56
Histogramm - Definition
Grafische Art der Darstellung von Häufigkeiten bestimmter Kategorien
57
Was ist der Unterschied zwischen einem Histogramm und einem Säulendiagramm?
Die Fläche der Säulen ist beim Histogramm sinnvoll interpretierbar. Die Flächeninhalte sind proportional zu den absoluten bzw. relativen Häufigkeiten dargestellt.
58
Was sind einige Leitlinien für Diagramme?
* Die y-Achse beginnt bei Null und ist gleichmäßig eingeteilt. * Die x-Achse ist gleichmäßig eingeteilt. Der in dem Bildausschnitt dargestellte Bereich der x-Werte ist möglichst sachangemessen gewählt. * Die durch die verwendeten Symbole dargestellten Maße sind proportional zu den Zahlen, die sie darstellen sollen. * Die Festlegung von Achsenausschnitten, Einheiten usw. ist möglichst wenig willkürlich, sondern auf Basis der Fragestellung naheliegend.
59
Was sind die Maße der zentralen Tendenz?
* Modus * Median * Mittelwert
60
Was ist der Modalwert oder Modus?
* Häufigster Wert bzw. Maximum einer Häufigkeitsverteilung * Kategorienmitte der am häufigsten besetzten Kategorie * Bestimmbar unabhängig vom Skalenniveau * Übliche Abkürzung: xMod
61
Was ist der Median?
* Mitte einer geordneten Verteilung * Je die Hälfte der Werte liegen über bzw. unter dem Median * Übliche Notation MD oder (~ über x) * Bestimmung setzt mind. Ordinalskalenniveau voraus
62
Was ist das Arithmetische Mittel bzw. der Mittelwert?
* Summe aller Werte geteilt durch die Anzahl der Werte * Übliche Abkürzung: M oder x̄ * Nur für metrische Daten sinnvoll berechenbar, d.h. Nutzung der meisten Informationen * Minimum der Summe der quadrierten Abweichungen, d.h. beste Repräsentation der Stichprobe * Anfällig für Ausreißer (= Werte, die sich stark von den übrigen Beobachtungen unterscheiden)
63
Was sagen Streuungs- bzw. Dispersionsmaße aus?
Wie sehr sich die Teilnehmer in der Stichprobe unterscheiden
64
Was ist der Streubereich?
Bereich, in dem beobachtete Werte liegen
65
Was ist die Spannweite/Variationsbreite?
Differenz zwischen maximalem und minimalem Wert
66
Was ist ein Quantil?
Schwellenwert zur Zerlegung der Daten in definierte Bereiche Beispiel: Qp mit p = 0.3 -> so weisen 30% der Beobachtungen einen gleich großen oder kleineren Wert, 70% der Beobachtungen einen größeren Wert auf als Qp
67
Was sind Perzentile?
Unterteilung der Daten in 100 gleich große Teile (Prozentränge)
68
Was sind Quartile?
Quartile = Unterteilung der Daten in 4 gleich große Teile * Q0,25: unteres Quartil * Q0,50: mittleres Quartil bzw. Median * Q0,75: oberes Quartil * Interquartilsabstand: IQA = Q0,75- Q0,25 (Abstand, der mittlere 50% der Werte umfasst)
69
Welche Werte umfasst die Fünf-Punkte-Zusammenfassung zur Beschreibung von Daten?
xmin, x0,25, MD oder (~ über x), x0,75, xmax
70
Was sind Ausreißer und Extremwerte beim Boxplot Diagramm?
* Ausreißer liegen um mehr als das Eineinhalbfache des Interquartilsabstands vom oberen bzw. unteren Quartil entfernt * Extremwerte liegen um mehr als das Dreifache des Interquartilsabstand vom oberen bzw. unteren Quartil entfernt
71
Was ist die Varianz?
= mittlere quadrierte Abweichung der Datenpunkte vom Mittelwert = Maß für die Genauigkeit, mit der der Mittelwert eine Stichprobe repräsentiert
72
Was ist die Standardabweichung?
= Wurzel aus der Varianz = durchschnittliche Abweichung der Werte in der ursprünglichen Messeinheit
73
Was ist die Kurtosis?
Kurtosis gibt die Wölbung einer Funktion an
74
Was ist der Exzess?
Der Exzess gibt die Wölbung einer Funktion im Vergleich zur Normalverteilung an. * Exzess = 0 -> Normalgipflig * Exzess > 0 -> Schmalgipflig * Exzess < 0 -> Breitgipflig
75
Wie kann man eine Normalverteilung an Schiefe und Exzess erkennen?
Bei Schiefe und Exzess sprechen Werte um 0 für eine Normalverteilung.
76
Induktive Statistik - Definition
Rückschluss von Eigenschaften einer Stichprobe auf Eigenschaften einer Grundgesamtheit
77
Welche Stichprobentypen gibt es?
* Einfache Zufallsstichprobe: Gleiche Wahrscheinlichkeit, gezogen zu werden, für jede Untersuchungseinheit -> Essentiell, da keine Störeffekte * Geschichtete Zufallsstichprobe: Zerlegung der Grundgesamtheit in sich nicht überlappende Schichten und einfache Zufallsauswahl aus jeder Schicht -> Beispiel sozialer Status * Klumpenstichprobe: Jeweils vollständige Erhebung einer zufälligen Auswahl aus der Gesamtheit möglicher Gruppierungen („Klumpen“) -> Beispiel Gemeinden * Quotenstichprobe: Auswahl der Untersuchungseinheiten unter Einhaltung eines bestimmten Plans um vorgegebenen Quoten zu genügen - Quoten: Festlegung der Verhältnisse bestimmter Merkmale in der Stichprobe - Ermittlung möglichst auf Basis der Grundgesamtheit - Hohe Repräsentativität, dennoch Beeinflussbarkeit bzw. mögliche Verzerrung durch Auswahl von Merkmalsträgern -> Beispiel Frauenanteil in einer Befragung von Studierenden
78
Was ist das Ziel eines Hypothesentests?
Beantwortung der Frage, ob die zuvor formulierte Hypothese durch das Experiment bestätigt oder widerlegt wurde
79
Was ist das Prinzip eines Hypothesentests?
Prüfung der Kompatibilität des Versuchs- bzw. Stichprobenergebnisses mit der Hypothese
80
Zufallsexperiment - Definition
* Satz von Regeln, unter denen eine bestimmte Handlung ausgeführt wird * beliebig oft exakt identisch wiederholbar - Der Ablauf eines Durchgangs ist zuvor vollständig bestimmt. - Die möglichen Ergebnisse sind zuvor vollständig bestimmt,. - Nur das konkrete Ergebnis (die Beobachtung) ist zuvor unbestimmt -> zufällig
81
Ergebnis - Definition
Beobachtung am Ende eines Durchgangs (eines Zufallsexperiments) Ergebnisse eines Zufallsexperimentes sind immer Mengen. Diese Mengen können auch nur aus einem Element bestehen.
82
Ereignis - Definition
beliebige Menge von Ergebnissen, Teilmenge der Ergebnismenge: E ⊂ Ω
83
Was ist die Laplace Wahrscheinlichkeit?
Annahme gleicher Wahrscheinlichkeit für alle Elementarereignisse
84
Was sagt die bedingte Wahrscheinlichkeit P(A|B) aus?
Wahrscheinlichkeit des Ereignisses A unter der Bedingung B (d.h. B ist eingetreten bzw. bekannt)
85
Was ist das empirische Gesetz der großen Zahlen?
Mit wachsender Versuchszahl stabilisiert sich die relative Häufigkeit eines beobachteten Ereignisses.
86
Wie unterscheiden sich der Laplace-Wahrscheinlichkeitsansatz, der frequentistische Wahrscheinlichkeitsansatz und der subjektive Wahrscheinlichkeitsansatz?
* Der Laplace-Wahrscheinlichkeitsansatz ist ein logikbasierter, theoretischer Ansatz a priori, d.h. vor Durchführung des fraglichen Zufallsexperiments. * Der frequentistische Wahrscheinlichkeitsansatz ist ein empirischer Ansatz a posteriori, d.h. nach Durchführung des fraglichen Zufallsexperiments. * Der subjektive Wahrscheinlichkeitsansatz ist ein theoretischer Ansatz, in dem häufig eigene Erfahrungen verankert sind und in den eigene Wünsche eingehen können.
87
Was ist eine Zufallsvariable?
* Eine Zufallsvariable ist eine Funktion, die jedem Element einer Ergebnismenge Ω eine reelle Zahl zuordnet. * Sie beschreibt die Ergebnisse eines Zufallsvorgangs durch Zahlen und erlaubt damit die rechnerische Verarbeitung. * Zufallsvariablen (ZV) werden mit Großbuchstaben (z. B. X) bezeichnet, die konkrete Realisation mit Kleinbuchstaben (z.B. x). * Zufallsvariablen können diskret oder stetig sein.