Explorative Statistik Flashcards

(18 cards)

1
Q

Welchen zwei Kategorien können Erhebung und Analyse zugeordnet werden?

A
  • Strukturprüfenden und Strukturentdeckenden Verfahren
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist Strukturprüfendes Vorgehen?

A
  • Es liegen bereits Theorien über Strukturen und Faktoren bei bestimmten Phänomenen vor
  • Auf dieser Basis können Hypothesen definiert und geprüft werden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was ist Strukturentdeckendes Vorgehen?

A
  • Methodische Erhebungen und Auswertungsprozeduren, die Einblicke die bislang unstrukturierte Themen bringen
  • Ziel ist es, in Daten (neue) Muster zu finden und neue Theorien abzuleiten
  • Beispielsweise Unterschiede zwischen Gruppen, zwischen Anwendungskontexten, zusammenhängende Faktoren etc.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Welches Verfahren wird bei der Linearen Regression angewandt?

A
  • eher strukturprüfend
  • entdeckt aber auch den stärksten Einfluss
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Welches Verfahren wird bei der Faktorenanalyse angewandt?

A
  • eher strukturentdeckend
  • prüft aber auch, ob die Faktoren orthogonal sind
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wie ist das klassische Vorgehen bei der Vorstruktuierung und Erstellung eines Faktorenraums?

A
  • Nach qualitativer Analyse werden identifizierten Argumenten (und passender Literatur) Items formuliert
  • Strategie: Möglichst breit, um genügend Konstrukte zu haben, mit denen man nachher explorative
    Auswertungsverfahren nutzen kann
  • Nutzer Faktoren
  • Situative Faktoren
  • Kontextfaktoren
  • Nach deskriptiver Auswertung Anwendung explorative Verfahren, um Strukturen in den Daten zu identifizieren
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Was sind Nutzer Faktoren?

A

− demographische Faktoren (Trägervariablen)
− erklärende Moderatorvariablen, um Cluster oder Nutzerprofile abbilden zu können

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was sind Situative Faktoren?

A

− Bewertung des Nutzungskontext über verschiedene Szenarien

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was sind Kontextfaktoren?

A

− Wahrgenommene Vor- und Nachteile einer Technologie, Nutzungsbedingungen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Welche Strukturentdeckenden Verfahren sind geeignet?

A
  • Visualisierungsverfahren, um schnell Zusammenhänge in den Daten zu erkennen
    − Korrelationstabellen & -heatmaps (Farbe kodiert Stärke der Korrelation)
    − Streudiagramme, um Daten auf horizontaler und vertikaler Achse darzustellen, Verteilung und Zusammenhänge erkennen
  • Identifikation starker Einflussgrößen durch lineare Regression
    − Etwa Schrittwiese Regression über Nutzervariablen auf Nutzungsintention
  • Reduktion vieler Variablen auf wenig latente Konstrukte
    − Explorative Faktorenanalyse bzw. Hauptkomponentenanalyse
    − Korrespondenzanalyse (für kategoriale Daten)
  • Reduktion der Fälle/Teilnehmenden auf möglichst homogene Gruppen von Beobachtungen
    − Clusteranalyse
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wie lassen sich Korrelationen visualisieren?

A
  • Anstatt geleitet durch Hypothesen einzelne Zusammenhänge zu prüfen werden alle (bivariaten) linearen Zusammenhänge berechnet und untersucht
  • korrelationstabelle
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was ist eine Korrelationstabelle?

A

− Tabelle mit 𝑁𝑥𝑁-Einträgen (bei 𝑁 Variablen)
− Ist symmetrisch, daher wird oft eine Hälfte für andere Informationen genutzt (e.g., oben/rechts 𝑟, unten links 𝑝-Wert)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wie lassen sich Korrelationstabellen bewerten?

A

− Übersicht über Zusammenhänge und Muster in den Daten
− Ggf. getrennt nach Gruppen
− Achtung: Alpha-Fehler, Überinterpretation von Zufallsfunden

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was ist das Ziel einer Cluster-Analyse?

A
  • aus Menge von Daten Gruppen interpretieren
    − Elemente innerhalb eines Clusters sich ähnlich sind (homogen)
    − Elemente zu denen anderer Clustern möglichst unähnlich (inhomogen)
    − Familie von Methoden mit unterschiedlichen Ansätzen
    − Alle Verfahren segmentieren die Daten über Distanzmaße in ähnliche und nicht ähnliche Gruppen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was ist die Aufgabe der Cluster Analyse?

A

− diese Cluster zu identifizieren
− Keine Aussage, ob sie sich signifikant unterscheiden
− Keine Aussage, ob oder wie die Cluster interpretierbar sind

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was ist k-Means Clustering?

A
  • Exploratives Verfahren zur Typenbildung
  • Ziel: Gruppierung ähnlicher Objekte in k Cluster
  • Anzahl der Cluster (k) wird vorab festgelegt
  • Algorithmus ordnet jedem Objekt genau ein Cluster zu
  • Iteratives Verfahren:
    1. zufällige Startzentroiden
    2. Zuordnung der Datenpunkte zum nächsten Zentrum
    3. Neuberechnung der Clusterzentren
    4. Wiederholung bis Stabilität
  • Optimiert die Binnenhomogenität der Cluster
  • Ergebnis: Clusterzugehörigkeit + Clusterzentren
  • Keine inferenzstatistische Prüfung
17
Q

Welche Variablen nimmt man zum Clustern?

A
  • Es kann über viele unterschiedliche Variablen und -typen geclustert werden
    − Üblicherweise werden alle Variablen normalisiert
    (etwa auf den Bereich [0 … 1], passiert automatisch)
  • Aber: Nicht alle Variablen (Features) sind gleich wichtig
    − Features ausschließen, die vermutlich nicht substantiell beitragen
    ▪ ProbandenID, Bearbeitungsdauer, …⇒ Keine Relevanz, keine Interpretation
    ▪ Versuchsgruppe, … ⇒ Offensichtliche Cluster
    − Nicht alle Features integrieren, sondern mit einem gewissen „Bauchgefühl“
    ▪ E.g. Nutzerfaktoren, Bewertungen, …
  • Setzen Sie—wenn möglich—die Cluster im Anschluss zu anderen Variablen
    (außerhalb des Clustering-Verfahrens) in Bezug