Explorative Statistik Flashcards

Question 1

Q

Welchen zwei Kategorien können Erhebung und Analyse zugeordnet werden?

Answer

A

Strukturprüfenden und Strukturentdeckenden Verfahren

Question 2

Q

Was ist Strukturprüfendes Vorgehen?

Answer

A

Es liegen bereits Theorien über Strukturen und Faktoren bei bestimmten Phänomenen vor
Auf dieser Basis können Hypothesen definiert und geprüft werden

Question 3

Q

Was ist Strukturentdeckendes Vorgehen?

Answer

A

Methodische Erhebungen und Auswertungsprozeduren, die Einblicke die bislang unstrukturierte Themen bringen
Ziel ist es, in Daten (neue) Muster zu finden und neue Theorien abzuleiten
Beispielsweise Unterschiede zwischen Gruppen, zwischen Anwendungskontexten, zusammenhängende Faktoren etc.

Question 4

Q

Welches Verfahren wird bei der Linearen Regression angewandt?

Answer

A

eher strukturprüfend
entdeckt aber auch den stärksten Einfluss

Question 5

Q

Welches Verfahren wird bei der Faktorenanalyse angewandt?

Answer

A

eher strukturentdeckend
prüft aber auch, ob die Faktoren orthogonal sind

Question 6

Q

Wie ist das klassische Vorgehen bei der Vorstruktuierung und Erstellung eines Faktorenraums?

Answer

A

Nach qualitativer Analyse werden identifizierten Argumenten (und passender Literatur) Items formuliert
Strategie: Möglichst breit, um genügend Konstrukte zu haben, mit denen man nachher explorative
Auswertungsverfahren nutzen kann
Nutzer Faktoren
Situative Faktoren
Kontextfaktoren
Nach deskriptiver Auswertung Anwendung explorative Verfahren, um Strukturen in den Daten zu identifizieren

Question 7

Q

Was sind Nutzer Faktoren?

Answer

A

− demographische Faktoren (Trägervariablen)
− erklärende Moderatorvariablen, um Cluster oder Nutzerprofile abbilden zu können

Question 8

Q

Was sind Situative Faktoren?

Answer

A

− Bewertung des Nutzungskontext über verschiedene Szenarien

Question 9

Q

Was sind Kontextfaktoren?

Answer

A

− Wahrgenommene Vor- und Nachteile einer Technologie, Nutzungsbedingungen

Question 10

Q

Welche Strukturentdeckenden Verfahren sind geeignet?

Answer

A

Visualisierungsverfahren, um schnell Zusammenhänge in den Daten zu erkennen
− Korrelationstabellen & -heatmaps (Farbe kodiert Stärke der Korrelation)
− Streudiagramme, um Daten auf horizontaler und vertikaler Achse darzustellen, Verteilung und Zusammenhänge erkennen
Identifikation starker Einflussgrößen durch lineare Regression
− Etwa Schrittwiese Regression über Nutzervariablen auf Nutzungsintention
Reduktion vieler Variablen auf wenig latente Konstrukte
− Explorative Faktorenanalyse bzw. Hauptkomponentenanalyse
− Korrespondenzanalyse (für kategoriale Daten)
Reduktion der Fälle/Teilnehmenden auf möglichst homogene Gruppen von Beobachtungen
− Clusteranalyse

Question 11

Q

Wie lassen sich Korrelationen visualisieren?

Answer

A

Anstatt geleitet durch Hypothesen einzelne Zusammenhänge zu prüfen werden alle (bivariaten) linearen Zusammenhänge berechnet und untersucht
korrelationstabelle

Question 12

Q

Was ist eine Korrelationstabelle?

Answer

A

− Tabelle mit 𝑁𝑥𝑁-Einträgen (bei 𝑁 Variablen)
− Ist symmetrisch, daher wird oft eine Hälfte für andere Informationen genutzt (e.g., oben/rechts 𝑟, unten links 𝑝-Wert)

Question 13

Q

Wie lassen sich Korrelationstabellen bewerten?

Answer

A

− Übersicht über Zusammenhänge und Muster in den Daten
− Ggf. getrennt nach Gruppen
− Achtung: Alpha-Fehler, Überinterpretation von Zufallsfunden

Question 14

Q

Was ist das Ziel einer Cluster-Analyse?

Answer

A

aus Menge von Daten Gruppen interpretieren
− Elemente innerhalb eines Clusters sich ähnlich sind (homogen)
− Elemente zu denen anderer Clustern möglichst unähnlich (inhomogen)
− Familie von Methoden mit unterschiedlichen Ansätzen
− Alle Verfahren segmentieren die Daten über Distanzmaße in ähnliche und nicht ähnliche Gruppen

Question 15

Q

Was ist die Aufgabe der Cluster Analyse?

Answer

A

− diese Cluster zu identifizieren
− Keine Aussage, ob sie sich signifikant unterscheiden
− Keine Aussage, ob oder wie die Cluster interpretierbar sind

Question 16

Q

Was ist k-Means Clustering?

Answer

Study These Flashcards

A

Exploratives Verfahren zur Typenbildung
Ziel: Gruppierung ähnlicher Objekte in k Cluster
Anzahl der Cluster (k) wird vorab festgelegt
Algorithmus ordnet jedem Objekt genau ein Cluster zu
Iteratives Verfahren:
1. zufällige Startzentroiden
2. Zuordnung der Datenpunkte zum nächsten Zentrum
3. Neuberechnung der Clusterzentren
4. Wiederholung bis Stabilität
Optimiert die Binnenhomogenität der Cluster
Ergebnis: Clusterzugehörigkeit + Clusterzentren
Keine inferenzstatistische Prüfung

Question 17

Q

Welche Variablen nimmt man zum Clustern?

Answer

Study These Flashcards

A

Es kann über viele unterschiedliche Variablen und -typen geclustert werden
− Üblicherweise werden alle Variablen normalisiert
(etwa auf den Bereich [0 … 1], passiert automatisch)
Aber: Nicht alle Variablen (Features) sind gleich wichtig
− Features ausschließen, die vermutlich nicht substantiell beitragen
▪ ProbandenID, Bearbeitungsdauer, …⇒ Keine Relevanz, keine Interpretation
▪ Versuchsgruppe, … ⇒ Offensichtliche Cluster
− Nicht alle Features integrieren, sondern mit einem gewissen „Bauchgefühl“
▪ E.g. Nutzerfaktoren, Bewertungen, …
Setzen Sie—wenn möglich—die Cluster im Anschluss zu anderen Variablen
(außerhalb des Clustering-Verfahrens) in Bezug

Question 18

Q

Answer

Study These Flashcards

A

Explorative Statistik Flashcards

(18 cards)