Welche Aussage ist richtig: Eine Skala besteht aus mehreren Items oder ein Item besteht aus mehreren Skalen?
Eine Skala besteht aus mehreren Items
Was ist die kleinste Einheit eines Tests, Item oder Skala
Item
Nennen sie die Hauptgütekriterien und zwei Nebengütekriterien und beschreiben sie diese Inhaltlich in einem Satz.
Objektivität
Ein Test ist objektiv wenn Durchführung, Auswertung und Interpretation unabhängig von der untersuchenden Person zum gleichen Ergebnis führen
Reliabilität
Ein Test ist reliabel, wenn er ein Merkmal präzise und messfehlerarm erfasst und bei Wiederholung stabile Ergebnisse liefert.
Validität:
Ein Test ist valide, wenn er tatsächlich das Merkmal misst, das er zu messen vorgibt und nicht was anderes.
Nebengütekriterien:
Normierung
Ein Test ist normiert, wenn die Ergebnisse an einer geeigneten Vergleichsgruppe eingeordnet werden können. (Normstichprobe)
Standardisierung:
Ein Test ist standardisiert, wenn Durchführung und Auswertung einheitlich geregelt und festgelegt sind.
Ein Test kann nur dann valide sein, wenn er reliabel ist – und reliabel nur dann, wenn er objektiv ist.
Drei zentrale Aspekte der Objektivität:
Durchführungsobjektivität
Auswertungsobjektivität
Interpretationsobjektivität
Was ist mit Durchführungsobjektivität gemeint
Testergebnis ist unabhängig vom Verhalten des Untersuchers während der Durchführung Keine zufälligen oder systematischen Einflüsse auf das Verhalten des Teilnehmers
Was ist mit Auswertungsobjektivität gemeint
Antworten werden nach festen Regeln bewertet
Gleiche Antwort führt immer zur gleichen Bewertung (z. B. richtig/falsch)
Was ist mit Interpretationsobjektivität. gemeint
Schlussfolgerungen sind unabhängig von der interpretierenden Person
Gleiche Ergebnisse führen zu gleichen diagnostischen Aussagen
Geringe Wiederholungsreliabilität
Zeichnungen fallen bei Wiederholung sehr unterschiedlich aus
Kaum stabile Zusammenhänge zwischen mehreren Zeichnungen
Niedrige Objektivität
Unterschiedliche Beurteiler kommen zu unterschiedlichen Interpretationen
Fehlende Übereinstimmung zwischen Auswerter:innen
Inhalte der Zeichnungen spiegeln oft zeichnerische Vorlieben oder Fähigkeiten wider
Kinder machen sich meist keine symbolischen Gedanken über die Bedeutung
Folgen für die Tests
Keine ausreichende Reliabilität und Validität
In der modernen Testpsychologie kaum noch anerkannt
Hohe Gefahr von Fehlinterpretationen
Verwendung dennoch möglich
Nur ergänzend, nicht diagnostisch entscheidend
Als Gesprächsanlass oder exploratives Verfahren
Mit großer Vorsicht, keine alleinigen Schlussfolgerungen
Was ist eine Standardabweichung und welcher Zusammenhang besteht zur Varianz?
Mittelwert berechnen
Abweichung jedes Wertes vom Mittelwert bestimmen
Jede Abweichung quadrieren
Quadrierte Abweichungen aufsummieren
Summe durch die Anzahl der Werte teilen → Varianz
Aus der Varianz die Quadratwurzel ziehen → Standardabweichung
Die Varianz (S²) ist die quadrierte Standardabweichung
Die Standardabweichung (S) ist die Quadratwurzel der Varianz
Varianz und Standardabweichung messen beide die Streuung,
aber die Standardabweichung ist anschaulicher interpretierbar
Beispiel zur Standardabweichung und Varianz
Gegeben sind die Testwerte:
4, 6, 8
Schritt 1: Mittelwert
(4 + 6 + 8) / 3 = 6
Schritt 2: Abweichungen vom Mittelwert
4 → −2
6 → 0
8 → +2
Schritt 3: Abweichungen quadrieren
(−2)² = 4
0² = 0
2² = 4
Schritt 4: Quadrierte Abweichungen summieren
4 + 0 + 4 = 8
Schritt 5: Durch Anzahl der Werte teilen
8 / 3 ≈ 2,67 → Varianz (S²)
Schritt 6: Quadratwurzel ziehen
√2,67 ≈ 1,63 → Standardabweichung (S)
Interpretation
Die Werte weichen im Durchschnitt etwa 1,63 Punkte vom Mittelwert ab
Was ist ein Mittelwert
Durchschnitt einer Reihe von Werten
Summe aller Werte durch Anzahl aller Werte
Repräsentiert das Zentrum der Verteilung
Was ist eine Korrelation
Zusammenhang zwischen zwei quantitativen Variablen
Beschreibt Richtung und Stärke eines Zusammenhangs
Kein Ursache-Wirkungs-Nachweis
Wertebereich der Korrelation:
−1 = perfekter negativer Zusammenhang
0 = kein linearer Zusammenhang
+1 = perfekter positiver Zusammenhang
Positive Korrelation
Steigt Variable A, steigt auch Variable B
Negative Korrelation
Steigt Variable A, sinkt Variable B
Wird häufig angegeben als:
Korrelationskoeffizient r (z. B. Pearson-r)
Bedeutung in der quantitativen Diagnostik:
Prüfung von Zusammenhängen zwischen Testergebnissen
Grundlage für Validitätsnachweise
Vergleich von Testwerten oder Skalen
Das Kürzel „SD“ oder „s“ steht für die Standartabweichung. Es gibt an wie stark die Daten um den Mittelwert streuen
p-Wert (p) = Maß für die statistische Signifikanz
Gibt die Wahrscheinlichkeit an, dass ein Ergebnis zufällig entstanden ist
Bezieht sich auf die Annahme, dass kein echter Effekt vorliegt
p < 0,05:
Ergebnis gilt als statistisch signifikant
Zufall als Erklärung eher unwahrscheinlich
Zufall des Ergebnisses liegt also bei 5 Prozent
Grundidee der Reliabilität (wichtig zum Verständnis)
Reliabilität = Zuverlässigkeit eines Tests
Ein Testergebnis besteht aus:
T = wahrer Wert (der „echte“ Wert)
E = Messfehler
Formel: X = T + E
Je weniger Messfehler, desto höher die Reliabilität
Wertebereich:
R = 1,0 → perfekte Reliabilität (kein Messfehler)
R = 0,0 → keine Reliabilität (nur Messfehler)
1. Retest-Reliabilität
Der gleiche Test wird zweimal durchgeführt
Zwischen den Tests liegt ein Zeitabstand
Danach wird die Korrelation der beiden Testergebnisse berechnet
Diese Korrelation ist das Reliabilitätsmaß
Voraussetzung:
Das gemessene Merkmal muss über die Zeit stabil sein
Unterschied zu anderen Methoden:
Misst die zeitliche Stabilität eines Tests
2. Paralleltest-Reliabilität
Es werden zwei gleichwertige Testformen entwickelt
Beide Tests werden denselben Personen vorgegeben
Die Testergebnisse werden korreliert
Diese Korrelation zeigt die Reliabilität
Voraussetzung:
Die beiden Testformen müssen wirklich gleichwertig sein
Unterschied zu anderen Methoden:
Misst die Formgleichwertigkeit
Sehr aufwendig, da doppelte Itemanzahl nötig ist
3. Innere Konsistenz (z. B. Testhalbierung)
Der Test wird nur einmal durchgeführt
Der Test wird in zwei Hälften geteilt (z. B. gerade/ungerade Items)
Für jede Hälfte wird ein Testwert berechnet
Die beiden Werte werden korreliert
Warum besonders gebräuchlich?
Kein zweiter Test notwendig
Ergebnisse fallen automatisch bei jeder Testdurchführung an
Sehr praktisch und effizient
Der Standardmessfehler (SM) gibt an, wie stark ein Testergebnis durch Messfehler schwankt
Er beschreibt den typischen Fehlerbereich eines Testwertes
Berechnung:
SM
=
Standardabweichung
⋅
Formel SM = Standardabweichung* Wurzel(1−R)
R = Reliabilität des Tests
Über was gibt der Standardmessfehler Auskunft?
Er gibt Auskunft darüber, wie genau ein Test misst
Er schätzt den Bereich, in dem der wahre Wert (T) einer Person liegt
Je kleiner der Standardmessfehler, desto präziser ist der Test
Was ist eine obere und was ist eine untere Grenze?
Untere Grenze (uG):
Testwert − Vertrauensbereich
Obere Grenze (oG):
Testwert + Vertrauensbereich
Zwischen uG und oG liegt mit hoher Wahrscheinlichkeit der wahre Wert
Zusammenhang zwischen Standardmessfehler und Reliabilität
Steigt die Reliabilität, dann sinkt der Standardmessfehler
Sinkt die Reliabilität, dann steigt der Standardmessfehler
→ Hohe Reliabilität = kleines Vertrauensintervall
→ Niedrige Reliabilität = großes Vertrauensintervall
Was ist ein Vertrauensintervall (Konfidenzintervall)?
Ein Vertrauensintervall ist der Bereich zwischen:
unterer Grenze (uG)
oberer Grenze (oG)
In diesem Bereich liegt der wahre Wert einer Person mit einer bestimmten Wahrscheinlichkeit
Welche Fehlerwahrscheinlichkeit / welches Sicherheitsniveau wird verwendet?
Üblich ist ein 95%-Konfidenzintervall
Bedeutet:
Fehlerwahrscheinlichkeit: 5 %
Sicherheitsniveau: 95 %