2.1 Begriffsdefinitionen
2.1 Begriffsdefinitionen
Ein Merkmal heißt quantitativ, wenn seine Ausprägungen durch Messen oder Zählen erfasst werden können, z.B. Blutdruck, Kinderzahl.
Alle übrigen Merkmale heißen qualitativ, z.B. Blutgruppe, Geschlecht, ihre Merkmalsausprägungen stellen begriffliche Kategorien dar.
Ein Merkmal heißt diskret, wenn die Werte abgezählt werden können, z.B. die Kinderzahl in einer Familie.
Stetige Merkmale werden gemessen und können theoretisch alle Werte in einem bestimmten Intervall annehmen, z.B. Körpergröße.
2.1 Begriffsdefinitionen
2.2 Grafische Darstellung
Bei einem Flächendiagramm werden Flächen gegenübergestellt, die proportional zu den zu vergleichenden relativen oder absoluten Häufigkeiten gewählt werden.

2.2 Grafische Darstellung
Das Kreisdiagramm ist eine spezifische Form des Flächendiagramms.
Für die Erstellung eines Kreisdiagramms wird die Winkelsumme des Kreises proportional zu den Häufigkeiten der Ausprägungen aufgeteilt.

2.2 Grafische Darstellung
In einem Balkendiagramm werden die Merkmalsausprägungen auf der x-achse und die Häufigkeiten auf der y-achse aufgetragen.
Für den grafischen Vergleich mehrerer solcher Häufigkeitsverteilungen empfiehlt es sich, die relativen Häufigkeiten darzustellen.

2.2 Grafische Darstellung

2.2 Grafische Darstellung

Die empirische Verteilungsfunktion enthält die gleichen Informationen wie Rohdaten.
2.3 Ausgewählte Kenngrößen
Lagemaße beschreibt die die Lage der Messwerte auf der Messskala und die zentrale Tendenz der Daten.
Sie haben die gleiche Maßeinheit wie die ursprünglichen Messergebnisse.
Zu den Lagemaßen zählen Mittelwert, Quantile, Median, und Modalwert.
2.3 Ausgewählte Kenngrößen
Der Mittelwert beschreibt den statistischen Durchschnittswert. Für den Mittelwert addiert man alle Werte und teilt die Summe durch die Anzahl aller Werte.

2.3 Ausgewählte Kenngrößen
Ein p-Quantil ist allgemein dadurch charakterisiert, dass mindestens der Anteil p der Werte kleiner oder gleich diesem Wert und mindestens ein Anteil 1-p größer oder gleich diesem Wert ist. Das p-Quantil lässt sich aus der Rangliste von n Messwerten bestimmen.

2.3 Ausgewählte Kenngrößen

2.3 Ausgewählte Kenngrößen

2.3 Ausgewählte Kenngrößen
Zusätzlich zum Lagemaß sollte ein geeignetes Streuungsmaß angegeben werden, das die Breite der Verteilung der Messwerte um dieses Lagemaß herum beschreibt. Die meisten Streuungsmaße bleiben gleich, falls ein konstanter Wert zu allen Messergebnissen addiert wird. Wird mit einem konstanten Faktor multipliziert, dann werden auch die Streuungsmaße mit diesem Faktor multipliziert. Zu den Streuungsmaßen gehören z.B. Spannweite, Standardabweichung, Varianz, Quartilsabstand und Variationskoeffizient.
2.3 Ausgewählte Kenngrößen
Spannweite:
Die Spannweite (range) misst den Wertebereich der Messergebnisse. Sie wird als Abstand zwischen dem größten x(n) und dem kleinsten Messwert x(1) berechnet:
range = x(n) - x(1)
Sie hat die gleiche Maßeinheit wie die ursprünglichen Messergebnisse.

2.3 Ausgewählte Kenngrößen

2.3 Ausgewählte Kenngrößen
2.3 Ausgewählte Kenngrößen

变异系数只对由比率标量计算出来的数值有意义。举例来说,对于一个气温的分布,使用开尔文或摄氏度来计算的话并不会改变标准差的值,但是温度的平均值会改变,因此使用不同的温标的话得出的变异系数是不同的。也就是说,使用区间标量得到的变异系数是没有意义的。
unabhängig von der Maßeinheit
es wird als relative Streuungsmaß bzw. normierte Standardabweichung

2.3 Ausgewählte Kenngrößen

Da es nur empirisch begründete Empfehlungen für die zu verwendenden statistischen Maßzahlen gibt, werden vielfach bei der Beschreibung von Merkmalen mehrere Lage- und Streuungsmaße berechnet. Aus der Gegenüberstellung der Maßzahlen sollen Anhaltspunkte über die Verteilung der Daten gewonnen werden. Dem Wunsch nach einer grafischen Veranschaulichung der Daten und Maßzahlen kann in Form eines Box-Whisker-Plots (vgl. Abb. 6) Rechnung getragen werden. Ausgangspunkt dieser Darstellung (bei vertikaler Orientierung) bildet eine Box, deren untere und obere Begrenzungslinie durch das untere und obere Quartil der Messergebnisse festgelegt sind. Innerhalb der Box wird der Median durch einen horizontale Linie und das arithmetische Mittel durch einen Punkt markiert. Die Whiskers werden unterhalb bzw. oberhalb der Box abgetragen. Die Endpunkte sind durch den größten und kleinsten Messwert definiert. Wenn allerdings diese Werte vom oberen bzw. unteren Rand der Box zu weit entfernt liegen (mehr als 1.5(Q3-Q1)), endet die Linie bei dem höchsten bzw. niedrigsten Messwert, der gerade noch innerhalb dieses Bereiches liegt. Alle Messwerte, die extremer sind, werden einzeln dargestellt.

2.4 Verteilungen

2.4 Verteilungen

Normalverteilung
Bei normal verteilten Daten liegen etwa 68% aller Daten innerhalb einer Standardabweichung vom Mittelwert. Etwa 95% liegen innerhalb von 2 Standardabweichung und 99,7% liegen innerhalb von 3 Standardabweichungen.

2.4 Verteilungen

Diskrete Gleichverteilung
Die Gleichverteilung beschreibt eine Wahrscheinlichkeitsverteilung bei der für jeden möglichen Zustand mit die gleiche Wahrscheinlichkeit bzw. Wahrscheinlichkeitsdichte des Zutreffens besteht. Es wird unterschieden in: diskrete Gleichverteilung und stetige Gleichverteilung

2.4 Verteilungen
Binomialverteilung


2.4 Verteilungen

Exponentialverteilung
