Histogramm

Histogramme fassen die Verteilung einer kontinuierlichen numerischen Variable durch die Messung der Häufigkeit zusammen, mit der bestimmte Werte im Dataset vorhanden sind. Die X-Achse in einem Histogramm ist eine Zahlenlinie, die in zwei Zahlenbereiche oder Abschnitte unterteilt ist. Für jeden Abschnitt wird ein Balken dargestellt, wobei die Breite des Balkens den Bereich des Abschnitts und die Höhe des Balkens die Anzahl der Punkte darstellt, die in diesen Bereich fallen. Das Verständnis der Verteilung Ihrer Daten ist ein wichtiger Schritt bei der Untersuchung von Daten.

Beispiel

Im folgenden Histogramm wird die Verteilung der Wahlbeteiligung bei der US-Wahl 2016 visualisiert.

  • Anzahl: Wahlbeteiligung
  • Überlagerungen: Mittelwert, Normalverteilung
Histogramm der Wahlbeteiligung bei der US-Wahl 2016

Daten

In den Konfigurationen für Daten sind die Variable zur Erstellung des Histogramms, die Anzahl an Abschnitten sowie die im Diagramm angezeigten Statistiken enthalten.

Variable

Für Histogramme ist eine kontinuierliche Zahlenvariable auf der X-Achse erforderlich.

Einige analytische Methoden erfordern, dass die Daten normal verteilt sind. Wenn die Daten verzerrt sind (die Verteilung ist einseitig schief), können Sie die Daten transformieren, um eine Normalverteilung herzustellen. Anhand des Parameters Mit Transformation können Sie Transformationen auf das Diagramm anwenden. Es kann sich um eine logarithmische Transformation oder eine Quadratwurzeltransformation handeln.

Tipp:

Als Referenz können Sie einem Histogramm eine Normalverteilungs-Überlagerung hinzufügen, indem Sie unter Überlagerung die Option Normalverteilung anzeigen auswählen.

Logarithmische Transformation

Die logarithmische Transformation wird häufig dann verwendet, wenn die Daten eine positiv verzerrte Verteilung haben und nur wenige große Werte vorhanden sind. Wenn diese großen Werte in Ihrem Dataset vorhanden sind, können Sie mit der logarithmischen Transformation konstantere Varianzen erreichen und Ihre Daten normalisieren.

Die folgenden Beispiele zeigen die Verteilung aller Stimmen bei der US-Wahl 2016. Das erste Bild ist positiv verzerrt und es wurde keine Transformation angewendet. Auf das zweite Bild wurde eine logarithmische Transformation angewendet, wodurch das Histogramm eine normalere Verteilung erhält.

Histogramme aller Stimmen mit und ohne logarithmische Transformation

BildTransformation
Bild 1

Keine

Bild 2

Logarithmisch

Hinweis:

Logarithmische Transformationen können nur auf Zahlen größer als Null angewendet werden.

Quadratwurzel-Transformation

Eine Quadratwurzel-Transformation ähnelt einer logarithmischen Transformation dadurch, dass sie die rechtsseitige Schiefe eines Datasets verringert. Im Gegensatz zur logarithmischen Transformation kann die Quadratwurzel-Transformation auch auf die Null angewendet werden.

Hinweis:

Quadratwurzel-Transformationen können nur auf Zahlen größer als oder gleich Null angewendet werden.

Abschnitte

Die Standardzahl von Abschnitten beträgt 32. Dies können Sie anpassen, indem Sie den Wert für Abschnitte auf der Registerkarte Daten ändern. Wenn Sie die Anzahl der Abschnitte ändern, können Sie mehr oder weniger Details in der Struktur Ihrer Daten anzeigen.

Mit dem Farbfeld neben Farbe der Abschnitte können Sie die Farbe der Abschnitte eines Histogramms ändern.

Überlagerungen

Die folgenden beschreibenden Statistiken werden berechnet und als vertikale Linien in Histogrammen angezeigt:

  • Normalverteilung: Eine glockenförmige Kurve, mit der Daten mit einer Normalverteilung verglichen werden.
  • Mittelwert: Eine einzelne vertikale Linie, die den Mittelwert des Datasets angibt.
  • Medianwert: Eine einzelne vertikale Linie, die den Medianwert des Datasets angibt.
  • Standardabweichung: Zwei vertikale Linien, die die Werte je einer Abweichung oberhalb und unterhalb des Mittelwertes angeben.

Klicken Sie auf die Überlagerung, um sie zu aktivieren oder zu deaktivieren. Mit dem Farbfeld neben der Statistik können Sie die Linienfarbe ändern.

Mit dem Parameter Datenbeschriftungen anzeigen können Sie Beschriftungen aktivieren. Die Beschriftungen geben die Anzahl der Werte für jeden Abschnitt an.

Statistiken

Die folgende Statistik wird für das ausgewählte numerische Feld aufgeführt:

  • Mittelwert
  • Mittel
  • Standardabweichung
  • Zeilen
  • Anzahl
  • Minimum
  • Maximum
  • Summe
  • NULL-Werte

Achsen

Mit den Konfigurationen für Achsen werden die Spezifikationen der X- und Y-Achse geändert.

Sie können die Anzeige von numerischen Werten auf den X- und Y-Achsen formatieren, indem Sie die Anzahl an Dezimalstellen angeben und festlegen, ob ein Tausendertrennzeichen verwendet werden soll.

Die Standardgrenzen der Y-Achse basieren auf dem Bereich der Datenwerte auf der Achse. Sie können diese Werte anpassen, indem Sie unter Maximale Grenzen einen Wert eingeben. Durch das Festlegen einer Grenze für die Y-Achse bleibt der Maßstab des Diagramms für Vergleiche einheitlich. Klicken Sie auf die Schaltfläche Zurücksetzen, um die Grenze der Achse auf den Standardwert zurückzusetzen.

Führungslinien

Führungslinien oder Bereiche können als Referenz oder zum Hervorheben signifikanter Werte zu Diagrammen hinzugefügt werden. Durch Klicken auf die Schaltfläche Führungslinie hinzufügen können Sie der Y-Achse Führungslinien hinzufügen.

Um eine Führungslinie zu erstellen, geben Sie einen Startwert ein, wo die Linie gezeichnet werden soll. Geben Sie einen Startwert und einen Endwert ein, um eine Führungslinienbereich zu erstellen. Sie können auch das Aussehen der Führungslinie bzw. des Bereichs ändern. Bei Linien können der Style, die Breite und die Farbe aktualisiert werden. Bei Bereichen können Sie die Füllfarbe aktualisieren.

Sie können den Namen der Führungslinie mit dem Parameter Name der Führungslinie ändern und der Führungslinie mit dem Parameter Führungslinienbeschriftung Text hinzufügen (z. B. den Medianwert).

Sie können festlegen, ob die Führungslinie über oder unter dem Diagramm dargestellt werden soll, indem Sie die Schaltflächen Oberhalb und Unterhalb im Parameter Rendern verwenden.

Format

Sie können das Aussehen des Diagramms konfigurieren, indem Sie Text- und Symbolelemente formatieren. Die Optionen für Diagrammformatierung lauten wie folgt:

  • Textelemente: Größe, Farbe und Schriftschnitt der Schriftart für den Diagrammtitel, den X-Achsentitel, den Y-Achsentitel, den Legendentitel, den Beschreibungstext, den Legendentext, die Achsenbeschriftungen und die Datenbeschriftungen. Sie können das Format für mehrere Elemente auf einmal ändern, indem Sie die Strg-Taste gedrückt halten und auf die Elemente klicken, die Sie auswählen möchten.
  • Symbolelemente: Farbe, Breite und Style (Durchgezogen, Gepunktet oder Gestrichelt) für Gitternetz- und Achsenlinien und die Hintergrundfarbe des Diagramms.

Allgemein

Die Standardtitel für Diagramme und Achsen basieren auf den Variablennamen und dem Diagrammtyp. Auf der Registerkarte Allgemein können Sie die Titel bearbeiten oder deaktivieren. Sie können auch einen Titel im Parameter Legendentitel und eine Diagrammbeschreibung im Parameter Beschreibung angeben. Eine Beschreibung ist ein Textblock, der am unteren Rand des Diagrammfensters angezeigt wird.