Streudiagramm
aus Wikipedia, der freien Enzyklopädie
Ein Streudiagramm (Scatterplot) ist die graphische Darstellung von beobachteten Wertepaaren zweier statistischer Merkmale, also für einen bivariaten Datensatz. Diese Wertepaare werden in ein kartesisches Koordinatensystem eingetragen, wodurch sich eine Punktwolke ergibt.
[Bearbeiten] Beispiele
Als Ergebnisse der Mikrozensus-Befragung im Mai 2003 durch das statistische Bundesamt sind die durchschnittlichen Gewichte von Männern nach Altersklassen gegeben. Für das Streudiagramm der Gewichte nach Alter wurden die Altersklassen durch die Klassenmitten ersetzt.
Ein weiteres Beispiel zeigt die Streudiagramme einer Vorlesungsevaluation. Es wurden Noten von 1 bis 4 vergeben.
[Bearbeiten] Besonderheiten
Es sind im allgemeinen nur metrisch skalierte Daten für Streudiagramme geeignet. Beobachtungen ordinalskalierter Merkmale überlagern sich, wenn gleiche Werte mehrfach vorliegen. Es gibt jedoch auch Möglichkeiten, ordinalskalierte Merkmale in Streudiagramme darzustellen:
- Durch Sonnenblumen: Es wird an jedem Koordinatenpaar ein Kreis eingetragen. Die Zahl der Wertepaare, die auf diesem Punkt liegen, wird durch Striche an den Kreis dargestellt, so dass sich eine stilisierte Sonnenblume ergibt.
- Durch einen Jittered Scatterplot ("Verwackeltes Streudiagramm"): Es werden auf die Daten kleine Zufallszahlen addiert, so dass die Werte leicht auseinander gezogen werden und eine Punktwolke ergeben. Man muss sich allerdings im Klaren sein, dass die Werte eigentlich übereinanderliegen. Man könnte sie als "pseudometrisch" bezeichnen.
Als Beispiel wurde die Evaluation einer Statistikvorlesung verwendet. Es wurden Streudiagramme bezüglich "Der vermittelte Vorlesungsstoff ist gut verständlich" und "Gesamte Beurteilung der Vorlesung Betriebsstatistik" erstellt. Bei dem Jittered Scatterplot wurde auf die Werte eine gleichverteilte Zufallszahl im Intervall [-0,3;0,3] addiert.