Datendino

Dino in den Daten?

Bei Robert kannst du Daten eingeben. Alberto hat damit einen Dinosaurier gemalt.

1datasaurus_m

Albertos Daten‑Dino mit Roberts Software.

Der Zwitscher dazu ist bisher sein bester. Die Leute mögen Tiere.

datenbella
Olafs Daten-Bella mit Roberts Software.

Kuck immer, was in den Daten ist. Eine schöne Bella oder ein stinkiger Dino. Sagt auch Alberto. Auf Englisch. „Don’t trust summary statistics. Always visualize your data first.“ Ich sag dazu immer: Durchschnitt versteckt. Sogar Dinos.

Nebenboulen

Durchschnitt versteckt

Wir machen gerade Urlaub in Frankreich. In Frankreich spielt man Boule. Mit dem Nachbarhund habe ich auf den Ausgang gewettet. Ich habe mir fünf Würfe von jedem angesehen und nachgemessen.

Ich beim Boule spielen

Ich habe seinen Rat beherzigt. Und die kompletten Verteilungen aufgemalt. Nicht nur die Mittelwerte. So weit waren die Kugeln vom Cochon weg. In Zentimeter.

Alle Werte und Mittelwerte

Jetzt sehe ich mit bloßem Auge:

Ausreißer
Den besten Einzelwurf hatte er. Eine Schwalbe? Ein Sommer?

Happy hatte ein paar solide Würfe. Aber auch den allerschlechtesten. Könnte ein einmaliger Ausreißer sein. Oder ein Hinweis, dass seine Leistung nicht stabil ist.

Mittelwerte
Hannes und Bimpfi liegen nah zusammen. Er und Baui auch. Hm. Das reicht mir noch nicht.

Streuung
Bauis Würfe streuen weniger als seine. Und die Mittelwerte unterscheiden sich nur um 1 Zentimeter. Daher Platz 3 statt 4 für Baui.

Bimpfi spielt sehr solide mit mäßiger Streuung. Hannes toppt alle: Der Mittelwert ist der niedrigste, die Streuung auch.

Ich habe auf Hannes gesetzt. Er hat gewonnen.

Histogramm als Minigrafik

Durchschnitt versteckt

Mittelwert und Median sagen sehr knapp, wie eine Verteilung aussieht. Manchmal ist das zu knapp. Wenn man Daten verstehen will, muss man sie alle sehen. Rafe hat eine schöne Idee, wie das sehr dicht geht.

Mrs. Johnson’s piano class last year had eight students of varying ages pianoclass01, seven of them children and one older gentleman, Mr. Onaip, who provided the other students with an interesting perspective on music and life in general. This year, the age distribution is noticeably different pianoclass01, since Mr. Onaip has brought along two of his like-aged friends and his daughter, Allegro, who has just graduated from medical school.

Ich hab ausprobiert, ob das in Excel geht. Es geht.

Daten muss man sich genau ansehen. Das ist wichtig. Wie wichtig, zeigt die Geschichte von Stephen Jay Gould. Er hatte Krebs. Eine besonders schlimme Art, die man nicht lange überlebt. Die meisten zumindest. Stephen sah sich die Statistiken an. Schon die Hälfte ist bereits nach 8 Monaten tot. Nur sehr wenige überleben mehrere Jahre. Stephen beschloss, zu denen zu gehören. Gelang ihm. Er lebte noch mehr als 10 Jahre.