Hüpfen im Huckepack

Meide Stauchbalken und Hüpfsäulen

Vorvorletztes Mal: Stauchbalken und Hüpfsäulen. Vorletztes Mal: entstauchte Balken. Dieses Mal: enthüpfte Säulen. So sind die Daten. Von 2004 bis 2013: Geld für Software-Firmen, die gerade anfangen. Von Firmen, die schon Geld haben.

Zeitreihen, logarithmisch skaliert.
Redesign: ich. Daten der Hüpfsäulen vom vorvorletzten Mal, logarithmisch skaliert.

Die Angels geben nicht so viel Geld. Aber davon immer mehr. 2013 zehnmal so viel wie 2004. Die anderen beiden geben mal mehr, mal weniger. Kann man lange angucken. Und drüber nachdenken.

So hat es der Economist gemalt:

Hard sell: Capital invested in startup IT companies. Quelle: The Economist, Special Report „Tech Startups“, 18.01.2014, Seite 3.
Quelle: vom vorletzten Mal. The Economist, Special Report „Tech Startups“, 18.01.2014, Seite 5.

Kann man auch lange angucken. Und drüber nachdenken. Kommt aber nichts raus dabei. Wegen der Hüpfsäulen. Wenn die gelben hüpfen, hüpfen die braunen mit. Ob sie wirklich hüpfen oder nicht. Ob sie wirklich hüpfen, sieht man aber nicht.

Entschrumpfentdehnt

Meide Stauchbalken und Hüpfsäulen

Ich hab gesagt: Ich mal das noch mal. Jetzt schau.


Redesign: ich.

Geht doch. Beim Economist sah’s so aus:

Startup your engines: Total follow-on funding for alumni from top accelerators. Quelle: The Economist, Special Report „Tech Startups“, 18.01.2014, Seite 5.
Quelle: vom letzten Mal. The Economist, Special Report „Tech Startups“, 18.01.2014, Seite 5.

Ich hab versprochen: Ich probier’s mit Punktbalken. Und logarithmisch. Jetzt schau noch mal:


Auch von mir.

Schau mal die Abstände: Die sind gleich zwischen Y Combinator, Techstars und AngelPad. Weil: Y Combinator ist vier Mal so groß wie Techstars. Und Techstars ist vier Mal so groß wie AngelPad. Klasse.

Lustig, oder? In derselben Liste 2 Milliarden und 2 Millionen. Punktbalken logarithmisch halten das aus.

Noch mal Kreis am Stiel

Gleicher Inhalt, gleiche Form

Die Welt hat Kreis am Stiel gemalt. Hat mir keine Ruhe gelassen. Weil: Waren nicht alle Daten drin. Hab ich mal korrigiert.


Quelle: Die Welt vom 10.12.2013, wie letztes Mal. Redesign: ich.

Selbe Form für alle Werte. Schon besser. Trotzdem: Kreis am Stiel find ich auch gut. Kreis auf Stiel finde ich noch besser. So wie bei William*. Weil’s keine Balken sind, darf auch logarithmisch. Jetzt gehören alle Pixel den Unterschieden.


Dieselben Daten als Punktbalken (Dot Plot). Logarithmisch skaliert. Redesign: auch ich.

Noch was hat mir keine Ruhe gelassen: Schulden pro Stadt oder Schulden pro Kopf?


Redesign: wieder ich.

* Cleveland, W. S., The Elements of Graphing Data, Murray Hill 1994.

Der kleine Unterschied

Aller Raum dem Unterschied

Klein ist oft schwer. Kleine Unterschiede auch. Große Unterschiede zwischen Kleinen besonders. Schau mal. So geht es besonders schlecht.

Arbeitslosenquoten im August 2013 als Tortendiagramm. Quelle: Nürnberger Nachrichten, 30.08.2013, Seite 4.
Arbeitslosenquoten im August 2013. Quelle: Nürnberger Nachrichten, 30.08.2013, Seite 4.

Weil: Torte ist schon schwierig. Weil schwer lesbar. Kleine Tortenstücke sind besonders schwierig. Weil schwerer lesbar. Kleine Tortenstücke in Torten nebeneinander sind noch schwieriger. Weil noch schwerer lesbar. Was machen wir stattdessen?

Arbeitslosenquoten im August 2013 als Grafische Tabelle.
Redesign: ich.

Funktioniert besser. Weil: Wir haben große Unterschiede zwischen kleinen Werten. Noch deutlicher geht es so. Punktbalken. Logarithmisch.

Arbeitslosenquoten im August 2013 als Grafische Tabelle mit logarithmisch skalierten Punktbalken.
Redesign: auch ich.

Verschwindex

Index ist Verschwindex

Entwicklungen vergleichen ist schwierig. Indexierung kann helfen. Kann man so oder so ausrechnen. Bei allen gleich: Alles wird mit demselben Zeitpunkt verglichen. Den muss man gut aussuchen. Bei allen gleich: Die Unterschiede am Anfang siehst Du nicht mehr. Kannst Du Dir nicht aussuchen. Also Vorsicht.

Schau mal.

Good, Not Great: Cumulative change in number of jobs. Quelle: Wall Street Journal, 06.01.2012.Engine and Caboose: Percentage change in the ISM manufacturing index vs. NFIB. Quelle: Wall Street Journal, 01.12.2010.
Quelle: Wall Street Journal, links 06.01.2012, rechts 01.12.2010.

Hier hat man so ausgerechnet: Wie weit sind alle Werte vom Januar 2010 (links) und vom Januar 2005 (rechts) weg? In Prozent. Der Anfang ist 0 Prozent. Wie groß waren da die Unterschiede? Sieht man nicht mehr.

Commodity prices, January 6th 2009=100; coffee, orange juice, wheat. Quelle: The Economist, 04.08.2010.
Quelle: The Economist, 04.08.2010.

Hier hat man so ausgerechnet: Alle Werte werden durch Januar 2009 geteilt. Und mit 100 malgenommen. Der Anfang ist 100. Wie groß waren da die Unterschiede? Sieht man nicht mehr.

Slowest Recovery Since the 1960s. Quelle: Heritage Foundation, 30.08.2012.
Quelle: Heritage Foundation, 30.08.2012.

Hier hat man ausgeschnitten und zusammengeklebt. Alle Linien fangen eigentlich woanders an: in den 60ern, 70ern, 80ern usw. In der Grafik fangen alle am gleichen Punkt an. Wie groß waren da die Unterschiede? Sieht man nicht mehr. Passt der Anfang? Invictus meint nein.

Man kann noch mehr mit Index verschwinden lassen: Schau mal bei Paresh. Besser als Verschwindex ist Logarithmus.

Logarithmuss

Logarithmisch, wenn sehr verschieden

Er hat sich darüber aufgeregt. Weil kein Logarithmus drin ist. Und alles falsch aussieht: Strom steigt stärker als Erdgas. Heizöl explodiert. Falsch. Ich habe es mit Logarithmus gemalt. Erdgas steigt stärker als Strom. Heizöl etwas stärker als Erdgas. Richtig. Weil, von Anfang bis Ende: Erdgas plus 83 Prozent, Strom plus 36 Prozent, Heizöl plus 122 Prozent.

Entwicklung der Preise: Heizöl, Strom, Erdgas. Quelle: Welt am Sonntag, 08.06.2008, Seite 7.Entwicklung der Preise: Heizöl, Strom, Erdgas. Logarithmisch skaliert.
Quelle links: Welt am Sonntag, 08.06.2008, Seite 7. Rechts: mit korrigierter Skala, von mir, gestern.

Zum Trost habe ich ihm eine andere Sonntagszeitung ausgegraben. Wo Logarithmus drin ist. Damit es richtig aussieht. Und man überhaupt was sieht. Ohne Logarithmus wären die Ozeanier flach wie WamS-Gas. Und die Asiaten steil wie WamS‑Öl.


Quelle: Frankfurter Allgemeine Sonntagszeitung, 30.10.2011, Seite 67.

Guck mal: Zweimal Knick. Bei (6) und (9). Das gleiche passiert. Für unterschiedlich viele Leute. Fremde kommen. Die Einheimischen werden erst mal krank und umgebracht. Später werden es wieder mehr.

Was man alles und richtig sieht, wenn man alles richtig sieht.

Nachgekachelt

Dynamik vor Niveau

Noch mal die bunten Autos. Wer hat es gemerkt? Die Werte waren nicht nur verwickelt. Sondern auch falsch skaliert. Braun stieg am stärksten. Hat man nicht gesehen. Weil: Die Werte sind sehr verschieden. Braun ist klein. Grau ist groß. Da braucht es Logarithmus. Logo.

Pkw-Neuzulassungen nach Farben, Spaghetti-Diagramm, logarithmisch skaliert

Besser, aber durcheinander. Nochmal kacheln? So wie letztes Mal? Klar. Kacheln kann man auch logarithmisch. Und vergleichbar. Dann sieht es so aus.

Pkw-Neuzulassungen nach Farben, Small Multiples, vergleichbar logarithmisch skaliert

Nachteil: Das Niveau geht verloren. Braun wächst stark, bleibt aber klein. Leider gilt: Gut lesbar, richtig skaliert, Niveau gezeigt und Dynamik richtig – kriegt man nicht in eine Darstellung. Darum immer wieder gut: Niveau mit Balken, Dynamik mit Säulen.

Pkw-Neuzulassungen nach Farben, Grafische Tabelle mit Sparklines

Log? Logo!

Gleicher Unterschied gleicher Winkel

Nochmal didaktisch. Nochmal die Grafik aus dem Handelsblatt:


Quelle: Handelsblatt, Nr. 83, 30.04.2009, Seite 1, diesmal Original.

Man meint: Laster wächst schneller als Schiene. Schiene wächst wenig. Schiff gar nicht. Stimmt aber nicht. Wenn Werte sehr unterschiedlich sind, kann man Entwicklungen schwer vergleichen. Dann hilft logarithmisch.

Jetzt sieht man: Schiene wächst stärker als Laster. 70 Prozent zu 56 Prozent. Schiff ist zwischendurch fast gesunken. Insgesamt 3 Prozent gewachsen.

Logarithmisch geht nicht immer. Aber öfter.