Freunde helfen Freunden, keine miserablen Diagramme zu erstellen
(github.com/cxli233)Gute und schlechte Beispiele für Datenvisualisierung
- Ein Essay mit Meinungen zur Datenvisualisierung, der Beispiele und Erklärungen für gute und schlechte Visualisierungen enthält
Keine Balkendiagramme zur Trennung von Mittelwerten erstellen
- Diagramme zur Trennung von Mittelwerten sind in wissenschaftlichen Publikationen häufig zu sehen, aber Balkendiagramme eignen sich nicht, um darzustellen, ob zwei Gruppen mit ähnlicher Verteilung und Standardabweichung tatsächlich gleich sind.
- Es wird betont, dass man vor der Verwendung von Balkendiagrammen einige Dinge prüfen sollte.
Keine Violinplots für kleine Stichproben erstellen
- Bei kleinen Stichproben können sich Verteilung und Quartile stark unterscheiden, weshalb Violinplots wenig aussagekräftig sind.
- Durch Experimente wird gezeigt, dass sich die Verteilung ab einer Stichprobengröße von 50 oder mehr stabilisiert.
Keine divergierende Farbskala für unidirektionale Daten verwenden
- Die Verwendung einer divergierenden Farbskala für unidirektionale Daten ist ein großer Fehler in der Datenvisualisierung.
- Farbskalen sollten besondere, bedeutungsvolle Werte darstellen.
Ergebnisse multifaktorieller Experimente nicht mit Balkendiagrammen darstellen
- Um Ergebnisse multifaktorieller Experimente effektiv zu vermitteln, ist eine sorgfältige Gestaltung der Gruppierung bzw. Trennung nach Faktoren erforderlich.
Keine Heatmaps ohne Umordnung von Zeilen und Spalten erstellen
- Heatmaps sollten unter Berücksichtigung der Reihenfolge von Zeilen und Spalten effektiv erstellt werden.
- Durch Clustering können Zeilen und Spalten neu angeordnet werden, dies ist jedoch nicht die einzige Methode.
Keine Heatmaps erstellen, ohne Ausreißer zu prüfen
- Wenn Ausreißer in Heatmaps nicht geprüft werden, kann dies die Interpretation der Daten erheblich beeinflussen.
Nicht vergessen, den Datenbereich auf jeder Faktorstufe zu prüfen
- In multifaktoriellen Experimenten kann sich der Bereich der Antwortvariablen je nach Faktorstufe stark unterscheiden.
Keine Netzwerkdiagramme erstellen, ohne verschiedene Layouts auszuprobieren
- Das Erscheinungsbild eines Netzwerkdiagramms ist ein wichtiger Faktor für seine Wirksamkeit.
- Durch Änderungen des Layouts kann die Interpretation von Netzwerkdiagrammen erleichtert werden.
Positionsbasierte und längenbasierte Visualisierung nicht verwechseln
- Die Verwechslung positionsbasierter und längenbasierter Visualisierung kann zu Missverständnissen führen.
- Ein Balkendiagramm nicht bei 0 beginnen zu lassen, ist ein großer Fehler in der Datenvisualisierung.
Keine Kreisdiagramme erstellen
- Kreisdiagramme werden kritisiert, weil Menschen nicht besonders gut darin sind, Winkel und Flächen zu lesen.
- Wenn Daten über Länge dargestellt werden sollen, ist es besser, aus einem entfalteten Donut-Diagramm ein gestapeltes Balkendiagramm zu machen.
Keine konzentrischen Donut-Diagramme erstellen
- Konzentrische Donut-Diagramme können Daten falsch darstellen, weil die Bogenlänge des äußeren Rings deutlich länger ist als die des inneren Rings.
- Eine einfache und effektive Alternative ist es, ein Donut-Diagramm zu entfalten und als gestapeltes Balkendiagramm darzustellen.
Keine Rot/Grün- und Regenbogen-Farbskalen verwenden
- Unter Berücksichtigung von Rot-Grün-Sehschwäche sollten farbenblindheitsfreundliche Farbskalen verwendet werden, die Informationen auch in Graustufen gut erhalten.
Nicht vergessen, gestapelte Balkendiagramme neu anzuordnen
- Bei vielen Stichproben und Klassen sollte die Reihenfolge gestapelter Balkendiagramme optimiert werden, damit sie effektiv sind.
Meinung von GN⁺
Das Wichtigste an diesem Text ist, das Bewusstsein für häufige Fehler bei der Datenvisualisierung und dafür zu schärfen, wie man sie vermeidet. Datenvisualisierung ist ein mächtiges Werkzeug, um komplexe Informationen leicht verständlich zu vermitteln, kann bei falscher Verwendung aber zu Fehlinterpretationen führen. Dieser Text bietet allen, die Daten präzise und klar vermitteln möchten, interessante und nützliche Leitlinien.
2 Kommentare
Der Titel ist witzig. Wenn Sie sich den Originalbeitrag ansehen, finden Sie dort auch Beispielgrafiken, sodass er sich leichter anschauen lässt.
Hacker-News-Kommentare