Visuelle und statistische Analyse

Sie befinden sind hier: Softskill Management > Visualisierung > Analyse

Cluster-Höhenfels


Datenvisualisierung nützlich und ansprechend machen:

gCluto kann Cluster-Analysen auch als Höhenfelder darstellen.

Analytische Visualisierung

Mittels visueller Analysen können Besonderheiten eines Datenbestandes sichtbar gemacht werden, die mit statistischen Methoden nicht erfassbar sind. Die grafische Darstellung von Daten dient auch der Beurteilung der Angemessenheit der verwendeten Datenanalysemodelle.

Grenzen numerischer Analyse

Die Statistik bietet mächtige und wirkungsvolle Werkzeuge für die Analyse von Datenbeständen. Gleichwohl führen diese Werkzeuge nicht in jedem Fall zu dem Ziel einer aussagekräftigen und verlässlichen Beschreibung der Daten. Im folgenden sehen Sie vier verschiedene Datensätze in tabellarischer und graphischer Darstellung:

Datensatz 1 Datensatz 2 Datensatz 3 Datensatz 4
x y x y x y x y
10,00 8,04 10,00 9,14 10,00 7,46 8,00 6,58
8,00 6,95 8,00 8,14 8,00 6,77 8,00 5,76
13,00 7,58 13,00 8,74 13,00 12,74 8,00 7,71
9,00 8,81 9,00 8,77 9,00 7,11 8,00 8,84
11,00 8,33 11,00 9,26 11,00 7,81 8,00 8,74
14,00 9,96 14,00 8,10 14,00 8,84 8,00 7,04
6,00 7,24 6,00 6,13 6,00 6,08 8,00 5,25
4,00 4,26 4,00 3,10 4,00 5,39 19,00 12,50
12,00 10,84 12,00 9,13 12,00 8,15 8,00 5,56
7,00 4,82 7,00 7,26 7,00 6,42 8,00 7,91
5,00 5,68 5,00 4,74 5,00 5,73 8,00 6,89
                 
Anzahl  11,00 11,00 11,00 11,00 11,00 11,00 11,00 11,00
Mittelwert  9,00 7,50 9,00 7,50 9,00 7,50 9,00 7,53
Korrelations-
koeffizient
0,82 0,82 0,82 0,81
Standardfehler 2,02 2,02 2,02 2,07
Standard-
abweichung
2,79 2,79 2,79 2,79
Varianz 7,79 7,79 7,79 7,80

Beachten Sie, dass die sechs wichtigsten statistischen Parameter für die vier Datensätze praktisch identisch sind. Gleichwohl zeigen die unten stehenden Diagramme, dass die Verteilung der Daten vollkommen unterschiedlich ist. Die wichtigsten statistischen Parameter sind zur Beschreibung dieser Datensätze nicht geeignet.

Datensatzvisualisierung mit mit Trend, aber schwacher Korrelation Parbolischer Datensatz Graph
Linearer Datensatz Graph mit Ausreißer Datesatz mit nahezu identischen Werten auf der Ordinate

 


Ihre Visualisierung muss unbedingt einen Zweck haben. Darüber hinaus müssen Sie bei der Entscheidung, was Sie in Ihre Visualisierung aufnehmen, selektiv vorgehen, damit sie den von Ihnen bestimmten Zweck erfüllt.
Choleraepidemie und Brunnen in London 1854

Erfolge visueller Analysen

Einer der frühesten und erfolgreichsten Versuche zur graphischen Faktorenanalyse, war eine Karte zum Thema "Öffentliche Brunnen und Cholera-Todesfälle in Zentral-London im September 1854" von Dr. John Snow.

Thematische Kartographie und Faktorenanalyse
Der Zusammenhang zwischen dem öffentlichen Brunnen in der Broad Street hätte alternativ, mit viel Arbeit und etwas Glück, auch rein rechnerisch nachgewiesen werden können. Gleichwohl hat John Snow die überlegene Effiziens der graphischen Methode überzeugend bewiesen.

Grenzen visueller Analysen

Allerdings führt auch die graphische Analyse nicht nicht automatisch zum Erfolg. Mit den richtigen Daten können können auch sehr überzeugende "Unsinnkorrelationen" dargestellt werden. Statistische Grafiken sind, ebenso wie statistische Berechnungen, nur so gut, wie wie die Hypothese bzw. das Modell, das Ihnen zugrunde liegt.

Darüber hinaus können können Visualisierungen mit korrekten Daten auch bewusst irreführend gestaltet werden, um falsche Schlussfolgerungen zu provozieren:

Korrelation der Börsenpreisentwicklung in London und New York, mit der globalen solaren Einstrahlung: Zahl der Bearbeitern und der Bearbeitungen von Wikipedia-Eintragungen - dargestellt mit logarhitmischer und linearer Ordinate:
Unsinn-Korrelation Irreführende Veranschaulichung
Die meisten Wikipedianer bearbeiten nur wenige Einträge

Die grafische Darstellung von Daten oder statistischer Größen im Rahmen von Datenanalysen wird als Datenanalysegrafik bezeichnet.

Rechterhand sehen Sie einen Klassiker der Datenanalysegrafik: Das Klimadiagramm nach Walter. Die ausgeprägt aride Sommerphase des Mittelmeerklimas ist auf den ersten Blick erkennbar.

Unten als Beispiel für eine komplexere explorative Visualisierung, die Darstellung einer Clusteranalyse.

Matrix-Clusteranalyse

Visualisierung einer Clusteranalyse

 

Visualisierungsseminare:

(Dies ist ein Auszug unseres Angebots, um dieses vollständig zu durchsuchen nutzen Sie bitte den Seminarfinder