Quantitative Daten auswerten
6.1 Grundlagen der quantitativen Datenauswertung
Quantitative Daten
meist numerisches Datenmaterial
zur Bezeichnung und Beurteilung von Sachverhalten
lasssen sich messen oder zählen
Messdaten: Zeitdaten, Maße, Länge, Abstände, Entfernungen
Zähldaten
sind zb Häufigkeiten (Anzahl der Kinder in einer Klasse)
2 Arten der Auswertung
deskriptive Statistik (beschreibende Statistik)
beschreibt empirische Daten durch Tabellen, Kennzahlen, Maßzahlen
verscuht sie mithilfe von Grafiken übersichtlich darzustellen
Inferenzstatistk( schließende Statistik)
repräsentiert den komplementären Teil zur deskriptiven Statistik
mathematische Grundlage ist Wahrscheinlichkeitstheorie
mit ihr kann man Wahrscheinlichkeitsaussagen über Grundgesamtheit treffen
dazu nötig Stichprobenverteilung
quantitaive explorative Studien
zb Leitfadeninterviews - Gegenstände werden erkundet zu denne es wenige theoretische Vorannahmen, wenig frühere Studien vorliegen
offene Forschungsfragen beantworten
FOrschungsgegenstand besser beschrieben werden
Auswertung erfolgt mit deskriptiven Verfahren zb Kennwerten, Tabellen, Grafiken
populationsbeschreibende quantitative Studien
zb Wahlumfragen
basieren auf repräsentativen Stichproben (wie viel Prozent würden eine bestimmte Partei wählen)
werden möglichst genau auf Basis der entsprechenden Stichprobenkennwerte geschätzt
hierbei wählt man die Inferenzstatistik
Inferenzstatistik
explanativen quantitativen Studien
Ziel- Satz von theoretisch abgeleiteten Hypothesen anhand der Stichprobendaten testen
sicherstellen das die in Stichprobe gefundenen Effekte kein Zufallsprodukt sind
es findet Hypothesenprüfung statt
in Form von Experimenten
deskriptiv Statistik (beschreibende Statistik)
numerische Stichprobendaten
in Form von Stichprobenkennwerten
Maße der zentralen Tendenz:
Modalwert, Median, arithmetischer Mittelwert,
Maße der dispersion:
Variationsbreite, Varianz, Strandardabweichung,
Zusammenhangsmaße:
bivariater KOrrelationskoeffizient,
Häufigkeiten:
kumulierte absolute oder relative H
Kennwerte:
in Fließtext oder in tabellen und Grafiken (Balkendiagramm, Kreisdiagramm, Histogramm)
Inferenzstatistik (schließende Statistik)
schließt auf Basis von Stichprobendaten auf Populationseffekte
Populationsparameter werden geschätzt (Parameterschätzung)
zb Schätzung des Populationsmittelwertes auf Basis des Stichprobenmittelwertes
Hypothesenprüfung:
zb Prüfung einer Unterschiedshypothese, MIttelwert ist in einen Teilpopulation größer als in der anderen
Explorative Studie (dienst der Bildung von Hypothesen)
Deskriptiv Statistik
Stichprobenbeschreibung:
spezielle Techniken der deskriptiben Statistik:
explorative Datenanalyse udn Data Minin
zur identifikation von Effekten
in Datensätze mit sehr vielen Variablen
Beantwortung der Forschungsfrage
Visualisierungstechniken
explorative multivariate Verfahren
teilweise mit Signifikanztests
Deskriptive Studie
Deskriptiv:
Stichprobenbeschreibung
Inferenz:
Parameterschätzung
für interessierende Variable
mit Punktschätzung
oder Intervallschätzung
Explanative Studie
ergänzende deskriptive Darstellng der stichprobenkennwerte zu Hypothesen geprüften Effekten
Unterschieds, Zusammenhangs, Veränderungs, Einzelfallhypothese
unterschiedliche Inferenzansätze stehen zur Verfügung
Arbeitsschritte bei Auswertung einer Quantitativen Studie:
Datenbereinigung: Datenansatz sollte von Fehlern bereinigt sein
Stichprobenbeschreibung: Stichprobe sollte Anhand soziodemografischen Merkmalen mithilfe von deskriptiven Verfahren beschrieben werden (Angaben zu Häufigkeiten, Mittelwert, Streuungen
Dateninspektion und deskriptive Analyse: vor der Prüfung Dateninspektion vornehmen,
Inferenzstatistische Analysen: Verfahren der Parameterschätzung im Mittelwert (bei explanativen Studien - Signifikanztest
Inhatliche Interpretation der statistischen Ergebnisse: Alle Ergebnisse mit Bezug zum Forschungsproblem (einzelnen Forschungsfragen und Forschungshypothesen) sind zu interpretieren
6.2 Despkriptive Statistik 1: Univariate Datenanalyse
Quasi stetig
Menge der angenommenen Werte ist nur aufgrund der mangelnden Auflösung des Messgerätes nicht abzählbar (zb Preisangaben in Euro und Cent)
Quantitatibe Merkmale, Qualitative Merkmale
Quantitativ: messbare Merkmale
Qualitativ: Merkmale die ein Zustand und nicht messbar sind
Nach der Aufbereitung der Daten
Statistische Analyse
Beginn ist durch Exploration gekennzeichnet
dh. erstmal Überblick verschaffen über Ergebnisse und Studie
Datensatz wird ausgezählt, Häufigkeiten der Merkmalsausprägungen der Variablen werden erstellt
erstmal für alle Variablen so vorgehen
Absolute und Relative Häufigkeiten
Absolute H (Anzahl): Verteilung der Antworten in Nennungen, also absolute Zahlen
Relative H (Prozetsatz): Verteilung der Antworten in Prozent
Gesamtzahl der Fälle ist n
Kategorienbreite
Differenz zwischen Minimum und Maximum einer jeden Kategorie
zv 1000 Personen, deren Schuhgröße kleinste 35 größte 47 , man möchte 4 Kategorien haben, dann (47-35)/4 = Kategorienbreite 3
6 Kriterien
Anzahl der Kategorien sollte eine Differenzierung ermöglichen, aber nicht zu groß sein
Kategorien sollten möglichst die gleiche Breite haben
Alle Kategorien sollten eine gewissen Anzahl von Fällen aufweisen
Natürliche Schwellenwerte sollten berücksichtigt werden
Kategorienbildung sollte möglichst unabhängig von Ausreißerwerten sein
Grenzen der Kategorien sollten plausibel und gut kommunizierbar sein
Skalenniveau
bestimmt die möglichen mathematischen Operationen die mit den Variablen möglich sind
damit auch die Interpretation der Ergebnisse
Transformationen
Infos aus relevanten Merkmalen
4 Stufen der Skalierbarkeit
Nominalskala
Ordinalskala
Intervall
Verhältnissskala
qualitiative Daten werden so klassifiziert, dass sich klassen qualitativ voneinander unterscheiden
innerhalb der Klassen besteht Gleichheit
nicht stetige (diskrete) Tatbestände
zwischen Zahlenwerten besteht keine quantitative Beziehung
Reihenfolge der Klassen ist bedeutungslos
Klassen sind beliebig austauschbar
Ereignis , Beobachtung , Tatbestand , Klasse können eindeutig zugeordnet werden
Häufigkeiten können gebildet und häufigste Werte (Modalwerte) berechnet werden
Typische Merkmale: Geschlecht, Schulabschluss, Haarfarbe
leistet die Einordnung der Werte in eine Rangfolge
Aussagen über Größenrelationen sind mögich
keine Aussagen über Größenunterschiede
Ordinalskala ermöglicht auf Basis von ganzzahligen Werten eine Rangfolge
Aussagen über die Größenrelationen können getroffen werden
Zahlenwerte haben unterschiedliche Distanzen zueinander
man kann nur sagen was kleiner und größer ist
Berechnung des Medians (Mittelwert)
oder Abbildung von Perzentilen
Beipsiel Schulnoten 1 bis 6
Intervallskala
metrische Skala
Abstände zwischen den Werten auf der Skala identisch sind
aufgrund des fehlenden echten Nullpunkts nicht ins Verhältnis gesetzt werden können
Verhältnisskala
Abstände zwischen Werten auf der Skala sind identisch
aufgrund des echten Nullpunkts können sie ins Verhältniss gesetzt werden
Verhältnis oder Absolut skala ist höchstes Skalenniveau
Abstände konstant und identisch
Quotient zweier Skalenwerte hat eine reale Bedeutung
man kann Verhältnis der Skalenpunkte zueinander betrachten
zb Einkommen, Lebensaler, Haushaltsgröße, Körpergröße
Übersicht Skalenniveaus
Nominal: (keine Ordnung der Daten)
mögchliche Aussagen: Gleicheit und Ungleichheit (= und = durchgeschtrichen)
mögliche Methoden: Häufigkeiten, realative H, Modalwert
zb Lieblingszeitungen, Geschlecht
Übericht Skalenniveaus
Ordinal (Ordnung möglich ohne Abstände)
mögliche Aussagen: 1. Gleicheit , Ungleichheit
2. Rangreihung (<, >, =)
mögliche Methoden: kumulierte H, Median
zb Beliebtsheitsrangliste, soziale Schichten
Verhältnis (Ausprägungen haben absoluten Nullpunkt, Verhältnis kann interpretiert werden)
mögliche Aussagen
1. Gleichheit und Ungleichheit
Rangreihung
Gleichheit der Unterschiede
Proportionalität x11= 3* x12
mölgiche Methoden:
geometrisches Mittel
zb Alter, Preis, Größe, Inflation
Mittelwert
statistischer Kennwert
Maße der zentralen Tendenz
beschreibt allg. Niveaulage der Grundgesamtheit in Bezug auf zu analysierenden Wert
verschiedene Mittelwerte
bekannteste arithmetische Mittelwert x quer
nur bei intervall und verhältnissskala anwendbar
Median
Mittelwert bei Merkmalen mit Ordinalskala
ziel: Merkmalausprägung rausfinden die Datenmaterial in 2 glelichgroße Hälften aufteilt
die eine überschreitet den Median die andere unterschreitet
Modus
Mittelwert bei Nominalskalierten Merkmalen
Variationsbreite (Dispersionsmaß)
Gesamtbereich aller Messwerte
wird auch range genannt
kleinste Wert vom größten abziehen
Quantile oder Perzentile
wert einer Verteilung der selbige in bestimmte Gruppen einteilt (besten 50 %, die schlechtesten 25%
gibt an welcher Anteil maximal einen bestimmten Wert annimmt
am häufigsten verwendete Perzentil P50
ist der Median
ausserdem 25 und 75% werden Quantile genannt
empirische Varianz s hoch 2
Summe der quadrierten Abweichungen vom Mittelwert
schwer zu interpretieren
Wird 0 wenn sich alle quadrierten Differenzen gegenseitig aufheben
Wurzel ziehen am Schluss
Standardabweichung
Wurzel aus der empirischen Varianz
Kein FLächenmaß mehr , somit inhaltlich interpretierbar
Schiefe von Verteilungen
eingipflige symmetrische Verteilung (arithmetisches Mittel, Median, und Modalwert stimmen überein)
Gibt eine Steile Verteilung (GLockenform) und eine flache Verteilung (im SKript )s 73
Mehrgipflige symmetrische Verteilung
arithmetische Mittel und Median stimmen überein
Es können aber mehrere Modal Werte auftreten
Nennt man Bimodale Verteilung (2 unterschiedliche Modi)
schief (Verteilung ist nicht symmetrisch)
streuen sie auf rechter Seite stärker (Rechtsschief)
Auf linker Seite (linksschief) , Rechtssteil oder negativ schief
Faustregel zur Einschätzung der Schiefe eingipfliger Verteilungen
Bezüglich des Mittelwerts , Median, Modus
Nennt sich: Fechnersche Lageregel
linkssteil - x quer (größer gleich) Median (größer gleich) Modus
Rechtssteil - x quer (kleiner gleich) Median (kleiner gleich) MOdus
Symmetrisch- x quer (= ) Median (=) Modus
Zb Verteilungen welche Einkommens und Vermögenschverhältnisse verschiedener Länder wiedergeben sind linkssteil
Median ist dann kleiner als arithmetische Mittel
Wenige Bezieher hoher Einkommen
verleihen dem arithmetischen Mittel einen hohen Wert
Große Masse der EInkommensbezieher am unteren Rand einer typischen Einkommensverteilung
Rechtssteil bzw. linkssteil Verteilungen - Median ist größer als MIttel
Zb beim 100 Meter lauf wenn alle Läufer ungefähr die gleiche Zeit erreichen , aber 1ner deutlich schneller ist als alle anderen
6.3 Deskriptive Statistik 2: Bivariate Datenanalyse
Ordnung der Daten in Kreuztabelle
bietet eine geordnete Darstellung von Werten
Im einfachsten Fall sind Daten normalskalliert - vorhanden bzw nicht vorhanden
Unterscheidung zwischen unabhängig und abhängigen Variablen ist wichtig
Abhängige wird immer von einer anderen Variable erklärt
4 Zusammenhänge der abhängigen und unabhängigen Variablen
Unabhängiges Merkmal vorhanden- abhängiges Merkmal vorhanden
unabhängiges Merkmal vorhanden - abhängiges Merkmal nicht vorhanden
unabhängiges Merkmal nicht vorhanden - abhängiges Merkmal vorhanden
unabhängiges Merkmal nicht vorhanden - abhängiges Merkmal nicht vorhanden
2x2 Tabelle
bietet eine geordnete Darstellung von vier Werten (zwei Merkmale/ Ausprägungen je Variable)
Felder einer Kreuztabelle werden mit Zahlenpaaren versehen
zuerst wird das unabhängige Merkmal und dann das abhängige Merkmal benannt
Skript S 75
Randhäufigkeit
Häufigkeit einer Ausprägung eines Merkmals in Bezug auf die gesamte Messung
zur Berechnung weiterer Maßzahlen da
geben an wie oft eine bestimmte Ausprägung eines Merkmals in der Gesamtheit der Messungen vorhanden ist
ausserdem gut Gesamtzahl der Messungen ebenfalls in einer erweiterten Kreuztabelle zu notieren
Skript S. 76
Chi Quadrat Test
einer von vielen Signifikanztests für Häufigkeitstabellen
nutzen Chi Quadrat Verteilung als Prüfgröße
es gibt ein oder zweidimensionale Chri Quadrat tests
bei zweidimensionalen Tests werden zwei nominalskalierte Merkmale gleichzeitig untersucht
Prinzip bei allen- beobachtete Häufigkeiten mit den (gemäß den Hypothesen) erwarteten Häufigkeiten zu vergleichen
Aus Abweihcungen Prüfgröße Chi Quadrat berechnet deren Wert an er Chi Quadrat Verteilung auf Signifikanz getetset wird
bedeutet prüfung ob Unterschiede zwischen Beobachteten (gemessenen) Werten und den erwartenten werten noch auf Zufall beruhen
(Messfehler, Verzerrungen)
oder ob Unterschied so große ist dass es nicht mehr ein zufälliges Ergebnis ist
inhalt muss vom Forscher interpretiert werden - heisst plausible Begründung für den Unterschied finden
Korrelationsanalysen
Messung von wechelseitigen Zusammenhängen
geben Auskunft über - Art und Grad des Zusammenhangs
zwei Variablen (A/B) gibt es 3 Möglichkeiten einer Kausalbeziehung
Ursaceh Wirkung Zusammenhang:
A bewirkt B
B bewirkt A
A und B werden durch C bewirkt
Korrelationskoeffizient r
stärke der Beziehung zwischen den Variablen (Produkt - Moment Korrelation)
kann alle Werte zwischen -1 und +1 annehmen
verschiedene Korrelationskoeffizienten
Korrelationskoeffizient nach Pearson - normalverteilte Daten- linearer Zusammenhang zwischen beiden Variablen
Korrelation nach Spearman- nicht normalverteilt- nicht linear- dafür Ränge
Korrelationskoeffizienten Kendalls Tau- ist ein Rangkorrelationskoeffizient - sehr vielseitig
alle Wertepaare können untereinander verglichen werden
er kann auf beliebig viele Werte angewendet werden
anstatt quadrierten Rangdifferenzen- wird Fehlordnung der Paare ausgewertet
unempfindlich gegenüber Ausreißern
weiterer Korrelationskoeffizient
häufig in Marktforschung
zb wird ein Produkt eher von verheiratetetn verwenden oder von nicht v.
in Studie überprüft das es tatsächlcih so ist
Zusammenhang ist aber nicht über den Status der Ehe sonsdern über das Alter der Verbraucher berücksichtigt worden
dann kommt partielle Korrelation (Parzialkorrelation) ins Spiel
Korrelation 2er Variablen
Einfluss weiterer Variablen wird herausgerechnet (herausparialisiert)
partielle Korrelaiton
Wert für Stärke des Zusammenhangs von zwei Variablen unter Herausberechnen einer dritten Variablen
6.4 Inferenzstatistik 1 : Einführung
Normalverteilung
Basis aller Überlegungen in der Inferenzstatistik
Abbildung Skript S 78
Kontinuirliche W. sind stetig , lassen beliebig genaue Berechnung des abgetragenen Kennwerts zu
auf X Achse stehen unenedlich viele Zahlen
kont. W haben Eigenschaft das Werte auf der x Achse unendlich nah beisammen liegen
dadurch Glockenförmige, unimodale, eingipflige Verteilung, die symmetrisch ist und nähert sich der X Achse asymptopisch
alle 3 Mittelwerte sind identisch
abbildung S 79
ist durch arithmetisches Mittel mü und ihre Streuung Sigma eindeutig gekennzeichnet
sind Erwartungswerte in der Grundgesamtheit
währen aritmetische Mittel identisch sind mit Modalwert
erkennt man Streuung im Abstand der Wendepunkte mit Mittelwert
gleicher Mittelwert , gleiche Streuung - zwei Normalvertelungen identisch
Flächen die unter Verteilungen liegen stellen Wahrsch. dar
W ist dann 1 für die Gesamtfläche
Standardnormalverteilung
Normalverteilung mit dem Mittelwert müh = 0
Streuung Sigma = 1
jede Normalv. kann durch z Transformation in Standardnormalverteilung umgewandelt werden
Eigenschaften Standardn. v
der Modus liegt bei 0
die Wendepunkte liegen bei -1 und +1
die Streuung Sigma beträgt 1
damit können Z werte als Standardabweichungseinheiten vom Mittelwert interpretiert werden
deswegen auf x Achse abgetragen
bedeutet das z wert von 2,5 genau 2,5 Stand. abw. vom Mittelwert entfernt liegt
gleiche Prozentuale Annahmen wie bei Normalverteilung
Stichprobenkennwerte
Mittelwertverteilungen aller (unendlich vieler) Stichprobenmittelwerte
Mittelwert dieser verteilung nennt man Erwartungswert
erwartungstreuer Schätzer des Populationsparameters
Standardfehler des Mittelwerts
Streuung der Stichprobenkennwerteverteilung
Genauigkeit der Schätzung beurteilen
Größe des St. F der Stichprobenkenn… hängt von der Streuung der Messwerte in der Population ab (je größer Streuung desto größer Standardfehler)
ausserdem ist St. F abhängig von Stichprobengröße (je größer Stichprobe desto genauer Schätzung)
Mit einer W von 68,26% liegt wahre Populationswert zwischen plus minus einem Standardfehler
nennt man Vertrauensintervall oder Konfidenzintervall des Mittelwerts
meist 95 oder 99%
auf beiden Seiten jeweils 2,5% und 0,5% abgeschnitten
Vertrauens - Konfidenzintervall
Maß der Genauigkeit mit der der wahre Wert aus der Population mit dem Stichprobenkennwert geschätzt wird
für ein 95% Konfidenzintervall z = 1,96
für ein 99% Konfidenzintervall z = 2,58
Regressionsanalyse
vorhersage einer bestimmten Variable in Abhängigkeit von anderen Variablen
häufig eingesetzt, erklärt Zusammenhänge zwischen abhängigen und unabhängigen Variablen
bietet Möglichkeit unbekannte Werte der abhängigen V zu schätzen - nennt man Prognose
setzt metrisches Skalenniveau für alle Variablen (abhängig, unabhängig) voraus
3 Arten von Fragestellungen
Zeitreihenanalysen: Wie verändert sich die abhängige V im Zeitverlauf (auch zukünfig)
Wirkungsprognosen: Wie verändert sich die abhängige V wenn sich die unabhängige V ändert
Ursachenanalyse: Wie stark ist der Einfluss der unabhänigen auf die abhängie V
man geht von eindeutiger Richtung der Zusammenhänge aus
Regressand und Regressor
alternative Bezeichungen für abhängige und unabhängige Variable einer Regression
abhänige V - Regressand
unabhänige V - Regressor
Ziel Regressionsanalyse - Regressionsgleichung zu berechnen bzw schätzen
B = f(A)
B ist abhängige und A unabhängige
B verändert sich in Abhängigkeit einer Funktion von A -F (A)
Regressionsgerade
Die Gerade durch die Datenpunkte bei der die Abstände von den Datenpunkten zur Gerade nimimal sind
Residuum
Abstand des Datenpunktes zur Regression
Verfahren kleinster Quadrate
perfekte Gerade - Astände aller Punkte zur Geraden sind am geringsten
es erfolgt eine quadrierung, summierung, Minimierung der Risiduen aller Datenpunkte
größere Abstände werden stärker gewichtet
postitive und negative Abstände heben sich nicht auf
Bestimmtheitsmaß R hoch 2
gibt an wie gut das Modell durch die Regressionsgerade erklärt wird
Wertebereich geht von 0 bis +1
R hoch 2 ist Verhältnis zwischen erklärter Varianz zur Gesamtvarianz
0 bedeutet das keine Varianz der Daten durch das Modell erklärt werden
1 gesamte Varianz kann erklärt werden
wert von 0,65 - 65% der Gesamtvarianz können erklärt werden
Signifikanzprüfung
Überprüfung inwiefern sich das Ergebnis auf Grundgesamtheit übertragen lässt
findet mit F - Wert und F Verteilung statt
6.5 Inferenzstatistik 2: Hypothesentests
Hypothesen aufstellen
7 Schritte:
Signifikanzniveau festlegen (alpha) meist 5%
Daten sammeln (Befragung, Experiment)
Prüfgröße berechnen (Teststatisitk)- standadisierte Form des Mittelwerts
Verteilung der Prüfgröße
Kritischen Wert oder p Wert berechnen
Testentscheidung treffen (liegt Prüfgröße innerhalb oder ausserhalb der Schranken)
liegt Prüfgröße ausserhalb der Schranke dann H1 annehmen
beim p Wert- p Wert und alpha anschauen- liegt p Wert über alpha dann H0 beibehalten
ist p Wert kleiner als alpha- H1 annehmen
Fehlerarten
Fehler 1 Art (alpha)
Alternativhypothese annehmen obwohl sie falsch ist
Fehler 2 Art (beta Fehler)
Nullhypothese annehmen obwohl sie falsch ist
Zusammengang:
Vergrößert man Fehler 1 Art - verkleinert sich Fehler 2 Art und umgekehrt
Prüfgröße
ist der Kennwert aus den erhobenen Daten
zur Durchführung eines Signifikanztests
für spätere Testentscheidung wichitg
Prüfgröße ist standadisiert damit egal ist….
wie groß die Stichprobe ist
welcher Mittelwert als Nullh. festgelegt wird
welche Streuung die Daten aufweist
t Verteilung
Grundlage für t Test
Verteilung ist einfach
zb Normalverteilung Mitelwert 0 Standardabw. 1 (Standardnormalverteilung)
deswegen standadisieren- damit kommt sie in Verteilung die einem bekannt ist und deren Werte vorliegen
stetige symmetrische Verteilung
Daten streuen breiter um Mittelwert (Standardabw. ist größer)
wenn Varianz bzw Standardabw. unbekannt
Grundgesamtheit muss normalverteilt sein
Stichprobenumpfang muss größer gleich 30 sein
steigender Stichprobenumpfang- nähert sich t verteilung immer mehr an
bei großen Stichprobenumfang kann Normalverteilung herangezogen werrden
Freiheitsgrade
Anzahl der WErte die frei varriert werden können
ohne statistischen Parameter zu verändern
Anzahl Freiheitsgrade zb 20-1= 19
6 Schritt
kritische Schranke
Wert der maximal mit Wahrsch. von alpha überschritten wird
trifft das zu wird H1 bestätigt
unterschiedliche Tests
gerichtete H - einseitige Tests ( nur ein Wert für die Schranke , dann schauen ob Prüfgröße über oder unter dem Wert liegt)
ungerichtete H- zweiseitige Tests ( 2 Schranken, eine links eine rechts, liegt Prüfgröße innerhalb der 2 Schranken oder ausserhalb)
ausserdem kann auch p Wert berechnet werden
sagt asu wie wahrsch. es ist das H1 zutrifft
6.6 Untersuchungsergebnisse darstellen
7 Grundsätze bei der Darstellung von Grafiken
Verständnis der Daten
Kentniss über die Zielgruppe
Eindeutige Botschaft (Botschaft formulieren, mit dieser die Daten ausgedrückt werden
Reduktion der Daten (nur für Zielgruppe relevante Daten) - weniger ist mehr
Daten mit historischen Daten (Vorjahreswerte) oder Benchmarks (Vergleiche - andere Branchen)
Auswahl der Darstellung (bestmögliche Präsentation)
Einfache, klare und genaue Darstellung (auf das wichtige konzentrieren)
Möglichkeit zur Antwort (Rückmeldung motivieren)
Ebemann 2018
am besten Kreisdiagramme
Anteile lassen sich übersichtlich darstellen
nur für kategorielle Daten
alle Anteile müssen 100 % ergeben
nicht sinnvoll Kreisdiagramm bei Mehrfachantworten einszusetzen
Kategorien sollten nicht zu klein sein
Liniendiagramm
Veranschaulichung von Enwicklungen oder Zeitverläufen
2 versch. Gruppen können über einen Zeitraum verglichen werden
für direkten Vergleich Balkendiagramm gut
Histogramm
Daten auf x Achse nach Größe sortiert
auf y Achse Häufigkeiten abgetragen
über jeder Klasse rechteck (Fläche proportional zur klassenspezifischen Häufigkeit)
für Veranschaulichung von Verteilungen
Streudiagramm
Zusammenhang zweier Variablen
eine Variable auf x Achse
eine Variable auf y Achse
auch zur Darstellung der Regression und der Korrelation
in der Praxis
durchsetzung der Dashboards
alles auf einem Blick
klar und strukturiert
Daten werden aus versch. Quellen zusammen geführt
intuitive Bedienung
Dashboard mitllerweile für jedermann
fast jede Sofwear bietet - Übersicht der wichtigsten Kennwerte und Aussagen
Diagramme hauptteil eines Dashboards
dezentes einheitliches Design
Integration von Benchmarks
Zuletzt geändertvor 8 Monaten