Univariate Analyse
nur eine Variable wird analysiert
auch eindimnsionale Datenanalyse
Skalenniveau entschiedet darüber, welche statistische Anlayse
Bivariante Analyse
zwei untersuchte Merkmale
z.B. mögliche Beziehung zwischen dem Geschlecht und der Zufriedenheit mit dem Pflegepersonal
diskrete Merkmale
kann nur eine “abzählbare” Menge von Auspärgungen annhemen
abzählbar= nicht endlich
stetige Merkmale
Merkmal bei dem mehr als abzählbar unendliche viele mögliche Auspärgungen vorkommen können
Rohdaten /Urliste
Ausgnagsdaten, welche mna bezüglich eines Merkmals X zur Verfügung hat
beeinhaltet die gesammleten Daten eines Merkmals
Häufigkeitstabelle
fasst die gesammelten Daten eines Merkmals komprimiert zusammen
welche Merkmalsausprägung ein Merkmal annehmen kann
wie häufig diese in einer Stichprobe vorkommen
welche Anteile diese an der Gesamtzahl aller Merkmalsträger in der Stichprobe ausmachen
werden erstellt um die absoluten Häufigkeiten und die relativen Häufigkeit der Ausprägungen der Merkmale/Variablen darzustellen.
Absolute Häufigkeit
Werte, die angeben, wie oft die jeweiligen Auspärungen einer Variable vorkommen.
—> zählen das Vorkommen der einzelnen Merkmalsausprägungen ab
man zählt aus der Urliste ab, wie viele Merkmalsträger die einzelnen Merkmalsausprägungen annehmen
Relarive Häufigkeit
gibt an, wie häufig die jeweiligen Ausprägungen in Bezug zu allen Fällen vorkommen
—> Anteile der einzelnen Merkmalsausprägungen
man setzt die einzelnen Häufigkeiten in Bezug zur Gesamtanzahl an Merkmalssträgern in der Stichprobe
können ausschließlich Werte zwischen 0 und 1 annehmen
Die Summer aller relativen Häufigkeiten muss immer 1 ergeben
kumulierte Häufigkeiten
ab ordinalsklaierten Merkmalen
summiert die realtiven Häufigkeiten auf
gibt an, bei welcher Anzahl der Merkmalsträger in einer empirischen Untersuchung die Merkmalsausprägung kleiner ist als eine bestimmte Schranke
unterschiede bei stetigen kardinalskalierten und diskreten kardinalsklaierten Merkmalen
bei stetigen werden Klassen von Merkmalsausprägungen gebildetn (* steht für Klassengrenze)
Das bedeutet, dass die absoluten Häufigkeiten jetzt die Anzahl an Personen zusammenfassen, die in dieses Intervall einzuordnen sind. Dementsprechend gibt die relative Häufigkeit den Anteil derjenigen an, die diesem Intervall zugehörig sind. Die kumulierte Häufigkeit fasst den Anteil an Personen zusammen, die im Höchstfall den Wert der Obergrenze annehmen.
Grafische Darstellung bei normalsklaierten Merkmalen
Kreisdiagramm
Merkmalsausprägungen erhalten bestimmte Flächen im Kreis
Balkendiagram
auch Säulen-/Stabdiagramm
Koordinatensystem: x-Achse die Merkmalsausprägungen; y-Achse die relativen Häufigkeiten
Paretodiagramm
Spezialform des Balkendiagramms
ordnet die Balken im Diagramm nach der Hähe
Grafische Darstellung bei ordinalskalierten Merkmalen
Balkendiagramm
grafische Darstellung bei kardinalskalierten dirkreten Merkmalen
Grafische Darstellung bei kardinalsklaierten stetigen Merkmalen
Histogramm
nur für stetige Merkmale
x-Achse Klassengrenzen; y-Achse Dichte (setzen die relativen Häufigkeiten ins Verhälttnis zu Breite einer Klasse)
Lagemaße
auch Lageparameter
beschreibt man, das Zentrum eines Datensatzes
z.B. Mittelwert, Median, Quantile
Lageparameter und ihre Einsatzmöglichkeiten
Modus:
nominal
ordinal
kardinal (diskret/stetig)
Quantile:
Ordinal
Kardinal (diskret/stetig)
Mittelwert:
Modus
auch Modalwert genannt
die Merkmalsauspärgung eines Merkmals, die am häufigsten in der Stichprobe vorkommt
—> häufigste Ausprägung
xmod (mathemathische Abkürzung)
unimodale Verteilung: es gibt nur ein Modus
bimodale Verteilung: es gibt zwei Modi
multimodale Verteilung: mehr als zwei Modi
Modus bei normalskaliertem Merkmal
Ablesbar in:
Häufigkeitstabelle:
Zeile, in der die größte absolute/ relative Häufigkeit vorherrscht
Kreisdiagramm:
Ausprägung mit der größten Fläche im Kreis
Balkendiagramm:
Ausprägung mit dem größten Balken
Modus bei kardinalsklaierte stetigen Merkmal
Modus anhand der Dichte bestimmtbar
Klasse, welche die größte Dichte aufweist
Modusangabe in Form von Zahlen: dann Mittder der Klasse als Modus angeben
Quantil
eine Merkmalsausprägung, welche von einem besimmten Anteil an Merkmalsträgern nicht überschritten wird
sorgen mit dem Median für vier gleich grpße bereich im geordneten Datensatz
Drei wichtige Quantile:
Median x0,5: liegt genau in der Mitte des geordneten Datensatzes
unteres Quantil x0,25: Ausprägung, die von 25% der Merkmalsträger nicht überschritten wird
oberes Quantil x0,75: Ausprägung, die von 75% der Merkmalsträger nicht überschritten wird
Mittelwert
auch Durschnittswert oder arithmetisches Mittel
x quer
gibt an, welche Merkmalsausprägung im Durschnitt von den Merkmalsträgern angenommen wird
Ausreißer
Messwert, der nicht in eine erwartete Messreihe passt oder allgemein nicht den Erwartungen entspricht
Mittelwert ist ausreißerempfindlich
Symmetrische/Asymmetrische Verteilung
Symmetrisch:
wenn Mittelwert und Median ungefähr gleich groß sind
grafisch: vom höchsten Balken gleichmäßiger Abfall
x quer = x0.5
Assymetrisch/schief:
Rechtschiefe Verteilung: Mittelwert größer als der Median (grafisch: Abnhemen nach rechts hin)
Linksschiefe Verteilung: Mittelwert kleiner als der Median (Grafisch: Abnehmen nach links hin)
Zweigipflige Verteilung: keine direkte Einordnung in die Kategorien
Streuungsmaße
herausfinden, ob sich die befragten Merkmalsträger hinsichtlich einer Variablen sehr ähnlich sind oder sie sich sehr stark voneinander unterscheiden
nur für kardinalsklaierte Merkmale
Stichprobenvarianz, Spannweite, Interquartilsabstand, Stichprobenvarainz und Standardabweichung
Spannweite
zeigt den Abstand von der kleinsten zur größten Ausprägung
also von der größten Ausprägung x (n) die kleinste Ausprägung abziehen x(1)
Nachteil: von extremen Beobachtungen beeinflusst
Interquartilsabstand
IQR= x0,75 - x0,25
zeigt den Abstand der zentralen 50% an Merkmalsträgern
Strichprobenvarainz und Standardabweichung
s^2
ist erfoderlich um die Standardabweichung erhalten zu können
Berechnung: Von jeder Beobachtung xi wird der Mittelwert x quer abgezogen. Die Differenz wird quadriert und aufsummiert. Durch n - 1 geteilt
nicht interpretierbar daher wird die Standardabweichung gezogen
Standardabweichung s
involvieren jede Beobachtung in die Berechnung
überprüfen, in wie weit jede einzelne Beobachtung vom Mittelwert entfernt ist
Zuletzt geändertvor 6 Monaten