1.2 Grundbegriffe der Statistik
Merkmalsträger
interessierende Person oder Objekt über welches man Aussagen gewinnen möchte
zb Krankenhäuser, aber auch Einzelpersonen, Unternehmen, Gegenstände
jeder über den man Erkentnisse gewinnen möchte
Grundgesamtheit
Umfasst alle Merkmalsträger
zu Beginn einer Studie, wichtig Gesamtheit aller Merkm. tr. zu kennen
Stichprobe
umfasst alle tatsächlich untersuchten Merkmalsträger
die Merkmalsträger die tatsächlich untersucht werden
je größer die Stichprobe umso präzisere Aussagen können getroffen weren
räprentative zusammenstellung aller Merkmalsträger ist wichtig
Differenzierung von Stichproben:
Einfache Zufallsstichprobe
einfache Zufallsstichprobe bietet beste Grundlage für aussagekräftige Ergebnisse
bildet geeignete Basis für statistische Analysen
mit der kan man Rückschlüsse auf Allgemeinheit ziehen
bei Zufallsstichproben werden unterschiedliche Varianten unterschieden wie zb die einfache
einfache Zufallsstichprobe
Merkmalsträger werden nach Zufallsprinzip ausgewählt
jeder Merkmalsträger hat gleiche Chance ausgewählt zu werden
Grundgesamtheit muss aber bekannt sein
geschichtete Stichprobe
Grundgesamtheit wird nach relevanten Größen in Teilpopulationen aufgeteilt
anschließend aus Teilp. Stichproben gezogen
zb . im Krankenhaus:
bis 500 Patienten, 500-1000, mehr als 1000…
danach werden alle drei Schichten Krankenhäuser nach dem Zufallsprinzip ausgewählt
Klumpenstichprobe
natürlich existierende Teilmengen der Grundgesamtheit werden nach Zufallsprinzip ausgewählt
danach vollständig untersucht
zb alle in Deutschlands Landkreisen bestehenden Krankenhäuser
einige zufällig auswählen
innerhalb der Landkreise werden dann alle Krankenhäuser berücksichtigt
Ad hoc Stichproben
zusätzlich zu Zufallsstichroben gibt es Ad hoc Stichproben
die Merkmalsträger werden ausgewählt welche zum Zeitpunkt der Datenerhebung verfügbar sind
zb bei Befragungen auf offener Straße, wenn meinungsbildung zu aktuellen Themen erfolgen soll
ist aber keine gute Grundlage um allgemeingültige Aussagen treffen zu können
Merkmale und Merkmalausprägungen
viele informationen sind von interesse
zb was für ein typ Krankenhaus (Uniklinik..), wieviele Intensivbetten usw.
das alles sind Merkmale ( Variablen der Krankenhäuser)
die Werte die ein Merkmal annehmen kann sind Merkmalausprägungen
mehr statistische Berechnungen bei Merkmalsausrpägungen mit Zahlen zb anzahl der Intensivbetten
Merkmale
interessierende Eigenschaft eines Merkmalsträgers
Merkmalsausprägungen
ist mögliche Beobachtung eines Merkmals
Skalenniveaus
entscheidet über mögliche statistische Analyse
es gibt 3 verschiedene Skalenniveaus
die 3 Skalenniveaus
schwächste Skala ist die Nominalskala
das sind Merkmale deren Auspräungen Namen oder Kategorien sind
Kategorien lassen sich nicht in eine sinnvolle Reihenfolge bringen
zb Frage danach welche Sationen einem Krankenhaus zugehörig sind ist Nominalskaliert
zb Ausprägungen wie Onkologie, Unfallchirurgie, Orthopädie
das sind Namen oder Kategorien die sich nicht sinnvoll ordnen lassen
spezialfall nominalskalierter Variablen
dichotome Variablen
haben 2 Ausprägungen
zb frage ob städtisches oder ländliches Krankenhaus
oder Tatsache ob das Krankenhaus Uniklinik ist oder nicht
nächst stärkere Skalenniveau ist Ordinalskala
erlaubt mehr statistische Auswertungsmöglichkeiten als Nominalskala
aber weniger als Kardinalskala
Ordinalskalierte Merkmale weisen Ausprägungen auf die Kategorien sind
Kategorien lassen sich in sinvolle Reihenfolge bringen
zb allgemeine zufriedenheit der Patienten mit Krankenhaus
zb sehr gut, gut, mittelmäßig, schlecht und sehr schlecht
sind kategorien welche sich sinvoll sortieren lassen
Abstände lassen sich aber nicht sinvoll interpretieren
zb sehr gut ist doppet so gut wie “gute” Bewertung
Nominal und ordinalskalierte Merkmale oberbegriff:
qualitative Merkmale
Kardinalskala
erlaubt meisten statistischen Auswertungsmöglichkeiten
stärkste Skalenniveau
auch metrische Merkmale genannt
Ausprägungen welche Zahlen sind
Abstände zueinander ebenfalls Zahlen
lassen sich mathematisch sinvoll interpretieren
zb anzhl freier Intensivbetten ( 10 freie betten mehr als im anderen Krankenhaus)
im rahmen der Kardinalskala gibt es 2 weitere Unterteilungen
Verhältnisskala
Intervallskala
weisst einen natürlichen Nullpunkt aus
zb bei Geld da ist klar das 0 euro in jeder währung bedeutet das kein geld auf dem konto ist
zb temperatur in grad celsius oder fahrenheit
0 grad hat nicht gleichen wert wie fahrenheit (es existiert kein nullpunkt)
Temperatur also intervallskaliertes Merkmal weil kein Nullpunkt
weist keinen natürlichen Nullpunkt auf
weitere Unterteilung der Kardinalskala diskretes oder stetiges Merkmal
anzahl an verschiedenen Merkmalausrpägungen
endlich viele oder abzählbare unendlich viele Ausprägungen dann diskretes Merkmal
zb Anzahl an Personen die in einem Haushalt leben
oder anzahl freie intensivbetten
Menge lässt sich immer anzählen
dieskretes Merkmal hat nur wenige verschiednee Ausprägungen
stetiges Merkmal
hat sehr viele verschiedene Ausprägungen
können alle denkbaren werte eines Intervalls annehmen
zb bei der Krankenhaus studie auch noch die Ausgaben jedes Krankenhauses - wären unendlich viele Ausprägungen
Kardinalskalierte Merkmale sind - quantitative Merkmale
1.3 Aublauf statistischer Untersuchungen
Datensammlung
zb in Form von schriftlichen oder mündlichen Befragungen
oder Experimente
das sind dei Primärdaten
bei neuen Daten wie befragungn der Krankenhäuser wären es Primärdaten
bei zurückgreifen auf bereits vorhandene Daten - Sekundärdaten (zb. vom vergangenen Jahr)
Querschnitts und Längsschnittdesign
zb Untersuchung der Krankenhäuser nur zu einem Zeitpunkt oder innerhalb kurzer Zeitspanne (2-4 Wochen) dann - Querschnittsdesign
entwicklung der Krankenhäuser in der Zukunft - Längschnittdesign (umfasst immer wieder die gleichen Daten zu mehreren aufeinander folgenden Zeitpunkten)
Längsschnittdesign weitere unterteilung
Trend und Paneldesign
Trenddesign - regelmäßige untersuchungen bezüglich der Fragestellung ( muss nicht immr das gleiche Krankenhaus sein)
Paneldesign- in einem Abstand von zb halben Jahr werden immer wieder die gleichen Krankenhäuser befragt
Vorteil hierbei Veränderungen sind beobachtbar
zb Auslastung der Intensivbetten über die zeit hinweg
Nachteile Paneldesign
sog. Paneleffekte oder Lerneffekte
immer wieder gleiche Antworten
ausserdem Panelmortalitäten (im Laufe der zeit scheiden evtl krankenhäuser aus)
trotzdem liefern Studien im Paneldesign den höchsten Informationsgehalt
danach folgt das Trenddesign
danach Querschnittsdesign
Datenverarbeitung
alle Daten der Beobachtung oder Befragung gesammelt
dann Datenverarbeitung
gesammelte Daten in Statistiksoftware eingefügt zb (Stata, Exel, SPSS)
anschließend statistisch ausgewertet (hier wird Grundlage für saubere Auswertung geschaffen)
genaue Prüfung ob daten fehlen ist wichtig
Datenanalyse
unterscheidung von 3 großen Bereichen
deskriptive Statistik
inferenz Statistik
explorative Statistik
Deskriptive Statistik
Beschreibung der gesammelten Daten
Tabellen, Grafiken oder Maßzahlen werden genutzt
Ziel Daten komprimitiert zusammenzufassen
zb Maßzahl Mittelwert um Anzahl an belegten Intensivbetten über alle Krankenhäuser zu ermitteln
Inferenz Statistik
überprüft die Übertragbarkeit der deskriptiven Ergebnisse auf die Allgemeinheit
wenn zb nicht alle Krankenhäuser Deutschlands berücksichtigt werden können sondern nur ein Auschnitt von ihnen
dann prüfen ob die deskriptiven Ergbnisse für die ausgewählten Krank…. verallgemeinern lassen
Zu diesem Zweck - Hypothesen formulieren
diese müssen im rahmen der Inferenz st. überprüft werden
zb Hypothese ob Uniklinik größeren Einzugsbereich vorweist als keine Uniklinik
Explorative Statistik
erkundet neue, noch wenig erforschte Bereiche
zb bei Corona Pandemie
sämtliche statistische Analysen waren erstmal exporativer Natur (weil neues unerforschtes Gebiet)
Last changeda year ago