Wie ist das statische Vorgehen?
T
F
H
D -> HT
S
Was ist das Grudprinziüp von Hypothesen?
1 F N
2 S SN
3 P R
4 W P TV
5 N d PW
Unterschied unabhängig und abhängige Stichprobe
Bei unabhängigen Stichproben gibt es keine Verbindung zwischen den untersuchten Gruppen oder Stichproben. Jede Stichprobe ist unabhängig von der anderen und es gibt keine Überschneidungen oder Korrelationen zwischen den Gruppen.
Abhängige Stichproben, auch gepaarte oder gekoppelte Stichproben genannt, beziehen sich auf Gruppen, bei denen eine Verbindung oder Korrelation besteht. Diese Verbindung kann durch eine vorgegebene Paarung oder eine gemeinsame Quelle entstehen.
Was ist der p-Wert?
Klar, der p-Wert ist eine Zahl, die uns hilft zu entscheiden, ob ein Ergebnis in einer wissenschaftlichen Studie wahrscheinlich oder unwahrscheinlich ist. Er zeigt, wie wahrscheinlich es ist, dass das beobachtete Ergebnis oder ein ähnliches Ergebnis zufällig zustande kommt.
Kleinere p-Werte (wie 0,05 oder kleiner) bedeuten, dass es unwahrscheinlich ist, dass das Ergebnis durch Zufall erklärt werden kann. Das weist darauf hin, dass es etwas Interessantes oder Neues gibt.
Größere p-Werte bedeuten, dass das Ergebnis wahrscheinlich zufällig ist oder wir nicht genug Beweise haben, um etwas Neues zu bestätigen.
Also, wenn der p-Wert klein ist, denken wir vielleicht: "Wow, das ist interessant, hier ist wahrscheinlich etwas los." Wenn er groß ist, dann könnte man eher sagen: "Das scheint nur Zufall zu sein."
Was ist ein Einstichproben-t-test?
Wird verwendet um zu testen ob sich die Grundgesamheit von einem festgelegte Wert unterscheidet.
Also Gibt es statistisch bedeutsame Unterschiede zwischen einem Stichproben-Mittelwernd und dem festgelegten Wert?
Ziel: Der Test wird verwendet, um zu bestimmen, ob der Mittelwert einer bestimmten Stichprobe von einem vorgegebenen theoretischen Wert oder einem erwarteten Mittelwert (wie einem bekannten Populationsmittelwert) abweicht.
Anwendung: Dieser Test ist nützlich, wenn man eine Stichprobe hat und prüfen möchte, ob der Mittelwert dieser Stichprobe unterschiedlich oder konsistent mit einem bestimmten Wert ist.
Nullhypothese: Die Nullhypothese (H0) beim Einstichproben-t-Test ist, dass der Mittelwert der Stichprobe gleich dem vorgegebenen Wert ist. Die Alternativhypothese (H1) ist, dass der Mittelwert der Stichprobe von diesem Wert abweicht.
Typische Anwendung: Der Einstichproben-t-Test kann in vielen Kontexten verwendet werden, wie z. B.:
Um zu testen, ob der durchschnittliche Testwert einer Klasse sich von einem Standardwert unterscheidet.
Um zu prüfen, ob das durchschnittliche Gewicht eines Produkts von einer erwarteten Norm abweicht.
Berechnung: Der Test berechnet die Differenz zwischen dem Mittelwert der Stichprobe und dem erwarteten Wert, normalisiert durch die Standardabweichung und die Stichprobengröße. Ein daraus resultierender t-Wert wird dann verwendet, um den p-Wert zu berechnen, der angibt, wie wahrscheinlich es ist, dass die Nullhypothese richtig ist.
Interpretation: Ein kleiner p-Wert (typischerweise ≤0,05) deutet darauf hin, dass die Nullhypothese abgelehnt werden kann, was bedeutet, dass der Mittelwert der Stichprobe signifikant von dem erwarteten Wert abweicht.
Angenommen, ein Hersteller gibt an, dass seine Schokoladenriegel im Durchschnitt 50 Gramm wiegen. Ein Kunde möchte prüfen, ob das tatsächlich der Fall ist, und nimmt eine Stichprobe von 30 Riegeln, deren Durchschnittsgewicht 48 Gramm beträgt. Mit dem Einstichproben-t-Test kann der Kunde analysieren, ob dieser Unterschied statistisch signifikant ist oder ob er einfach durch zufällige Schwankungen erklärbar ist.
Insgesamt ist der Einstichproben-t-Test ein leistungsfähiges Instrument, um den Mittelwert einer Stichprobe mit einem bekannten oder erwarteten Wert zu vergleichen und zu entscheiden, ob eine signifikante Abweichung vorliegt.
Was ist ein einseitiger bzw. zweiseitiger T-Test?
Ein zweiseitiger T-Test überprüft auf Abweichungen in beide Richtungen (positiv und negativ) und ist der häufigere Ansatz, wenn man keine spezifische Erwartung an die Richtung des Effekts hat.
Ein einseitiger T-Test überprüft auf Abweichungen in einer spezifischen Richtung und ist geeignet, wenn es eine klare Erwartung oder Hypothese gibt, dass der Effekt nur in eine Richtung auftritt.
Beispiele
E
Hat ein neues Medikament die Blutdruckwerte von Patienten gesenkt?
Z
Sind die Lernleistungen von Schülern, die mit einem neuen Lernprogramm unterrichtet werden, besser als die Lernleistungen von Schülern, die mit einem traditionellen Lernprogramm unterrichtet werden?
Welche Arten von T-Test gibt es?
U
A
Einfacher T-Test
Unterschied von einer Gruppe zur Gesamtheit
Unabhängiger T Test
Unterschied zwischen zwei Gruppen
Abhängiger T-Test
Gibt es einen Unterschied einer Gruppe zwischen zwie Zeitpunkten?
Was sind Einsatzbereiche und Beispiele von T-Tests?
Wofür verwendet man einen Binomial-test?
Ein Binomialtest ist ein statistischer Test, der verwendet wird, um Hypothesen über eine Grundgesamtheit anhand einer Stichprobe mit dichotomen Merkmalen zu testen. Hierbei bedeutet "dichotom", dass das Merkmal nur zwei mögliche Ausprägungen haben kann.
Wofür verwendet man den Chi-test?
Der Chi-Quadrat-Test (χ²-Test) ist eine Gruppe statistischer Hypothesentests, die verwendet werden, um Beziehungen zwischen kategorialen Variablen zu untersuchen. Kategoriale Variablen sind solche, die in eine begrenzte Anzahl von Kategorien unterteilt werden können (z. B. Geschlecht, Augenfarbe, Zufriedenheitsniveau).
Was ist die Varianzanalyse Anova für unabhängige Stichproben?
Die Varianzanalyse (ANOVA), kurz für Analysis of Variance, ist ein statistisches Verfahren, das verwendet wird, um Unterschiede zwischen Mittelwerten mehrerer Gruppen zu untersuchen. Im Gegensatz zum t-Test, der nur den Vergleich von zwei Gruppen erlaubt, kann die ANOVA mit drei oder mehr Gruppen eingesetzt werden.
Was ist das Ziel einer Clusteranalyse?
Das Ziel einer Clusteranalyse ist es, Gruppen (sog. Cluster) mit ähnlichen Merkmalen in Datensätzen zu identifizieren.
Einfach ausgedrückt: Die Clusteranalyse hilft uns, Struktur in Daten zu erkennen, indem sie Objekte mit hoher gegenseitiger Ähnlichkeit gruppiert und so Muster und Zusammenhänge aufdeckt, die dem bloßen Auge verborgen bleiben könnten.
Wie ist das Studenweise vorgehen bei einer Clusteranalyse?
Auswahl
Gruppierung
Auswahl des Proximitätsmaßes
Bei dichotimen Variablen:
Tanimoto-Koeffizient -> 4 Felder Tafel, a/(a+b+c
Bei Metrischen:
Minkowski-Metrik
euklische Metrik
Manhatten Metrik(Taxi
Wie funktioniert K-Means?
Schritt
Anzahl der Cluster festlegen, z.B. Ellenbogenmethode
Cluster Zentroiden zufällig festlegen
Datenpunkte zuordnen durch Manhatten oder euklidischen Methode
Cluster zentroiden aktualisieren
Schritte 3 und 4 werden wiederholt bis die Zentroiden sich nicht mehr verschieden
Wie funktioniert Single Linkage?
Single Linkage ist eine Methode des hierarchischen Clusterings. Hierarchisches Clustering ist ein Verfahren, um Datenpunkte in Gruppen (Cluster) zu organisieren, die einander ähnlich sind. Im Falle von Single Linkage basiert die Ähnlichkeitsberechnung auf dem minimalen Abstand zwischen Datenpunkten aus unterschiedlichen Clustern.
So funktioniert Single Linkage:
Abstandsmatrix: Zu Beginn wird eine Abstandsmatrix berechnet, die die Abstände zwischen allen Datenpunkt-Paaren enthält. Dies kann mit verschiedenen Metriken wie der euklidischen Distanz geschehen.
Initialisierung: Jeder Datenpunkt bildet zunächst einen eigenen Cluster.
Minimaler Abstand finden: Es wird der minimale Abstand in der Abstandsmatrix ermittelt. Dies sind die zwei Datenpunkte (bzw. die Cluster, die diese enthalten), die einander am nächsten liegen.
Cluster verbinden: Die beiden Cluster mit dem minimalen Abstand werden zusammengeführt (kombiniert) zu einem neuen Cluster.
Abstandsmatrix aktualisieren: Die Abstandsmatrix wird aktualisiert, um die Abstände vom neu entstandenen Cluster zu allen anderen bestehenden Clustern zu repräsentieren. Die Distanz zwischen zwei Clustern im Single Linkage-Verfahren ist definiert als die minimale Entfernung zwischen einem Element des einen Clusters und einem Element des anderen Clusters.
Was ist eine Zeitreihe?
Womit befasst sich die zeitreihenanalyse?
Zeitreihen sind geordnete Datensätze, die Werte einer Variable über einen bestimmten Zeitraum hinweg beobachten. Beispiele für Zeitreihen sind Aktienkurse, Temperaturmessungen, Verkaufszahlen oder die Anzahl der Sonnenflecken.
Die Zeitreihenanalyse befasst sich mit der statistischen Analyse von Zeitreihen. Ziel ist es, die zeitliche Abhängigkeit von Daten zu verstehen, Muster und Trends zu erkennen und Vorhersagen für die Zukunft zu treffen.
Was sind:
Univariante Zeitreihenanalyse
Bivariante Zeitreihenanalyse
Multivariante Zeitreihenanalyse?
Uni eine variable
-> Deskriptive harakterieung der Reihen -> Zeitreihe
Wie hat sich der Aktienkurs eines Unternehmens in den letzten Jahren entwickelt?
Bi zwei variablen
Enwicklung eines Zusammenhangsmodells
Wie hängt der Aktienkurs eines Unternehmens vom Ölpreis ab?
Multi mehr als zwei variablen
Analyse dynamischer nteraktionen
Wie hängen verschiedene Aktienkurse, Wechselkurse und Zinsen miteinander zusammen?
Univariate Zeitreihenanalyse: Beschäftigt sich mit einer einzelnen Variablen, z. B. der Entwicklung eines Aktienkurses im Laufe der Zeit.
Multivariate Zeitreihenanalyse: Betrachtet simultan mehrere Variablen, z. B. den Einfluss des Aktienkurses eines Unternehmens auf den Aktienkurs eines anderen Unternehmens sowie weitere Faktoren wie Wechselkurse und wirtschaftliche Indikatoren.
Was ist der unterschied zwischen periodisch, zyklisch, transient und zufällig?
Periodisch:
Wiederholt sich in konstanten Abständen (z.B. Jahreszeiten)
Vorhersagbar
Zyklisch:
Schwankt um einen Trend herum (z.B. Konjunkturzyklen)
Dauer und Amplitude der Schwankungen können variieren
Teilweise vorhersehbar
Transient:
Trend ändert sich im Laufe der Zeit (z.B. technologischer Fortschritt)
Kann zunehmen, abnehmen oder sich umkehren
Schwerer vorherzusagen
Zufällig:
Keinerlei Muster oder Trends erkennbar (z.B. Lotterieergebnisse)
Werte nicht vorhersehbar
Kaum Anwendungsmöglichkeiten für Prognosen
Was ist Autokorrelation im bezug auf Univariante Zeitreihenanalyse?
Die Autokorrelation misst die zeitliche Abhängigkeit der Werte in einer Zeitreihe. Sie vergleicht die Werte einer Zeitreihe mit ihren verzögerten Werten, um festzustellen, ob es eine Korrelation zwischen ihnen gibt.
Was ist mit Glättung von Zeitreihen gemeint?
Kurzfristige Schwankungen bzw rauschen wird eliminiert.
Welche Möglichkeiten gibt es um trends zu eliminieren?
Was sind die Unterschiede von:
T-Test
Chi^2 Test
ANOVA?
Anwendungsbereich - Variablentyp - Annahmen
Zuletzt geändertvor 7 Monaten