Was ist ein Ereignis in der Wahrscheinlichkeitstheorie?
- Ein Ereignis ist eine Teilmenge des Ergebnisraums eines Zufallsexperiments./Beispiel: Beim Würfeln ist „eine 6“ ein Ereignis im Raum {1,…,6}.
Was ist eine Zufallsvariable?
- Eine Funktion, die jedem möglichen Ergebnis eines Zufallsexperiments eine Zahl zuordnet./z. B. Augenzahl → 1 bis 6.
Was ist eine Wahrscheinlichkeitsverteilung?
- Beschreibt, wie Wahrscheinlichkeiten über mögliche Werte einer Zufallsvariablen verteilt sind./Kann diskret oder kontinuierlich sein.
Was ist eine Wahrscheinlichkeitsdichtefunktion (PDF)?
- Funktion f(x), deren Fläche unter der Kurve = 1 ist → beschreibt Dichte kontinuierlicher Zufallsvariablen./P(X ∈ [a,b]) = ∫ₐᵇ f(x) dx.
Was ist eine Verteilungsfunktion (CDF)?
- Gibt Wahrscheinlichkeit an, dass Zufallsvariable ≤ x ist./F(x) = P(X ≤ x) = ∫₋∞ˣ f(t) dt.
Was ist der Unterschied zwischen diskreter und kontinuierlicher Verteilung?
- Diskret: Wahrscheinlichkeiten für einzelne Werte (z. B. Binomial)./Kontinuierlich: Wahrscheinlichkeiten über Intervalle (z. B. Normalverteilung).
Was ist der Erwartungswert (E[X])?
- Durchschnittlicher theoretischer Wert einer Zufallsvariablen./Für diskret: Σ x · P(x)
Was ist die Varianz (Var[X])?
- Erwarteter quadratischer Abstand vom Mittelwert (E[(X − μ)²])./Misst die Streuung der Werte.
Was ist der zentrale Grenzwertsatz?
- Besagt, dass die Summe vieler unabhängiger Zufallsvariablen annähernd normalverteilt ist – egal welche Einzelverteilung.
Was ist der Unterschied zwischen parametrischer und nichtparametrischer Schätzung?
- Parametrisch: Form der Verteilung bekannt (z. B. Normalverteilung, nur Parameter geschätzt)./Nichtparametrisch: keine Annahme über Form – Dichte aus Daten geschätzt.
Was ist Dichteschätzung?
- Verfahren zur Annäherung der Wahrscheinlichkeitsdichte einer zufälligen Variablen aus Beobachtungsdaten./z. B. Histogramm, Kernel-Methoden.
Was ist ein Histogramm?
- Schätzt Dichte durch Zählen von Beobachtungen in Intervallen (Bins)./Höhe jedes Balkens ≈ Häufigkeit pro Intervall ÷ Breite.
Was ist ein Nachteil des Histogramms?
- Abhängig von Wahl von Startpunkt und Intervallbreite → unglatter Verlauf und diskontinuierliche Dichte.
Was ist eine naive Schätzung der Dichte?
- Jeder Datenpunkt wird als gleichmäßiges Intervall um seinen Wert verteilt./Einfache Glättung, führt aber zu Sprungstellen an Intervallrändern.
Was ist eine Kernel-Dichteschätzung?
- Schätzt die Dichte, indem über jeden Datenpunkt eine glatte Kernfunktion gelegt und aufsummiert wird./Ergebnis = glatte Dichtekurve.
Was ist eine Kernfunktion (Kernel)?
- Symmetrische Funktion mit Fläche 1 (z. B. Gauß-, Epanechnikov-, Uniform-Kernel)./Bestimmt Form der Glättung.
Was ist die Bandbreite (h)?
- Parameter, der die Glättung steuert – klein → rauschige Kurve, groß → überglättet./Kritisch für Qualität der Schätzung.
Was ist der Bias-Varianz-Tradeoff?
- Kleine Bandbreite → geringer Bias, hohe Varianz
Was ist die Idee des Nächster-Nachbar-Schätzers?
- Variable Fensterbreite – passt sich lokaler Datendichte an./Dichte = Anteil der Nachbarn im Umkreis k.
Was ist ein variabler Kernel-Schätzer?
- Kombination aus Kernel- und Nachbaransatz: Bandbreite ändert sich mit Dichte der Datenpunkte.
Was ist eine parametrische Dichteschätzung?
- Angenommene Verteilung (z. B. Normal) wird an Daten angepasst durch Parameter μ und σ.
Was ist eine nichtparametrische Dichteschätzung?
- Keine Verteilungsannahme – Dichte wird direkt aus den Beobachtungen geschätzt.
Was ist eine kumulative Dichtefunktion (CDF)?
- Summierte Dichte bis zu x – zeigt, wie viel Wahrscheinlichkeit bis P(X ≤ x) enthalten ist.
Was bedeutet „glatt“ in der Dichteschätzung?
- Keine Sprungstellen – Übergänge zwischen Werten sind kontinuierlich und differenzierbar.
Was ist das Ziel der Dichteschätzung?
- Unbekannte Wahrscheinlichkeitsverteilung aus Stichprobendaten rekonstruieren – zur Modellierung, Visualisierung oder Simulation.
Was ist eine multivariate Dichteschätzung?
- Erweiterung auf mehrdimensionale Variablen (z. B. f(x,y))
Was ist der Unterschied zwischen PDF und Histogramm?
- PDF = theoretische Dichtefunktion
Was bedeutet Normalisierung der Dichte?
- Sicherstellen, dass ∫ f(x) dx = 1 → Gesamtwahrscheinlichkeit = 100 %.
Was ist eine Glättungsfunktion?
- Kernel = Glättungsfunktion, die lokale Gewichtung um jeden Datenpunkt bestimmt.
Was ist die Herausforderung der Bandbreitenauswahl?
- Falsche Bandbreite führt zu Unter- oder Überanpassung der Dichte./Methoden: Rule of Thumb, Cross-Validation.
Was ist die Idee der Cross-Validation in der Dichteschätzung?
- Wählt Bandbreite h, die Vorhersagefehler minimiert (z. B. Leave-One-Out-CV).
Was ist eine Schätzung hoher Ordnung?
- Verwendung von Kernen mit mehr Glattheit oder Polynomen höherer Ordnung zur Reduktion des Bias.
Was ist eine adaptive Dichteschätzung?
- Lokale Bandbreite abhängig von Datenkonzentration – feine Details in dichten Bereichen, mehr Glättung in dünnen.
Was ist der Unterschied zwischen 1D- und 2D-Dichteschätzung?
- 1D → Kurve über x
Was ist die Intuition hinter Kernel-Schätzern?
- Jeder Datenpunkt „strahlt“ lokale Wahrscheinlichkeit aus – Summe aller Strahlungen ≈ wahre Dichte.
Wann verwendet man parametrische Dichteschätzung?
- Wenn man eine bekannte Verteilungsform annehmen kann (z. B. Normalverteilung)./Nur die Parameter (z. B. μ, σ) müssen geschätzt werden.
Wann verwendet man nichtparametrische Dichteschätzung?
- Wenn keine Form der Verteilung bekannt ist./Die Dichte wird direkt aus den Daten geschätzt (z. B. Kernel-Schätzung).
Wann ist ein Histogramm sinnvoll?
- Wenn man eine einfache, schnelle Übersicht über die Verteilung braucht./Gut für kleine Datensätze oder zur ersten Exploration.
Wann ist ein Histogramm ungeeignet?
- Wenn man eine glatte oder genaue Dichteschätzung benötigt./Abhängig von Startpunkt und Intervallbreite → unstetige Form.
Wann verwendet man eine Kernel-Dichteschätzung statt eines Histogramms?
- Wenn man eine glatte, kontinuierliche Annäherung der wahren Dichte will./Weniger abhängig von Startpunkten, visuell interpretierbarer.
Wann ist die Wahl der Bandbreite h besonders kritisch?
- Immer bei Kernel-Schätzern → zu klein: überanpassung (rauschig)
Wann nutzt man variable Kernel-Schätzer?
- Wenn Daten ungleich verteilt sind./Erlaubt kleine Bandbreite in dichten Regionen und große in dünn besetzten Bereichen.
Wann ist ein Nächster-Nachbar-Schätzer sinnvoll?
- Wenn man lokale Dichten anpassen möchte, ohne konstante Fensterbreite./Gut bei ungleichmäßig verteilter Dichte.
Wann ist eine adaptive Schätzung besser als eine fixe Bandbreite?
- Wenn Dichte starke lokale Unterschiede aufweist (z. B. mehrere Peaks)./Adaptive h passt sich automatisch an Datenkonzentration an.
Wann ist parametrische Schätzung besser als nichtparametrische?
- Wenn Form der Verteilung bekannt oder theoretisch begründet ist (z. B. Messfehler → Normalverteilung)./Effizienter, braucht weniger Daten.
Wann ist nichtparametrische Schätzung vorzuziehen?
- Wenn keine Annahme über Verteilung möglich oder Daten stark asymmetrisch sind./Flexibler, aber empfindlicher gegenüber Rauschen.
Wann verwendet man eine multivariate Dichteschätzung?
- Wenn man gemeinsame Dichte zweier oder mehrerer Variablen modellieren will./z. B. Positions- und Geschwindigkeitsdaten in 2D.
Wann ist Bias wichtiger als Varianz?
- Bei übermäßig geglätteten Schätzern → glatte, aber verschobene Dichte./Bei kleiner h überwiegt Varianz (hohes Rauschen).
Wann nutzt man Cross-Validation in der Dichteschätzung?
- Um optimale Bandbreite h zu finden, die MSE minimiert./Testet Vorhersagequalität auf ausgelassenen Punkten.
Wann ist die „Rule of Thumb“ für h ausreichend?
- Für unimodale, annähernd normalverteilte Daten./Für komplexe oder multimodale Dichten ungeeignet.
Wann sollte man Entropie berechnen?
- Wenn man Informationsgehalt oder Unbestimmtheit einer Verteilung vergleichen möchte./z. B. zur Bewertung der Modellunsicherheit.
Wann wird eine Dichteschätzung praktisch eingesetzt?
- In Datenanalyse, Klassifikation, Signalverarbeitung oder Bioinformatik./Beispiel: Schätzung der Genexpressionsverteilung.
Wann kann eine Kernel-Schätzung fehlschlagen?
- Bei zu wenigen Daten oder unpassender Bandbreite → verzerrte oder oszillierende Dichte.
Wann ist eine log-transformierte Dichteschätzung sinnvoll?
- Wenn Daten stark rechts-schief sind (z. B. Einkommen, Wartezeiten)./Transformiert zu symmetrischerer Verteilung.
Wann ist die Annahme der Normalverteilung problematisch?
- Wenn Daten Ausreißer, Schiefe oder Mehrgipfeligkeit zeigen./Dann ist parametrische Normalanpassung ungeeignet.
Wann sollte man eine zweidimensionale Dichteschätzung nutzen?
- Wenn man Verteilungen zweier abhängiger Variablen untersuchen will./z. B. Kernel-Dichtekarte (Heatmap).
Wann verwendet man Histogramm und Dichtekurve gemeinsam?
- Wenn man visuell die empirische (Histogramm) und geschätzte theoretische (Dichte) Verteilung vergleichen möchte.
Wann verwendet man den Bias-Varianz-Tradeoff in der Praxis?
- Bei der Wahl der Bandbreite h → Balance zwischen Glättung und Detailgenauigkeit.
Wann ist eine Kernel-Schätzung robuster als Histogramme?
- Bei größeren Stichproben → weniger abhängig von Bins und glattere Ergebnisse.
Wann ist eine parametrische Schätzung robuster als nichtparametrische?
- Wenn theoretische Modellannahme stimmt → geringere Varianz, stabilere Schätzung.
Wann sind nichtparametrische Methoden rechenintensiver?
- Da jede Beobachtung in die Dichteschätzung eingeht (Summation über n Punkte)./O(n²)-Komplexität für naive Implementierungen.
Wann sollte man Kernel-Schätzer nicht verwenden?
- Bei sehr kleinen Stichproben oder diskreten Daten → unzuverlässige Glättung.
Wann ist eine Gleichverteilung realistisch?
- Wenn alle Ergebnisse gleich wahrscheinlich sind (z. B. fairer Würfel)./Dichte = konstant.
Wann ist eine Exponentialverteilung sinnvoll?
- Für Wartezeiten zwischen zufälligen Ereignissen (z. B. Ankunftszeiten, Zerfall).
Wann ist eine Poisson-Verteilung sinnvoll?
- Für Zählungen unabhängiger Ereignisse pro Zeitintervall (z. B. Anzahl Mutationen, Anrufe pro Stunde).
Wann ist eine Normalverteilung gerechtfertigt?
- Wenn viele unabhängige Zufallseinflüsse einwirken → durch zentralen Grenzwertsatz.
Last changed2 months ago