Buffl

VL09_ML_2_Resampling

df
by diana F.

Evaluation Prädiktiver Modelle mit Resampling

 Trainings- und Testset

Was soll geschätzt werden?

Geschätzt werden soll der erwartete Vorhersagefehler des auf der gesamten Stichprobe trainierten grünen Modells!

Schätzwert für erwarteten VorhersageFEHLER.


Wir schätzen die Modellparameter andhand der Beobachtungen ins Trainingsset, dann verwenden wir dieses trainierte Modell, um für die Beobachtungen im Testset vorhersagen zu machen und im 3. Schritt vergleichen wir die vorhergesagten Werte im Testset mit der tatsächlichen Kriteriumswerte im Testset. Dazu wählen wir eine geeignete Performancemaße


Blaues Trainiertes Modell nur anhand des Trainingssetz, Dann vom Testsset haben wir Prädiktorwerte, die schmeisen wir in das trainierte Modell, um Vorhersagen zu kommen. Vom Testset haben wir auch tatsächliche Kriteriumswerte für die Beobachtungen im Testset, und wir haben die Vorhergesagten Werten des Testsets anhand des trainierten Modells.

Nun wählen wir ein Performancemaß aus, zB MSE, und wir sehen wie IM MITTEL DIE VORHERGESAGTE WERTE VON DEN TATSÄCHLICHEN KRITERIUMSWERTE ABWEICHEN

==> daraus bekommen wir einen Schätzwert für den erwarteten VorhersageFEHLER.

WICHTIG: Wir wollen einen Schätzwert der erwarteten Vorhersagenfehlers für das trainierte Modell auf dem GESAMTEN DATENSATZ (grünes Modell). Der Schätzwert, den das blaue Modell liefert, das nur auf den Trainingsdaten trainiert wurde, ist der Schätzwert für die VorhersageFEHLER, wenn ich in auf die Gesamte Stichprobe anwende.—> Der sagt wie gut das Modell funktioniert, wenn wir es auf den gesamten Datensatz verwenden



Author

diana F.

Information

Last changed