Was ist Eager Learning?
Hauptanteil der Arbeit wird während der Trainingsphase absolviert (z.B Neuronales Netz)
Benennen Sie die “4 V”, die Big Data charakterisieren und beschreibe diese.
4V: Volume, Variety, Velocity & Veracity
Volume: Big Data haben immer ein großes Volumen => so groß, dass man diese kaum bewältigen kann
Variety: Vielfalt der Quellen oder Eingangsdaten der Datenbanken
Velocity: Wie schnell die Daten eintreffen, analysiert und genutzt werden.
Veracity: Die Wahrhaftigkeit der Daten.
Was versteht man unter Underfitting?
Ein Modell, das weder die Trainingsdaten modelliert noch auf neuen Daten verallgemeinern kann
Was versteht man unter Overfitting?
Ein Modell, das die Trainingsdaten zu exakt erfasst, inklusive Details und Rauschen
Was ist ein Regressor?
Algorithmus zur Durchführung einer Regression bspw. Decision Tree Regressor
Erläutern Sie die Fehlerart: Trainingsfehler.
Trainingsfehler:
Output von den Trainingsdaten des Modells weicht von den tatsächlichen Outputs der Trainingsdaten ab.
Maß für das Verhalten des Modells bei den Trainingsdaten.
Erläutern Sie die Fehlerart: Test- oder Generalisierungsfehler.
Test- oder Generalisierungsfehler:
Output von den Testdaten des Modells weicht von den tatsächlichen Outputs der Testdaten ab.
Maß für das Verhalten des Modells bei neuen Daten.
Erläutern Sie die Fehlerart: Modellvarianz.
Varianz eines Modells:
Ein Maß, wie stark sich ein Modell ändert, wenn es durch eine andere Datenteilmenge trainiert wird.
hohe Varianz = hohe Empfindlichkeit bei Änderung der Trainingsdaten
Was ist Lazy Learning?
Hauptanteil der Arbeit wird während der Anfragephase absolviert (z.B k-NN)
Was versteht man unter “überwachtes Lernen”?
Lernvorgang erfolgt mit labeled data (Daten, bei denen die Werte der abhängigen Variablen bekannt sind)
Lernt anhand der Beispiele aus dem Trainingssatz, den richtigen Wert y für einen Input Vektor x zu erzeugen.
Welche Verwendung findet man für Supervised Learning?
Verwendung für Klassifikation und Regression
Was ist das Ziel vom Supervised Learning
Ziel: Anwendung des trainierten Modells auf unbekannte Daten
Nenne zwei Beispiele für das Supervised Learning.
k-NN
einfache lineare Regression
Was versteht man unter “Unsupervised Learning”?
Lernvorgang erfolgt mit unlabeled data (Daten, denen die Werte der abhängigen Variablen nicht bekannt sind)
Das Modell lernt, die Beispiele des Trainingssatzes auf Basis von Ähnlichkeiten oder Wahrscheinlichkeiten zu gruppieren.
Nenne Beispiele für das Unsupervised Learning.
Association Rules
Methoden zur Dimensionsreduktion
Techniken zum Clustering (k-means)
Was versteht man unter “Semi-Supervised Learning”?
Beim Semi-Supervised Learning kennzeichnet das Modell, die Daten im Trainingssatz mit einem modifizierten unsupervised learning Verfahren
Was ist ein Classifier?
Classifier- Algorithmen dienen zur Durchführung einer Klassifikation bspw. Decision Tree Classifier
Last changed3 months ago