Formel Mean square error
Welche Methoden gibt es um Overfitting zu vermeiden
cross-validation
K-fold cross validation
Wie sieht eine Konfusionsmatrix aus
Formel Accuracy +interpretation
Prozentsatz für true Aussage
Formel Precision + Interpretation
Prozentsatz für true positiv
Formel Recall
Wie gut ist das Modell in der Lage positive Fälle zu erkennen
F1-score Formel
Ablauf/(pipeline) Machine Learning
Data
Data cleaning & preparation
Feature Construction & Selection
Model selection & Parameter tuning
Model training
Welche 2 Typen von HyperParametern gibt es?
von Daten gelernt
werden vom Nutzer (im Training) bestimmt
Aus welchen 3 Gruppen kann ein Unternehmen Daten von Kunden bekommen/ auf diese schließen
eigenes Verhalten des Kundens
Verhalten anderer Kunden
Daten von Dritten/sonstige Daten
Auf was basiert eine reine kollaborative Filterung
Ausschließlich auf Basis von Bewertungen (unabhängig von Alter, Geschlecht,…)
Berechnung User rating Formel
Welche 2 großen Arten gibt es von kollaborativer Filterung
User-based Filterung
Ähnlichkeit User/Geschmack
Cluster-Teilung
Artikelnasierte Filterung
basierend auf Bewertungen
Bsp. Film mit 5* -> ähnliche Filme werden vorgeschlagen
Probleme von kollaborativer Filterung
cold start: neue Benutzer, Artikel
Spärliche Daten
Skalierung: Datensatz zu groß/komplex
Long tail: populäre Artikel werden durch höhere Anzahl an Bewertungen bevorzugt
Last changeda year ago