Was ist ML in der Vorlesung
Zufallsvariablen mit Wahrscheinlichkeitsverteilung, die mögliche Werte der Variable beschreiben
model mit angenähert richtiger W-Verteilung auf die Daten fitten
Supervised learning
Labeled data
input data in einem training set wird mit gewünschter output data zusammengebracht
Ziel: unbekannte input data richtige output data zuweisen; expected missclassification minimieren
inputs auch features, covariates oder predictors
outputs auch label, target oder response
Classification
outputs y werden in C Klassen unterteilt
for a color image with C = 3 channels (e.g., Red, Green, Blue) and D1 xD2 pixels, we have χ=R^D where D=CxD1xD2.
structured und unstructured data
explanatory data analysis
um daten zu verstehen, erstmal veranschaulichen
dimensions reduktion wenn möglich
decision tree
Bewertung
möglicht geringe missclassification rate
oder bei unterschiedlich teuren Fehlern:
asymmetrische loss function
virginica ist giftig
Overfitting
Model fits the data perfectly but is too complex
generalization gap: loss funktion(train)-loss funktion(test)
bestes modell durch domain knowledge oder trial&error
Unsupervised learning
keine Vorgaben, was Algorithmus aus den Daten lesen soll
keine Labels
benötigt keine (oft willkürlichen) Kategorien
Modell muss Input erklären, was schwieriger ist als Output zu erklären. Dadurch lernen wir mehr.
schwer, die Qualität des Outputs zu evaluieren
Reinforcement learning
Algo wird dressiert. Erhält Belohnung, wenn er gut input und output fitted, wird bestraft, wenn schlecht
im Unterschied zu supervised learning wird Algo nicht gesagt, was der richtige Output ist. Er wird nur hin und wieder bewertet
beliebt, aber manchmal schwer umzusetzen, bei Schach zb gibt es nur ein Signal am Ende
“Wenn Intelligenz eine Torte wäre, dann wäre unüberwachtes Lernen der Schokoladenkuchen, überwachtes Lernen wäre der Zuckerguss und verstärkendes Lernen wäre die Kirsche”
die Torte der Nerds
Linear discriminate Analysis
lineare Abhängigkeiten herstellen, um Muster zu erkennen, die Klassen voneinander unterscheiden können
supervised learning
Logistische Regression
teilt outputs binär ein
lineare Abhängigkeiten
MLE
Zuletzt geändertvor einem Jahr