ML: Allgemein

by Nick D.

Was ist das Ziel von Mashine Learning?

Ziel von Mashine Learning ist es durch Nutzung verschiedener Algorithmen ein Modell erstellt wird. Diese Modell wird verwendet um neue Beobachtungen vorherzusagen oder zu Klassifizieren.

=> Computer reagiert ohne statische Programmierung auf Eingaben

Wovon unterschiedet sich Mashine Learning von klassischer Programmierung?

Bei einer Programmierung wird das Modell vom Programm vorgegebn, bei ML, wird dies erzeugt

Was sind Trainingsdaten?

Trainingsdaten ist ein Teil eines Datensatzes, welcher dazu verwendet wird um das ML Modell zu erstellen und anzulernen

Was sind Testdaten?

Testdaten werden genutzt um das erzeugt Modell zu Prüfen.

Dies geschieht indem die vorhergesagten Modelle mit den realen Werten verglichen werden.

In welchem Verhältniss werden Trainings und Testdaten aufgeteilt?

3 (Training) : 1 (Test)

Was ist eine Kreuzvalidierung?

Bei einer Kruzvalidierung wird das ML Modell durch verwendung verschiedener Test- und Trainingsdaten des gleichen Datensatzes erzeugt und getestet.

Wofür macht man eine Kreuzvalidierung?

Zur Prüfung der Varianz des Datensatzes

Welche Lernmethoden/Strategien gibt es im Bereich ML?

Supervised Learning / Überwachtes Lernen
Unsupervised Learning / nicht überwachtes Lernen

Was ist supervised Learning und welche Modelle werden hier verwendet?

Supervised Learning oder auch Überwachtes Lernen ist die Form von ML mit der progonosen / vorhersagen für neue Beobachtungen erstellt werden.

ML Modelle

Klassifizierung
Regression

Was ist unsupervised Learning und welche Modelle werden hier verwendet?

Bei dieser ML Strategien werden keine prognosen / vorhersagen erstellt, sondern die bestehenden Daten lediglich gruppiert und interpretiert.

Aufgabengebiete

Clusteranalyse

Werden für unsupervised Learning Testdaten benötigt?

Nein

Bei Vorhersagefehlern kann man zwischen

reduzierbaren Fehlern
nicht reduzierbaren Fehlern

unterschieden. Welche Parameter sind bei den reduzierbaren Fehlern am wichtigsten?

BIAS / Verzerrung
Varianz

Was ist die Varianz und in welchem ML Modell kann man diese verwenden?

Bei der Varianz wird für jede Probe der Kreuzvalidierung die Mittlere Quadratische Abweichung (MSE) berechnet. Anschließend wird geprüft, ob das MSE der Proben stark voneinander abweichen.

ML-Modell

Regression

Was ist das BIAS und wie Interpretiert man dies?

Das BIAS Beschreibt die Güte eines ML Modells. Die Interpretation des BIAS ist abhängig des gewählten ML Modells.

Wie berechnet man das BIAS

Berechnung des BIAS Abhängig des gewählten ML Modells:

Klassifikation => Genauigkeit
Regression => (R)MSE

Wann spricht man von Underfitting und welches Problem tritt dabei auf?

Man spricht von Underfitting, wenn der BIAS sehr hoch ist.

Dadurch erhöhen sich die Fehlerquoten bei den Vorhersagen.

Dies passiert, wenn das Modell zu ungenau ist und so Abhängigkeiten nicht berücksichtigt werden.

=> Modell ist zu allgemein

Was ist Overfitting und wann tritt dies auf?

Bei Overfitting ist die Varianz sehr hoch ist.

Dies kommt vor, wenn zu viele Variablen verwendet werden und das Modell so zu detailiert ist. Dadurch kommt es zu Änderungen in der Kreuzvalidierung.

=> Modell hat eine zu geringe verallgemeinerung

Join Course

Preview

Author

Nick D.

Information

Last changed
4 years ago

Report course