Was ist das Ziel von Mashine Learning?
Ziel von Mashine Learning ist es durch Nutzung verschiedener Algorithmen ein Modell erstellt wird. Diese Modell wird verwendet um neue Beobachtungen vorherzusagen oder zu Klassifizieren.
=> Computer reagiert ohne statische Programmierung auf Eingaben
Wovon unterschiedet sich Mashine Learning von klassischer Programmierung?
Bei einer Programmierung wird das Modell vom Programm vorgegebn, bei ML, wird dies erzeugt
Was sind Trainingsdaten?
Trainingsdaten ist ein Teil eines Datensatzes, welcher dazu verwendet wird um das ML Modell zu erstellen und anzulernen
Was sind Testdaten?
Testdaten werden genutzt um das erzeugt Modell zu Prüfen.
Dies geschieht indem die vorhergesagten Modelle mit den realen Werten verglichen werden.
In welchem Verhältniss werden Trainings und Testdaten aufgeteilt?
3 (Training) : 1 (Test)
Was ist eine Kreuzvalidierung?
Bei einer Kruzvalidierung wird das ML Modell durch verwendung verschiedener Test- und Trainingsdaten des gleichen Datensatzes erzeugt und getestet.
Wofür macht man eine Kreuzvalidierung?
Zur Prüfung der Varianz des Datensatzes
Welche Lernmethoden/Strategien gibt es im Bereich ML?
Supervised Learning / Überwachtes Lernen
Unsupervised Learning / nicht überwachtes Lernen
Was ist supervised Learning und welche Modelle werden hier verwendet?
Supervised Learning oder auch Überwachtes Lernen ist die Form von ML mit der progonosen / vorhersagen für neue Beobachtungen erstellt werden.
ML Modelle
Klassifizierung
Regression
Was ist unsupervised Learning und welche Modelle werden hier verwendet?
Bei dieser ML Strategien werden keine prognosen / vorhersagen erstellt, sondern die bestehenden Daten lediglich gruppiert und interpretiert.
Aufgabengebiete
Clusteranalyse
Werden für unsupervised Learning Testdaten benötigt?
Nein
Bei Vorhersagefehlern kann man zwischen
reduzierbaren Fehlern
nicht reduzierbaren Fehlern
unterschieden. Welche Parameter sind bei den reduzierbaren Fehlern am wichtigsten?
BIAS / Verzerrung
Varianz
Was ist die Varianz und in welchem ML Modell kann man diese verwenden?
Bei der Varianz wird für jede Probe der Kreuzvalidierung die Mittlere Quadratische Abweichung (MSE) berechnet. Anschließend wird geprüft, ob das MSE der Proben stark voneinander abweichen.
ML-Modell
Was ist das BIAS und wie Interpretiert man dies?
Das BIAS Beschreibt die Güte eines ML Modells. Die Interpretation des BIAS ist abhängig des gewählten ML Modells.
Wie berechnet man das BIAS
Berechnung des BIAS Abhängig des gewählten ML Modells:
Klassifikation => Genauigkeit
Regression => (R)MSE
Wann spricht man von Underfitting und welches Problem tritt dabei auf?
Man spricht von Underfitting, wenn der BIAS sehr hoch ist.
Dadurch erhöhen sich die Fehlerquoten bei den Vorhersagen.
Dies passiert, wenn das Modell zu ungenau ist und so Abhängigkeiten nicht berücksichtigt werden.
=> Modell ist zu allgemein
Was ist Overfitting und wann tritt dies auf?
Bei Overfitting ist die Varianz sehr hoch ist.
Dies kommt vor, wenn zu viele Variablen verwendet werden und das Modell so zu detailiert ist. Dadurch kommt es zu Änderungen in der Kreuzvalidierung.
=> Modell hat eine zu geringe verallgemeinerung
Zuletzt geändertvor 2 Jahren