Was ist Artificial Intelligence?
ist die Eigenschaft eines IT-Systems “menschenähnliche” intelligente Verhaltensweisen zu zeigen.
Was ist Machine Learning?
ist eine Funktionalität, die es Software ermöglicht, eine Aufgabe ohne explizite Programmierung oder Regeln auszuführen.
Was ist Deep Learning?
a new take on learning representations from data that puts an emphasis on learning successive layers of increasingly meaningful representations.
Was ist Computer Vision?
Automatisiert Informationen aus visuellen Daten extrahieren -> Verständnis über den Inhalt von digitalen Medien z.B. Bildern und Videos erhalten.
Was ist das Ziel von Computer Vision?
Ziel: Methoden entwickeln, die die menschlichen Fähigkeiten zur Objektidentifizierung, -lokalisierung und -klassifizierung (Human Vision) nachbilden -> Objekte in Bilder lokalisieren, identifizieren und klassifizieren.
Was ist Natural Language Processing?
Automatisch Erkennung der Informationen der natürlichen Sprache
Was ist ein Artifical Neural Network?
Ein Artificial Neural Network (ANN) ist ein gewichtetes
Funktionennetz, dessen Parameter (die Gewichte) über ein Lernverfahren
selbständig eingestellt werden
Woraus besteht ein ANN?
Knoten: Einfache Berechnungseinheiten (verknüpfte Funktionen)
Kanten: Gewichtete Verbindungen zwischen den Knoten
Lernverfahren: Algorithmus der anhand einer Menge von Trainingsbeispielen und einer Lernregel die Gewichte des (Funktionen-)Netzes anpasst.
Was bedeutet der Modellfreier Abschätzer?
Für den Zusammenhang zwischen Variablen wird kein vorgegebenes mathematisches Modell vorausgesetzt.
Was ist ein Computational Graph?
Funktionen und Funktionskompositionen werde über gerichtete Graphen repräsentiert:
Was ist deep learning?
Welche Hyperparameter sind dir bekannt?
Optimierungsfunktion
Loss Funktion
zur Berechnung der Abweichung zwischen den Vorhersagewerten und der realen Werten
Metrik(en) zur Ermittlung der Güte des Modells
Ggf. aber auch Netzwerkparameter
Anzahl hidden layers
Neuronen
Vergleichen Sie die Ergebnisse aus dem Trainingsprozess mit denen aus der Evaluation.
- Sind die Ergebnisse erwartungsgemäß?
- Sollte dem nichts so sein, versuchen Sie einen Erklärungsansatz dafür zu finden.
Sowohl die Accuracy als auch der Loss sind auf dem Trainings- und Testdatensatz gleich. Liegt eine Abweichung vor, ist dies idR. durch Overfitting zu begründen.
Was ist eine Confusion Matrix?
Tabellarische darstellung der Zuordung der Datensäþze aus dem Testset zu den Kallassen
Prediction und True Value
Hilfe beim korrekten klassifiziert bei welchen Klasen die Differenzierung tendenziell schwerer fällt
Wobei hilft Tensorboard?
F[r die Visualisierung der neuronalen Netze, ihrer internen Darstellung und des Trainingsverlaufs
Was ist die Precision des Classification reports?
Precision niedrig -> Modell stuft mehr Schwertlilien in diese Klasse ein als es sollte
Was ist der Recall des Classification reports?
Modell erkennt nicht alle Schwertlilinen, die dieser Klasse angehören
Tuner unterschiede Hyperband, Randomsearch, BayersOptimisation
**Hyperband** Tuner:
> Motivation: Ineffizientes Training des _RandomSearch_ Tuners, da alle erstellten Netze die max. Anzahl an Epochen `max_epochs` trainiert werden, auch solche, die ein schlechtes Trainingsverhalten aufweisen und/oder deren Parameterkonstellation evident suboptimal ist.
- Ermittelt durch Permutation aller Hyperparameter jede mögliche Kombination und erstellt für jede einzelne ein Modell
- Jedes Modell wird trainiert, jedoch nur wenige Epochen, d.h. idR. deutlich unterhalb der konfigurierten max. Anzahl an Epochen `max_epochs`
- Nach einem gesamten Trainingsdurchlauf werden die besten Modelle gefiltert
- Die Schritte 2 und 3 werden wiederholt (**iteratives Modell**) solange die Anzahl der Iterationen unterhalb von `hyperband_iterations` liegt
- Die finalen Modelle durchlaufen das "volle" Training (= `max_epochs`)
2. **BayesianOptimization** Tuner:
> Motivation: Jede Hyperparameterkombination in _RandomSearch_ und _Hyperband_ ist zufällig (randomisiert) gewählt $\rightarrow$ Garantiert nicht zwangsläufig optimale Hyperparameterwerte bzw. die Suche dauert ggf. lange
- Wenige Hyperparameterkonstellationen werden zufällig gewählt und für diese die entsprechenden Modelle trainiert
- Alle folgenden Hyperparameterkonstellationen werden systematisch anhand der Güte der vorherigen Hyperparameterwerte ermittelt
3. _Hyperband_ und _BayesianOptimization_ liefern nicht zwangsläufig Hyperparameterkonstellationen, die bessere Ergebnisse hervorbringen, sondern sind vor allem **effizienter** bei der Suche. Insbesondere bei **großen Suchräumen** (viele Hyperparameter mit vielen Ausprägungen) ist die Performance besser im Vergleich zum _RandomSearch_ Tuner.
Was ist das Machine Learning Principle?
Das Allgemeine aus dem Spezialen erkken, damit das Spezielle aus dem Allgemeien vorhergesagt werden kann.
Was ist ein Artifical Neuronal Network?
Ein Artifical Neural Network (ANN) ist ein gewichtetes Funktionsnetz, dessen Parameter (die Gewichte) über ein lernverfahren selbstständig eingestellt werden.
Was sind eigenschaften eines ANNs?
Modellfreier Abschätzer
Für den Zusammenhang zwische nVariablen wird kein vorgegebens mathematisches Modell vorausgesetzt
Universeller Approximator:
Jede Funktion kann mit einem ANN beliebig genau angenähert werden.
Eignung für Untersuchungsfragestellungen: Klassifikation, Prognose, Segemtierung, Optimierung
Was ist ein Neuron?
Berecheneinheit die aus mehreren Funktionen besteht?
Wie wird die Vorwärtsgerichetet Datenverabeitung genannt?
Forward propagation
Was passiert in einem Layer im Ann?
Jeder Layer hat eine andere Darstellung des Problems die immer genauer wird.
Welche Vorgehensmodelle gibt es?
Crisp-dm
KDD
EDDA
Welche Phasen hat das CRISP-DM
Business Understanding
Data Understand
Data Preparation
Modeling
Evaluation
Deployment
Welche Analytischen bereich gucken wir uns an?
Predictive Analytics.
Was für Probleme gibt es?
Loss function
Quantifizierung des “Schadens” eines Fehlers.
Cost function
Loss und Regularisation
Error function
Unterschied zwischen zwei Werten
Was ist die Lernregel?
Optimizer, anhand des Loss wird das Modell angepasst.
Wie läuft das Mdeoling ab?
Was ist online learning?
Incremental Learning (Direkt nach eingang neuer daten), Interacitve Learning (Nach dem Rückkoppelungssignal des nuterzers)
Was sind vor und nachteile des Batch Learnings?
Was ist Online Learning?
Was ist Inferencing?
Das Erstellen von Vorhersagen
Was ist Feature Engieering?
Feature engineering ist der Przess der selectierung und des erstellen von Features aus roh daten.
Was haben gute Features?
Predictive Power
Was ist Data Preprocsessing?
Sammeln und Aufbereiten der Rohdaten für das Feature Engineerings
Was ist data Relibilty?
Kann du deinen Daten vertraune?
Was ist Imbalanced Data?
EIn classifications datensatz mit einer schiefen classen proportion.
Was ist Data Balancing?
Es gibt zwei Möglichkeiten:
Downsampling
Mir auf einen Teil der Daten arbeiten
Upweighting
Gewichtung zu den Datens'ätzen hinzufügen
Was ist Repräsentative Daten?
Die Strukturen der Grundgesamtheit sollten in den Trainigsdaten erhalten bleiben.
Wofür sind Test Daten?
Zur Leistungsbewertung nach dem Training und damit auf dem Modell
Was ist Data Cleanisng?
Identifikation (detection) und Behandlung (handling) von fehlerhaften (inconsistent values), fehlenden (missing values), redundanten (duplicates) Daten sowie Außreiser (anormalies)
Was sind Outliers?
Merkmalswerte (Feature Values) eines Falls (Sample), der nicht der (statistischen) Erwartung entspricht.
Was ist Data Sparsity?
Wenn viele Werte des Objectes null sind.
Was ist Normalization?
Transformieren von numerischen daten zu einem Ähnlichen Skala wie andere Daten.
Gradient könnte springen und langsamer werden
Was ist ein Feature Cross?
Sunthetisches Feature, das duch eine Opterion aus zwei Features oder mehr erzeugt wird.
Wie kann man Feature Selectieren?
Unsupervised
Nicht die ziel Variabel nutzen (entfernen von doppelten variablen)
Correlation
Supervised
Nutzen der Ziel variable
Wrapper
Filter
Intrinsic
Was ist der ANN Modeling Process??
Was f[r Funktionen hat ein Neuron
Übergabefunktion: aggregiert die gewichtete EIngabe
Aktivierungsfunktion> die dem Yustand der Berechungseinheit in Abhängigkeit von der Netzeingabe bestimmt
Ausgabefunktion: die den Ausgabewert der Berechnungseinheit in Abhängigkeit von der Aktivierung bestimmt.
Was ist der Bias?
Der Bias ist ein Schwellenwert, der die Verschiebung der AKtivierungsfunktion bestimmt. Damit wird die Flexibilität zur Anpassung an die empirische (wahre) Verteilung erhöht.
Lineare Funktion, verschiebung auf der Y Achse
Non Lineare: Verschiedbung auf der x achste
Wie wird der Bias Gelert?
Über die Gewichtung
Was macht ein DNNs?
Dense NEural Network -> Schleirfen, Time Series
Was ist der Logit?
Ruhausgabe des Modells.
WIrd durch eien Normalisierunbgsfunktion in die Prediction umgewandelt.
Was ist eine Prediction
Logit muss abhängig des Pronblems umgewandelt werden
Was ist Oscillating Loss Problem?
Was ist Exploding Loss Problem?
Contradictory Metrics
Stucking Loss
Increasing Test Loss
Add Early Stopping
Wann sollte man das Trainig beenden?
Was für Vor und Nachteile hat ein Multi Layer Perceptor?
Was ist das Gradientenverfahren?
Numerisches Verfahren für die Optimierung
Wann wird der Gradient angepasst?
WIe funktioniert die Backpropagation?
Reduzieren der Parameter anhand von Anteiligkeit des Fehlers.
Lernrate * dznamische lernrate (abh'ängig der Fehler fuktion) * EIngabewert zu dem Neurpm
Was macht der Opmizer
Minimiung der Loss funktion
Was sind wanished gradients?
Welche Lernpronleme bzgl. der Daten können auftreten?
Was kann man gegen overfitting tun?
Learning Rate und regularization
Last changed2 years ago