Buffl

14 Kontinuierliche Optimierung

pz
von p Z.

Welche 3 Methoden werden dabei angewand mit den jeweiligen Untermdethoden



Methoden:

·       Replay: abspeichern einer Teilmenge von Daten aus vorangegangenen Tasks (Samples)  beim Trainieren des Modells auf einen neuen Task wird dieses zusätzlich auf den Samples trainiert

o   Rehersal: Trainieren auf einem „konzentrierten“ Sample, gewonnen aus Daten vorangegangener Tasks, um ein Vergessen abzuwenden

Problem: steigender Aufwand beim Trainieren auf anwachsende Zahl von Tasks; neigen zu overfitting

o   Pseudo-Rehersal:

§  Künstliche Samples werden generiert durch Einspeisen zufälliger Eingangswerte in das Netz

§  In Kombination mit den zugehörigen Ausgangswerten entstehen „Pseudo-Samples“

§  Derartige Samples können Charakter eines Netzes zu einem bestimmten Zeitpunkt festhalten ohne die Notwendigkeit echter Samples

o   Constrained Optimization:

§  Beschränken der Veränderung von Parametern beim Neutrainieren über modifizierte Loss Function. Neutrainieren erfolgt unter Zuhilfenahme alter Datasets

§  Ähnlich zu Regularization

 

·       Regularization

o   Erweitern der Loss Function um einen Term, der beim erneuten Training des Netzes die Veränderung von Parametern unterbindet, die für vorangegangene Tasks bedeutend waren

o   Modellparametern wird Wichtigkeitsmaß zugewiesen

§  Höhe der Veränderung eines Parameters hängt von Höhe des Wichtigkeitsmaßes ab

§  Geringe Veränderung von wichtigen Parametern beim Trainieren auf nächsten Task

o   Ansätze:

§  Memory Aware Synapses MAS: Beim Re-Training d. Netzes auf eine neue Aufgabe bleiben Gewichte, die hohe Auswirkung (Importance) beim vorherigen „Task“ haben unangetastet

§  Klonen: Iteriere beim Re-Training auf die neue Aufgabe durch alle alten Output-Heads und recycle jenen, der bei der neuen Aufgabe den geringsten Fehler (z.B. MSE) erzeugt.

 

·       Parameter Isolation

o   Spezifizieren ausgewählter Modellparameter für spezifische Aufgaben

o   Vorgehensweisen:

§  Dynamische Architekturen: Anlesen zusätzlicher Neuronen und Schichten für neue Aufgaben oder Mitführen dedizierter Modellkopien

§  Fixed Network: Zuteilen von Teilbereichen des Netzes zu spezifischen Aufgaben

Author

p Z.

Informationen

Zuletzt geändert