Neural Networks

von Moritz K.

Beschriften Sie ein Neuron.

Nennen Sie zwei nichtlineare Aktivierungsfunktionen und deren Ableitung.

Charakteristika von High und Low Learning Rates

High learning rates

Small learning rates

Was sind Dynamic und Cyclical Learning rates?

Dynamic Learning rates

Cyclical Learning rates

Idea: Use high learning rates to escape local minima. Use multiple cycles of decay
At the beginning of each cycle, the high learning rate is able to escape a possible local minimum

Prinzip Adam

Normalized running estimates of mean and variance of each component of gradient. Customer learning rate for each parameter.

Vorteil von ReLU ggü. Sigmoid und tangenshyperbolic.

Zuletzt geändert
vor 8 Monaten