Wofür steht „Prolog“?
Programming Logic
Welche drei Grundkomponenten definieren ein künstliches neuronales Netz
Gewichte,
Biases und
Aktivierungsfunktionen
Welcher Operator führt in evolutionären Algorithmen Teile zweier Individuen zusammen?
Rekombination (Crossover)
Welche der folgenden Techniken ist nicht Standard-Baustein eines evolutionären Algorithmus: Mutation, Selektion, Imagination, Rekombination?
Imagination
Was ist ein Markov Decision Process (MDP)?
Über alle möglichen Zielfunktionen erzielt kein Optimierer im Mittel bessere Ergebnisse als jeder andere.
Wie lautet die Temperatur-Abhängigkeit der Akzeptanzwahrscheinlichkeit in Simulated Annealing?
Sie nimmt ab, je weiter die Temperatur sinkt.
Welches Konzept steckt hinter Generative Adversarial Networks (GANs)?
Adversariales Training – Generator vs. Diskriminator
Welche Programmiersprache wurde für fehlertolerante, hochverfügbare, nebenläufige Systeme entwickelt?
Erlang
Welche Strategie schneidet in einem iterierten Gefangenendilemma-Turnier am besten ab?
Tit-for-Tat
Wofür steht die Markov-Eigenschaft in einem MDP?
Die nächste Zustandsverteilung hängt nur vom aktuellen Zustand und der Aktion ab, nicht von der Vorgeschichte.
Was unterscheidet ein POMDP von einem MDP?
Beim POMDP kann der Agent den Zustand nur teilweise beobachten. (PO = partially observable)
In der Fuzzy-Logik liegen Wahrheitsgrade in welchem Intervall?
[0; 1]
Wie definiert man Fuzzy-AND, -OR und -NOT üblicherweise?
AND = Min
OR = Max
NOT = 1 - x
Was bewirkt der π-Calculus-Operator !P?
Replikation – unbegrenzte Parallelkopien von P
Was wird als Pareto-Front in der Spieltheorie bezeichnet?
Die Menge aller Strategien, die nicht von einer anderen Strategie gleichzeitig in allen Auszahlungen übertroffen werden.
Nenne eine Nullsummen-, eine Koordinations- und eine Chicken-Game-Matrix (2×2).
Ein Entscheidungsmodell mit Zuständen, Aktionen, Übergangs- (transition) und Belohnungsfunktion (reward function), das die Markov-Eigenschaft (Markov Property) erfüllt.
Was besagt die Markov-Eigenschaft (Markov Property)?
Dass die Verteilung des nächsten Zustands nur vom aktuellen Zustand und der aktuellen Aktion abhängt, nicht von der Vorgeschichte.
Was ist Reward Shaping (Reward Shaping)?
Das gezielte Hinzufügen oder Anpassen von Belohnungen (rewards), um erwünschtes Verhalten im Lernprozess zu fördern.
Was versteht man unter perversen Anreizen (perverse incentives) in der Reinforcement Learning?
Wenn das Belohnungssystem unbeabsichtigt Verhalten belohnt, das dem ursprünglichen Ziel widerspricht.
Warum benötigt man bei teilweise beobachtbaren Prozessen (partially observable processes) oft einen Hidden State (Hidden State)?
Weil die direkten Beobachtungen (observations) allein nicht ausreichen, um den vollständigen Systemzustand zu rekonstruieren.
Was ist Simulated Annealing (Simulated Annealing)?
Ein Optimierungsverfahren (optimization algorithm) mit probabilistischem Akzeptieren schlechterer Lösungen und abnehmender „Temperatur“ (temperature schedule).
Was versteht man unter Emergenz (emergence)?
Das Phänomen, dass aus dem Zusammenspiel vieler einfacher Einheiten komplexe Muster oder Verhaltensweisen entstehen.
Was ist eine Evolutionarily Stable Strategy (evolutionarily stable strategy)?
Eine Strategie in einer Population, die sich gegen alternative Strategien nicht verdrängen lässt.
Was bedeutet Backpropagation (backpropagation)?
Das Verfahren, um mithilfe der Kettenregel Gradienten rückwärts durch das Netzwerk zu berechnen und Gewichte zu aktualisieren.
Was versteht man unter Gradient Interference (gradient interference)?
Wenn sich Gradienten aus unterschiedlichen Ziel- oder Belohnungsfunktionen gegenseitig stören.
Was versteht man unter Elitismus (elitism) in der Selektion?
Dass das beste Individuum immer in die nächste Generation übernommen wird.
Welche drei Kategorien definieren ein festes Neuronales Netz (neural network) vollständig?
Gewichte (weights), Biases (biases) und Aktivierungsfunktionen (activation functions).
Was versteht man unter Nicht-Stationarität (non-stationarity) in Multi-Agenten-Systemen?
Dass sich die Strategien der anderen Agenten im Verlauf ändern, wodurch sich die Umweltdynamik kontinuierlich wandelt.
Welche Strategie (“Zeichen-und-Antwort”) gilt im iterierten Gefangenendilemma (iterated Prisoner’s Dilemma) als besonders erfolgreich?
Tit-for-Tat (tit-for-tat).
Warum wirkt Simulated Annealing (simulated annealing) bei Landschaften mit großen Plateaus oft wie reine Zufallssuche?
Weil die Nachbarschaftsfunktion stets gleich große Schritte erlaubt und keine Richtungsinformationen liefert, bleibt jede Iteration im Wesentlichen eine zufällige Auswahl.
Zuletzt geändertvor einem Tag