Course information | [SoSe 2026] Konvergenz von Algorithmen des Reinforcement learning

[SoSe 2026] Konvergenz von Algorithmen des Reinforcement learning

Reinforcement learning (bestärkendes Lernen) ist das Teilgebiet des maschinellen Lernens,
das die Erfolge der künstlichen Intelligenz in den letzten Jahren ermöglicht hat,
wozu das Lösen von Go (und Schach und einigen Computerspielen) und die Entwicklung von Large language models
 zählen.

DDaneben gibt es viele weitere Anwendungen in Naturwissenschaft, Technik und Medizin. 

In diesem Seminar wird in den Präsentationen und Seminararbeiten ein Überblick über die Beweisverfahren
ggegeben, mit denen die Konvergenz (fast sicher oder im Sinn von PAC (probably approximately correct))
vvon Lernalgorithmen des Reinforcement learning gegen optimale Strategien gezeigt werden kann.  
Dabei liegt der Schwerpunkt auf Varianten des Q-Learning und auf aktuellen Entwicklungen.  
Wenn möglich wird auch distributionelles Reinforcement learning behandelt.

Voraussetzungen: Als spezielle Voraussetzungen für das Seminar sind
Vorkenntnisse über dynamische Programmierung (Bellman-Gleichungen),
stochastische Approximation, Martingale und/oder Konzentrationsungleichungen hilfreich.

Trainer/in: Clemens Franz Heitzinger
Trainer/in: Jana Kaminski