Reinforcement learning (bestärkendes Lernen) ist das Teilgebiet des maschinellen Lernens,
das die Erfolge der künstlichen Intelligenz in den letzten Jahren ermöglicht hat,
wozu das Lösen von Go (und Schach und einigen Computerspielen) und die Entwicklung von Large language models
zählen.
DDaneben gibt es viele weitere Anwendungen in Naturwissenschaft, Technik und Medizin.
In diesem Seminar wird in den Präsentationen und Seminararbeiten ein Überblick über die Beweisverfahren
ggegeben, mit denen die Konvergenz (fast sicher oder im Sinn von PAC (probably approximately correct))
vvon Lernalgorithmen des Reinforcement learning gegen optimale Strategien gezeigt werden kann.
Dabei liegt der Schwerpunkt auf Varianten des Q-Learning und auf aktuellen Entwicklungen.
Wenn möglich wird auch distributionelles Reinforcement learning behandelt.
Voraussetzungen: Als spezielle Voraussetzungen für das Seminar sind
Vorkenntnisse über dynamische Programmierung (Bellman-Gleichungen),
stochastische Approximation, Martingale und/oder Konzentrationsungleichungen hilfreich.