20-00-1047-iv Reinforcement Learning: Von Grundlagen zu den tiefen Ansätzen

Veranstaltungsdetails

Lehrende: Prof. Ph.D. Georgia Chalvatzaki; Ph.D. Davide Tateo

Veranstaltungsart: Integrierte Veranstaltung

Orga-Einheit: FB20 Informatik

Anzeige im Stundenplan: RL

Fach:

Anrechenbar für:

Semesterwochenstunden: 4

Unterrichtssprache: Deutsch und Englisch

Min. | Max. Teilnehmerzahl: - | -

Lehrinhalte:
• Markov Decision Process
• Value Functions, Bellman Operator, Policies
• Dynamic Programming
• Monte-Carlo Reinforcement Learning
• Temporal Difference Learning
• Tabular Reinforcement Learning
• Reinforcement Learning with Function Approximation
• Deep Q-Learning
• On-policy and off-policy deep actor-critic
• Model-based Reinforcement Learning
• Intrinsic Motivation

Literatur:
Reinforcement Learning: An Introduction, Sutton and Barto, 2nd Edition: http://incompleteideas.net/book/RLbook2018.pdf

Voraussetzungen:
Gute Programmierkenntnisse in Python.
Vorherige Belegung der Vorlesung Statistical Machine Learning ist hilfreich aber nicht zwingend erforderlich

Offizielle Kursbeschreibung:
Motivation:

"Die grundlegende Herausforderung im Bereich der künstlichen Intelligenz und des maschinellen Lernens besteht darin, zu lernen, wie man unter Unsicherheit gute Entscheidungen trifft" - Emma Brunskill. 

Reinforcement Learning (RL) ist ein Bereich des maschinellen Lernens, der sich mit der Frage beschäftigt, wie intelligente Agenten in einer Umgebung agieren sollten, um die kumulativen Belohnungen zu maximieren. RL ist eines der drei grundlegenden Paradigmen des maschinellen Lernens, neben dem überwachten Lernen und dem unüberwachten Lernen. RL unterscheidet sich vom überwachten Lernen dadurch, dass keine beschrifteten Eingabe-/Ausgabepaare vorgelegt werden müssen und dass suboptimale Aktionen nicht explizit korrigiert werden müssen. Stattdessen liegt der Schwerpunkt auf der Suche nach einem Gleichgewicht zwischen Erkundung (Neuland) und Ausnutzung (des vorhandenen Wissens).

Über diesen Kurs:

Dieser Kurs führt die Studierenden durch die Grundlagen der Methoden des Reinforcement Learning bis hin zu den jüngsten Fortschritten des Deep Reinforcement Learning. Am Ende dieses Kurses werden die Studierenden über ein solides Wissen auf diesem Gebiet verfügen und in der Lage sein, Probleme mit verschiedenen RL Algorithmen zu lösen. Dieser Kurs dient als hervorragender Hintergrund für Personen, die selbstständig RL-forschung betreiben wollen, z.B. im Rahmen einer Bachelor- oder Masterarbeit. 

Zusätzliche Informationen:
Die Präsenzvorlesung wird von einer Online-Problemlösungssitzung (Kodierübungen) und einer Fragerunde begleitet.

Online-Angebote:
moodle

Literatur
Termine
Datum Von Bis Raum Lehrende
1 Mo, 17. Apr. 2023 11:30 13:30 S202/C205 - Bosch Hörsaal - AKTUELL GESPERRT Prof. Ph.D. Georgia Chalvatzaki; Ph.D. Davide Tateo
2 Mo, 24. Apr. 2023 11:30 13:30 S202/C205 - Bosch Hörsaal - AKTUELL GESPERRT Prof. Ph.D. Georgia Chalvatzaki; Ph.D. Davide Tateo
3 Mo, 8. Mai 2023 11:30 13:30 S202/C205 - Bosch Hörsaal - AKTUELL GESPERRT Prof. Ph.D. Georgia Chalvatzaki; Ph.D. Davide Tateo
4 Mo, 15. Mai 2023 11:30 13:30 S202/C205 - Bosch Hörsaal - AKTUELL GESPERRT Prof. Ph.D. Georgia Chalvatzaki; Ph.D. Davide Tateo
5 Mo, 22. Mai 2023 11:30 13:30 S202/C205 - Bosch Hörsaal - AKTUELL GESPERRT Prof. Ph.D. Georgia Chalvatzaki; Ph.D. Davide Tateo
6 Mo, 5. Jun. 2023 11:30 13:30 S202/C205 - Bosch Hörsaal - AKTUELL GESPERRT Prof. Ph.D. Georgia Chalvatzaki; Ph.D. Davide Tateo
7 Mo, 12. Jun. 2023 11:30 13:30 S202/C205 - Bosch Hörsaal - AKTUELL GESPERRT Prof. Ph.D. Georgia Chalvatzaki; Ph.D. Davide Tateo
8 Mo, 19. Jun. 2023 11:30 13:30 S202/C205 - Bosch Hörsaal - AKTUELL GESPERRT Prof. Ph.D. Georgia Chalvatzaki; Ph.D. Davide Tateo
9 Mo, 26. Jun. 2023 11:30 13:30 S202/C205 - Bosch Hörsaal - AKTUELL GESPERRT Prof. Ph.D. Georgia Chalvatzaki; Ph.D. Davide Tateo
10 Mo, 3. Jul. 2023 11:30 13:30 S202/C205 - Bosch Hörsaal - AKTUELL GESPERRT Prof. Ph.D. Georgia Chalvatzaki; Ph.D. Davide Tateo
11 Mo, 10. Jul. 2023 11:30 13:30 S202/C205 - Bosch Hörsaal - AKTUELL GESPERRT Prof. Ph.D. Georgia Chalvatzaki; Ph.D. Davide Tateo
Übersicht der Kurstermine
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
Lehrende
Prof. Ph.D. Georgia Chalvatzaki
Ph.D. Davide Tateo