This course is a basic introduction to Deep Reinforcement Learning (RL). In RL, an agent learns to make sequential decisions by interacting with an environment to maximize some notion of reward. Deep RL combines RL and deep learning, in that neural networks are used to represent the agent's value functions or decision making policies, enabling the handling of complex input spaces such as images or sensor readings. This approach has led to significant advancements in tackling problems such as playing video games, robotics control, and autonomous driving. As a result, expertise in RL constitutes a significant advantage in the industrial job market. By the end of the seminar, it is expected that students will gain proficiency in designing their own RL algorithms, enabling them to apply it to different areas such as robotics, recommendation systems, gaming, etc. to name a few, and also comprehend current literature in the field.
TeilnehmerInnen:
The seminar is aimed at all Bachelor- and Master- level students in the Informatik and the Techno-Mathematik courses. A maximum of 12 students can participate in the seminar.
Voraussetzungen:
As a prerequisite, this seminar will assume familiarity with probability, linear algebra, and programming in Python.
Lernorganisation:
The seminar is divided into six blocks (following an introductory session), each lasting two weeks. Every block consists of the following components:
* Week 1: Preparation of a presentation using prescribed sources (book chapters, video lectures, scientific articles).
* Week 2: Presentations by 2 participants, each lasting 25 minutes based on a topic assigned to each participant in the first session of the seminar.
Bereichseinordnung:
Studiendekanat Elektrotechnik, Informatik und Mathematik
Weitere Informationen aus Stud.IP zu dieser Veranstaltung
Heimatinstitut: Studiendekanat Elektrotechnik, Informatik und Mathematik (E)
In Stud.IP angemeldete Teilnehmer: 11
Anzahl der Dokumente im Stud.IP-Downloadbereich: 3
Betreute Abschlussarbeiten
laufende
2023
Erxleben, J. (2023). Entwicklung eines Algorithmus zur Identifikation und Klassifizierung relevanter Arbeitspunkte eines elektrischen Systems aus Momentanwert-Datensätzen.
beendete
2023
Engemann, T. (2023). Entwicklung einer Methodik zur automatischen Identifizierung, Klassifizierung und Modellierung betriebsrelevanter Arbeitspunkte eines elektrischen Netzes aus Echtzeitmesswerten.
Herzberg, M. (2023). Entwicklung eines echtzeitfähigen Photovoltaiksimulators auf Basis historischer Strahlungsdaten für einen Power Hardware-in-the-Loop Aufbau mit einem PV-Wechselrichter.
Heunda, J.E.W. (2023). Entwicklung, Optimierung und Vergleich von Methoden zur Erzeugung passiver Ersatzschaltbilder aus Messwerten einer Impedanzspektroskopie.
2022
Becker, H. C. (2022). Entwicklung, Implementierung und Verifizierung einer Schnittstellensynchronisation für die Kopplung von in Echtzeit simulierten Anlagen und Komponenten an einen PHiL Laboraufbau.
Hinzke, M. (2022). Untersuchung der Stabilität eines Power Hardware-in-the-Loop Teststandes unter der Verwendung eines Synchrongenerators als Schnittstelle zwischen Simulation und Hardware.
Landenfeld, Jakob (2022). Implementierung und Validierung einer Methode zur Stabilisierung von Power Hardware-in-the-Loop Simulationen mittels einer online-Impedanzmessung auf einem FPGA.
Landenfeld, Jakob (2022). Bestimmung der Stabilitätskriterien eines DC Power Hardware-in-the-Loop Aufbaus zur Untersuchung von Rippelstrom in Gleichstromsystemen.
Müller, E. (2022). Evaluation of different modelling approaches for battery aging to predict capacity fade for optimization of battery operation.
von Krosigk, J. (2022). Analyse und Bewertung einer Einsatzoptimierung für erneuerbare Energieanlagen in Kombination mit Batteriespeichersystemen im Multi-Use Betrieb.
2021
Erxleben, J. (2021). Untersuchung der Performance eines Pools aus Erneuerbaren Energien für die Erbringung von frequenzstützenden Maßnahmen.
von Krosigk, J. (2021). Untersuchung eines neuartigen Ansatzes zur kurz- und mittelfristigen Vorhersage der Netzfrequenz unter der Verwendung künstlicher neuronaler Netze.