In this module, you will study the architecture and programming of GPUs. Please find below a brief outline of the lectures:
- Review of computer architecture basics - measuring performance, benchmarks, five-stage RISC pipeline, caches
- GPU basics - the evolution of GPU computing, a high-level overview of a GPU architecture
- GPU programming with CUDA - program structure, CUDA threads organization, warp/thread-block scheduling
- GPU (micro) architecture - streaming multiprocessors, single instruction multiple threads (SIMT) core design, tensor cores for deep learning, RT cores for ray tracing, mixed-precision support
- GPU memory hierarchy - banked register file and operand collectors, shared memory, GPU caches (differences w.r.t. CPU caches), global memory
- Branch and memory divergence - branch handling, stack-based reconvergence, memory coalescing, coalescer design
- Barriers and synchronization
- Temporal and spatial locality exploitation challenges in GPU caches
- Global memory- high throughput requirements, GDDR/HBM, memory bandwidth optimization techniques
- GPU research issues - performance bottlenecks, GPU power modeling, high-power consumption/energy efficiency, GPU security
- Application case study - deep learning
- Cycle-accurate simulators for GPUs
In addition to lectures, a semester-long problem-based project will augment the learning in the lectures. Several topics related to GPUs will be proposed. You are required to choose a topic and work on it. It is possible to work in groups. There will be (bi-) weekly meetings to discuss progress and problems.
In addition to the semester-long project, there will be assignments to teach CUDA programming.
Course Evaluation: Oral examination
Duration: 30 minutes
Voraussetzungen:
- Basic course on computer architecture and C/C++ programming
Lernorganisation:
- Weekly lecture
- Weekly lab
Leistungsnachweis:
Oral exam + Lab assignments
Bereichseinordnung:
Studiendekanat Elektrotechnik, Informatik und Mathematik
ECTS-Kreditpunkte:
6
Weitere Informationen aus Stud.IP zu dieser Veranstaltung
Heimatinstitut: Institut für Massively Parallel Systems (E-EXK5)
In Stud.IP angemeldete Teilnehmer: 82
Anzahl der Postings im Stud.IP-Forum: 2
Anzahl der Dokumente im Stud.IP-Downloadbereich: 1
Betreute Abschlussarbeiten
laufende
2023
Erxleben, J. (2023). Entwicklung eines Algorithmus zur Identifikation und Klassifizierung relevanter Arbeitspunkte eines elektrischen Systems aus Momentanwert-Datensätzen.
beendete
2023
Engemann, T. (2023). Entwicklung einer Methodik zur automatischen Identifizierung, Klassifizierung und Modellierung betriebsrelevanter Arbeitspunkte eines elektrischen Netzes aus Echtzeitmesswerten.
Herzberg, M. (2023). Entwicklung eines echtzeitfähigen Photovoltaiksimulators auf Basis historischer Strahlungsdaten für einen Power Hardware-in-the-Loop Aufbau mit einem PV-Wechselrichter.
Heunda, J.E.W. (2023). Entwicklung, Optimierung und Vergleich von Methoden zur Erzeugung passiver Ersatzschaltbilder aus Messwerten einer Impedanzspektroskopie.
2022
Becker, H. C. (2022). Entwicklung, Implementierung und Verifizierung einer Schnittstellensynchronisation für die Kopplung von in Echtzeit simulierten Anlagen und Komponenten an einen PHiL Laboraufbau.
Hinzke, M. (2022). Untersuchung der Stabilität eines Power Hardware-in-the-Loop Teststandes unter der Verwendung eines Synchrongenerators als Schnittstelle zwischen Simulation und Hardware.
Landenfeld, Jakob (2022). Implementierung und Validierung einer Methode zur Stabilisierung von Power Hardware-in-the-Loop Simulationen mittels einer online-Impedanzmessung auf einem FPGA.
Landenfeld, Jakob (2022). Bestimmung der Stabilitätskriterien eines DC Power Hardware-in-the-Loop Aufbaus zur Untersuchung von Rippelstrom in Gleichstromsystemen.
Müller, E. (2022). Evaluation of different modelling approaches for battery aging to predict capacity fade for optimization of battery operation.
von Krosigk, J. (2022). Analyse und Bewertung einer Einsatzoptimierung für erneuerbare Energieanlagen in Kombination mit Batteriespeichersystemen im Multi-Use Betrieb.
2021
Erxleben, J. (2021). Untersuchung der Performance eines Pools aus Erneuerbaren Energien für die Erbringung von frequenzstützenden Maßnahmen.
von Krosigk, J. (2021). Untersuchung eines neuartigen Ansatzes zur kurz- und mittelfristigen Vorhersage der Netzfrequenz unter der Verwendung künstlicher neuronaler Netze.