Lehrende: Prof. Dr. rer. nat. Carsten Binnig; Manisha Luthra
Veranstaltungsart: Seminar
Orga-Einheit: FB20 Informatik
Anzeige im Stundenplan: 20-00-1182-se
Fach:
Anrechenbar für:
Semesterwochenstunden: 3
Unterrichtssprache: Englisch
Min. | Max. Teilnehmerzahl: - | -
Digitale Lehre: Moodle: https://moodle.informatik.tu-darmstadt.de/course/view.php?id=1500
Lehrinhalte: Datenbankmanagementsysteme (DBMS) in der Cloud sind das Rückgrat für die effiziente Verwaltung großer Datenmengen und spielen daher heute eine zentrale Rolle in Wirtschaft und Wissenschaft. Um eine hohe Leistung zu erzielen, müssen viele der komplexesten DBMS-Komponenten wie Abfrageoptimierer oder Scheduler nicht-triviale Probleme lösen. Um solche Probleme zu lösen, haben jüngste Arbeiten eine neue Richtung sogenannter "learned DBMS components" aufgezeigt, bei denen KI-basierte Methoden eingesetzt werden, um zentrale DBMS-Komponenten durch Ki-basierte Lösungen zu ersetzen und zu verbessern. Dieser Weg ist besonders interessant, da Cloud-Anbieter wie Google, Amazon und Microsoft diese Techniken bereits anwenden, um die Leistung ihrer Cloud-Datensysteme zu optimieren. Darüber hinaus wurde KI auch zur Verbesserung vieler anderer Aufgaben im Zusammenhang mit der Datenverwaltung eingesetzt, wie z. B. Aufgaben des "Data Engineering" (z.B. Fehlererkennung und -korrektur in Datenbanken oder Datentransformationen), die in der Regel einen hohen manuellen Aufwand verursachen und durch den Einsatz von KI automatisiert werden können. Schließlich wird KI auch zur Erweiterung von Datenbanken durch bessere Datenzugriffsschnittstellen (z. B. Abfragen in natürlicher Sprache und Chatbots für Daten) oder zur Unterstützung von Daten jenseits strukturierter tabellarischer Daten (z. B. Text und Bilder) eingesetzt. Dieses Seminar dient dem Zweck, die grundlegenden Konzepte zu verstehen, wie KI für das Datenmanagement eingesetzt werden kann. Im ersten Teil des Seminars lernen die Teilnehmer die Grundlagen der KI für das Datenmanagement kennen und implementieren selbst eine Fallstudie. Im zweiten Teil wählt jeder Teilnehmer eine aktuelle Forschungsarbeit aus und präsentiert sie. Bei den Arbeiten handelt es sich in der Regel um aktuelle Veröffentlichungen in einschlägigen Forschungseinrichtungen und Fachzeitschriften wie SIGMOD, VLDB oder ICML, NeurIPS.
Voraussetzungen: Empfohlen: Grundkenntnisse in maschinellem Lernen und Programmierung in Python und idealerweise C++. Fortgeschrittene Kenntnisse in Datenmanagement und Datenbanksystemen durch den Besuch von Kursen wie SDMS oder ADMS.
Weitere Informationen: Der Seminar-Kickoff findet am 17.10.2023 von 09:50-11:30 statt (Raum wird auf Moodle angekündigt). Dort werden wir die Organisation des Seminars besprechen. Weitere Informationen finden Sie unter: http://tuda.systems