Lehrende: Prof. Dr.-Ing. Henning Puder
Veranstaltungsart: Vorlesung
Orga-Einheit: FB18 Elektrotechnik und Informationstechnik
Anzeige im Stundenplan: E: VLSprachAudioVer.
Fach:
Anrechenbar für:
Semesterwochenstunden: 2
Unterrichtssprache: Deutsch
Min. | Max. Teilnehmerzahl: - | -
Lehrinhalte: Verfahren der Sprach- und Audiosignalverarbeitung: Einführung in die Modelle von Sprach- und Audiosignalen sowie grundlegende Methoden der Audiosignalverarbeitung. Verfahren der codebuchbasierten Verarbeitung und der Audiocodierung. Beamforming zur räumlichen und Geräuschreduktion zur spektralen Filterung. Cepstrale Filterung und Sprachgrundfrequenzschätzung. Mel-filtered cepstral coefficients (MFCCs) als Grundlage für die Sprecher- und Spracherkennung. Klassifikations-methoden basierend auf GMM (Gaussian mixture models) sowie Spracherkennung mit HMM (Hidden markov models). Einführung in die Methoden der Musiksignalverarbeitung, z.B. Shazam-App oder Beat-Erkennung.
Literatur: Folien, für weiter Literaturhinweise siehe Homepage der Vorlesung
Voraussetzungen: Für die Vorlesung werden gute Kenntnisse der statistischen Signalverarbeitung (Minimum: Vorlesung „Digital Signal Processing“) vorausgesetzt. Wünschenswert – aber nicht zwingend notwendig – sind zusätzlich Kenntnisse über adaptive Filter.
Online-Angebote: moodle