Lehrende: Dr.-Ing. Christof Leng
Veranstaltungsart: Vorlesung
Orga-Einheit: FB20 Informatik
Anzeige im Stundenplan: SRE
Fach:
Anrechenbar für:
Semesterwochenstunden: 2
Unterrichtssprache: Englisch
Min. | Max. Teilnehmerzahl: - | -
Lehrinhalte: Die Veranstaltung beschäftigt sich mit der Implementierung und dem Betrieb von Services. Heutzutage stellt der Betrieb von skalierbaren, zuverlässigen und effizienten Internet-Services einen zentralen Aspekt vieler Geschäftsmodelle dar. Allerdings sind klassische Betriebsmethoden oft inkompatibel mit der hohen Änderungsrate modernerer Softwareentwicklung und deren kurzer Release-Zyklen. Oft wird DevOps als ein Ansatz zur Lösung dieses Konflikts genannt. Die Vorlesung gibt einen Überblick zu Site Reliability Engineering (SRE), ein DevOps-Ansatz, der ursprünglich von Google entwickelt wurde. Die in der Veranstaltung behandelten Themen umfassen das Design, Deployment und Wartung von großen verteilten Systemen. Sowohl organisatorische als auch technische Aspekte werden abgedeckt, u.a. Automatisierung, Service Level Agreements (SLAs), Monitoring, Incident Management, Kapazitätsplanung und Datenintegrität. - Beyer B.; Jones, C.; Petoff, J.; Murphy, N. R.: Site Reliability Engineering - How Google Runs Production Systems. O'Reilly. 978-1-491-92912-4 - Treynor, B.: Keys to SRE. Usenix SREcon'14. https://www.usenix.org/conference/srecon14/technicalsessions/ presentation/keys-sre - Allspaw, J.; Robbins, J.: Web Operations - Keeping the Data On Time. O'Reilly. 978-1-4493-7744-1 - Krishan, K.: Weathering the Unexpected - Failures happen, and resilience drills help organizations prepare for them. Communications of the ACM, vol. 55, no. 11, November 2012.
Voraussetzungen: Grundwissen in verteilten Systemen und Software Engineering.