Service Framework Operations Lead (m/w/d)
Freiberuflich in: Remote & Berlin
Dauer: 3 Monate
100% Auslastung
Start: ASAP
Dauer: 3 Monate
Auslastung: Vollzeit
Lokation: Remote & Berlin (mind. 1 Woche am Stück pro Monat vor Ort)
Projektbeschreibung:
Das EDP-Team baut eine interne Plattform für Software-Produktentwickler der Elia-Gruppe auf, um die Entwicklung und Bereitstellung von Softwareprodukten zu beschleunigen, um die großen Herausforderungen im Energiesektor zu bewältigen.
Die EDP-Plattform ist eine serviceorientierte, Cloud-native Plattform, um Anwendungs-Teams Self-Service-Fähigkeiten für die Entwicklung, die Ausführung und den Betrieb ihrer Software-Produkte zu bieten.
Das Service-Framework-Team innerhalb der EDP-Programmorganisation ist für die Entwicklung von Kerndiensten einer privaten Cloud-Plattform, wie z. B. ein verwaltetes Kubernetes-Angebot und zugehörige Dienste für Lebenszyklus- und Ressourcenmanagement.
Die Organisation der Produktlinie ist um den Bereitstellungsprozess herum strukturiert, einschließlich Produktmanagement, Architektur, Produktbereitstellung und Produktbetrieb.
Aufgaben:
* Leitung der Betriebsteams, wobei der Schwerpunkt auf der Gewährleistung von Stabilität und Zuverlässigkeit im Betrieb unserer Dienste liegt
* Verantwortlich für die Einrichtung von Strukturen und Prozessen für den Betrieb, die Wartung und das Management unserer Dienste und Produkte
* Sicherstellung der Verfügbarkeit und Zuverlässigkeit unserer Hybrid-Cloud Plattform-Dienste
* Enge Zusammenarbeit mit den Bereichen Kundenerfolg, Plattformbetrieb, Software-Ingenieure, DevOps-Teams und anderen Stakeholdern, um die Leistung und Verfügbarkeit unserer Dienste zu verbessern
* Etablierung und späterer Einsatz von Prozessen für Incident-, Problem- und Change-Management innerhalb der Data Product Line in enger Zusammenarbeit mit dem Operations-Team des EDP-Programms
* Beaufsichtigung und proaktives Management interner und externer Abhängigkeiten zusammen mit den Architekten, dem Produktmanagement und der Lieferung, um die betrieblichen Auswirkungen zu minimieren
* Zusammenarbeit und Validierung mit dem Product Delivery Lead in der Bereitschaftsphase von Produkten, bevor diese innerhalb der Produktlinie in Betrieb genommen werden
* Qualitätssicherung: Zusammenarbeit mit den Mitgliedern des QA-Teams, Implementierung und Durchsetzung von Qualitätssicherungsmaßnahmen, um die hohe Qualität der gelieferten Produkte und Dienstleistungen zu gewährleisten
* Identifizierung von Möglichkeiten für Prozessverbesserungen, Effizienzsteigerungen und Kompetenzentwicklung innerhalb der betreffenden Teams
* Effektive Nutzung und Integration von Beobachtungsmöglichkeiten in unsere Betriebsprozessen, wobei Sie als Anforderer gegenüber Stakeholder, um die Leistung unserer Dienste anhand von SLIs und SLOs zu erfassen und zu messen
* Proaktive Identifizierung und Abschwächung von Risiken, die sich auf die Servicequalität auswirken können, um einen reibungslosen Betrieb zu gewährleisten
Muss-Anforderungen:
* Mindestens 4 Jahre Betriebserfahrung mit produktiven Anwendungen oder Systemen (idealerweise containerisiert und verteilt)
* Gründliche Kenntnisse in den Bereichen Containerisierung und Container-Management, Paketierung von Anwendungen und Anpassung von Implementierungen
* Grundlegendes Verständnis der Kernbetriebsprozesse (Incident Management, Change Management, Problemmanagement, IT-Service-Management)
* Erfahrung in der Gewinnung betrieblicher Erkenntnisse aus der Überwachung oder Beobachtung, einschließlich SLI/SLA/SLO Management und Verfolgung
* Fundierte Kenntnisse und Implementierungserfahrung mit CI/CD-Prozessen, -Tools, -Konzepten und der damit verbundenen Qualitäts- und Sicherheitssicherung für die Softwarebereitstellung
* Fließende Englisch- (mind. C1) und Deutsch-Kenntnisse (mind. B1)
Soll-Anforderungen:
* Beherrschung der ukrainischen Sprache in Wort und Schrift (mind. C1)
* Vertrautheit mit öffentlichen Cloud-Plattformen (z. B. GCP, Azure) und deren Diensten
* Vertrautheit mit Infrastructure-as-code-Konzepten und -Tools
* Erfahrung mit dem Betrieb von Hyperscalern (GCP und andere)
* Grundlegendes Verständnis von Kubernetes und den damit verbundenen Auswirkungen des Betriebs von Infrastructure-as-Service