(Senior) Site Reliability Engineer - STACKIT Control Plane (m/w/d)
- Du bringst mehr als 3 Jahre Erfahrung in Site Reliability Engineering, DevOps oder Platform Engineering mit, wobei dein Fokus auf dem Betrieb großer verteilter Systeme in Produktionsumgebungen liegt.
- Du besitzt Expertenwissen über die Interna der Kubernetes Control Plane, einschließlich API Server, Controller Manager, Scheduler und etcd.
- Du beherrschst Go sicher und schreibst produktionsreifen Code, um Automatisierungstools, Kubernetes Operatoren oder Integrations-Code zu entwickeln.
- Du verfügst über fundierte Erfahrung mit Infrastructure as Code und Container-Infrastrukturen sowie tiefgehende Kenntnisse in Linux-Interna (Kernel-Tuning, Memory Management) und Networking (TCP/IP, CNI, Load Balancer, eBPF).
- Du bringst Erfahrung im Betrieb von Datastores (z.B. PostgreSQL, Redis) und Messaging-Systemen (z.B. Kafka, NATS) in skalierbaren Umgebungen mit.
- Du gehst Problemen auf den Grund, um daraus zu lernen, automatisierst dich selbst aus dem Job und verlässt dich nicht auf das Prinzip Hoffnung.
- Du arbeitest eng mit den Entwicklungsteams zusammen, um die "Time-to-Detect" zu verkürzen, indem du unsere Monitoring- und Alerting-Infrastruktur verbesserst und die Einhaltung der SLOs sicherstellst.
- Deine Arbeit ist entscheidend für die kontinuierliche Optimierung der "Time-to-Mitigation"; dies erreichst du durch das Erstellen klarer Playbooks, das Design von Dashboards für First Responder und die Sicherstellung umfassender Telemetriedaten (Logs und Metriken).
- Du agierst als Reliability Consultant für die Entwicklungsteams, vermittelst Wissen über Reliability-Patterns und unterstützt den "Shift Left"-Ansatz, um ein Modell der geteilten Verantwortung zu etablieren.
- Du gestaltest und optimierst Entwicklungsprozesse wie CI/CD-Pipelines, um Progressive-Delivery-Strategien (z. B. Canary Releases und Blue/Green Deployments) zu unterstützen und Updates sicher und risikoarm auszurollen.
- Du analysierst proaktiv die Skalierbarkeit der Control Plane und behebst Engpässe in Bereichen wie Distributed Consensus, Datenbank-Durchsatz und Kernel-Level-Networking.
- Du nimmst an einer vergüteten On-Call-Rotation teil, leitest Incident Responses und moderierst Post-Mortems sowie Root Cause Analysen.
Einleitungstext
Schwarz Digits schafft das technologische Fundament für digitale Entscheidungsfreiheit in Europa. Als IT- und Digitalsparte der Schwarz Gruppe entwickeln und verantworten wir einerseits die IT-Infrastrukturen für die Handelssparten Lidl und Kaufland sowie die Schwarz Produktion und PreZero. Gleichzeitig agieren wir als unabhängiger Anbieter am externen Markt, um Unternehmen in ganz Europa bei ihrer digitalen Transformation zu unterstützen. Unsere Kernleistungen bündeln wir in den Bereichen Cloud, Cyber Security, Data & AI, Communication und Workspace. Trage auch du zur digitalen Entscheidungsfreiheit in Europa bei.
Bei uns arbeitest du an der Schnittstelle zwischen Agilität und Sicherheit: Du profitierst von den schnellen Entscheidungswegen, genießt echte Gestaltungsspielräume in deinen Projekten und baust dabei auf das stabile Fundament der Schwarz Gruppe.
Deine Aufgaben
Empfohlene Jobs
Fortbildungsmanager (alle*) im Gesundheitswesen
Gesundheit ist in unserer komplexen Welt ein wertvoller Besitz. Damit wir alle unser Leben frei nach den eigenen Wünschen gestalten können, arbeiten in Baden-Württemberg engagierte Hausärzt:innen jed…
Pflegefachkraft (m/w/d) für die Psychiatrie
Klinikum Stuttgart - Entscheiden Sie sich für etwas Großes. Wir sind mit unseren drei Häusern „Katharinenhospital“, „Olgahospital“ und „Krankenhaus Bad Cannstatt“ das größte Klinikum in Baden-Würt…
AUSHILFE (a) BEN ZUCKER - Drinnen 2026- STUTTGART
Du willst dort arbeiten, wo andere feiern? Dann haben wir den perfekten Job für Dich! Event: BEN ZUCKER - Drinnen 2026 Wo: LÜNEBURG, BRAUNSCHWEIG, BERLIN, ZWICKAU, DRESDEN, ROSTOCK, LINGEN, KÖLN, …
(Senior) SAP Projektmanager (m/w/d)
Deine Rolle in unserem Team Du übernimmst die Hauptverantwortung für die Durchführung und das Management anspruchsvoller Projekte zur Systemimplementierung und -erweiterung von SAP Logistik Lös…
Verkäufer Bäckerei (m/w/d)
Ihre Aufgaben Beratung: Sie haben eine Leidenschaft für den Verkauf und die Kundenberatung Warenpräsenz: Sie sind zuständig für eine ansprechende Präsentation sowie die Kontrolle der Frische u…
Duales Studium: Wirtschaftsingenieurwesen - Elektrotechnik
Das sind die Modulbereiche Das zeichnet Dich aus Sehr gute bis gutes Abitur oder Fachhochschulreife (hier: + Studierfähigkeitstest) Sehr gute bis gute Kenntnisse in der Mathematik, Physik, …
Sozialarbeiter (m/w/d)
Warum Promedis24? Weil wir überzeugt sind: Arbeit darf Freude machen, Sinn stiften und inspirieren. Bei uns bist du keine Nummer, sondern ein wichtiger Teil des Ganzen. Du bringst Menschen zum Strah…
Verkäufer mit Stellvertretung 28-35 Std./Woche Teilzeit (m/w/d) (Stuttgart)
Einleitung Wir finden, unsere Kunden verdienen nur das Beste. Dich zum Beispiel. Du erfüllst Kundenwünsche am laufenden Band und behältst als echtes Verkaufstalent immer den Überblick. Wir sind fr…
Industriemechaniker (m/w/d)
Unser Kunde am Standort Stuttgart ist ein führendes Unternehmen im Bereich der Verpackungsveredelung. Mit speziellen Druckfarben wird hier die Verpackung von Lebensmitteln innovativ und ansprechend g…
Inhouse Consultant HR IT - ServiceNow & SAP SuccessFactors Expert (gn)
Ausbildung : Erfolgreich abgeschlossenes Studium der (Wirtschafts-)Informatik, Betriebswirtschaftslehre mit HR-/IT-Schwerpunkt oder eine vergleichbare Qualifikation mit entsprechender Berufserfahrun…