Track This Job
Add this job to your tracking list to:
- Monitor application status and updates
- Change status (Applied, Interview, Offer, etc.)
- Add personal notes and comments
- Set reminders for follow-ups
- Track your entire application journey
Save This Job
Add this job to your saved collection to:
- Access easily from your saved jobs dashboard
- Review job details later without searching again
- Compare with other saved opportunities
- Keep a collection of interesting positions
- Receive notifications about saved jobs before they expire
AI-Powered Job Summary
Get a concise overview of key job requirements, responsibilities, and qualifications in seconds.
Pro Tip: Use this feature to quickly decide if a job matches your skills before reading the full description.
Site Reliability Engineer (m/w/d) – Fokus Behördeninfrastruktur & Einsatzbetrieb
Gehalt: 110.000–160.000 € jährlich (je nach Level L3–L4)
Standort: 100% Remote
Arbeitsmodell: Vollzeit
Sprachen: Deutsch (C1+), Englisch (C1+)
Bereich: SRE, Kubernetes on-prem, GitOps, Security, Compliance
Sicherheitsanforderungen: EU/NATO-Staatsbürgerschaft
Über das Unternehmen:
Für ein innovatives Technologieunternehmen, das kritische Systeme für staatliche Sicherheitsbehörden betreibt, suchen wir eine:n Site Reliability Engineer (m/w/d) mit echter operativer Stärke.
In dieser Rolle stellst du die Stabilität, Sicherheit und Auditfähigkeit komplexer On-Premises-Infrastrukturen sicher, direkt in den Rechenzentren deutscher und europäischer Behörden.
Du arbeitest mit modernster Technologie, trägst Verantwortung für hochverfügbare Plattformen und hast gleichzeitig die Möglichkeit, echte Wirkung zu entfalten. Wenn du operative Exzellenz liebst und gerne dort arbeitest, wo Zuverlässigkeit zählt, bist du hier genau richtig.
Deine Aufgaben:
Technischer Betrieb & Plattformverantwortung
- Installation, Betrieb und Härtung von Kubernetes-Clustern in behördlichen RZs
- Aufbau und Pflege von GitOps-Pipelines (Argo CD/Flux), Helm/Kustomize, Artifact Registries
- Implementierung von Observability-Stacks (Prometheus, Grafana, Loki, OpenTelemetry) inkl. SLA-gerechter Dashboards und Alerting
Incident Response & Einsatzbetrieb
- Vor-Ort-Einsatz als Incident Commander bei Störungen und sicherheitskritischen Situationen
- Koordination mit IT-Security, internen Engineering-Teams und juristischen Stellen
- Durchführung von Root-Cause-Analysen und Erstellung gerichtsfester Incident-Reports
Security, Compliance & Audits
- Netzwerksegmentierung, TLS/mTLS, Keycloak/OPA-Policies, Vulnerability-Management
- Backup-, Restore- und DR-Prozesse unter gesetzlichen oder gerichtlichen Vorgaben
- Erstellung von Audit-Evidenzen, Runbooks, DPIA-Dokumentation und chain-of-custody-Nachweisen
Training & Zusammenarbeit
- Schulung von Administrator:innen und Analyst:innen im Betriebs- und Störungsmanagement
- Enge Abstimmung mit Plattform-, Security- und Infrastrukturteams
Dein Profil:
Technische Skills
- 5–8 Jahre Erfahrung als SRE/DevOps Engineer, idealerweise mit On-Call-Verantwortung
- Tiefes Know-how in Kubernetes (on-prem/hybrid), GitOps, Helm/Kustomize, Automatisierung (Ansible, Terraform)
- Souveräner Umgang mit Observability, Incident Response und Sicherheitsarchitekturen
- Erfahrung in regulierten Umgebungen (öffentlicher Sektor, Finance, Healthcare o. Ä.)
- Starke Skriptkenntnisse (Bash, Python) und sichere Handhabung von CI/CD in eingeschränkten Netzwerken
- Sehr gute Kenntnisse in IAM, Secrets Management, TLS/mTLS, SIEM-Integration
Persönliche Eigenschaften
- Verantwortungsbewusst, sicherheitsbewusst, absolut vertrauenswürdig
- Klare Kommunikation – auch unter Stress – und strukturierte Arbeitsweise
- Präzise, belastbare Dokumentation in Deutsch und Englisch
- Freude an operativen Einsätzen und enger Zusammenarbeit mit Behörden
Nice-to-have
- Kenntnisse behördlicher IT-Strukturen
- Zertifizierungen wie CKA/CKAD, ISO 27001, CISSP oder GDPR Practitioner
- Erfahrung mit digitalen Beweis- und Logging-Systemen
Das wird geboten:
- Remote-first in Deutschland – mit regelmäßigen Team-Events in Berlin
- Home-Office-Budget & Top-Equipment
- 30 Tage Urlaub für echte Erholung
- Mission-getriebene Rolle mit hoher gesellschaftlicher Relevanz
- Stabile, langfristige Partnerschaften im Public Sector
- Moderne Tooling-Landschaft (Kubernetes, GitOps, Observability)
- Field-Stipendien, hochwertige Ausrüstung und Compliance-Trainings
- Hoher Einfluss auf Stabilität, Sicherheit und Qualität kritischer Systeme
- Ein Umfeld, das Professionalität, Verantwortung und Hands-on-Mentalität ernst nimmt
Interesse geweckt?
Wenn du operative Verantwortung übernehmen willst – und Teil eines Teams sein möchtest, das kritische Infrastrukturen für Behörden stabil, sicher und auditfest betreibt – dann freue ich mich auf deine Bewerbung.
Kontakt:
Patrick Hofmann
Consultant | DevOps & Cloud | Permanent Solutions
📞 +49 170 6540025
🌐 www.zabelglobal.com
Key Skills
Ranked by relevanceReady to apply?
Join ZABEL and take your career to the next level!
Application takes less than 5 minutes

