Senior Site Reliability Engineer (SRE) (m/w/d), 100% Remote möglich
Stellenbeschreibung
Du sorgst als Teil des Site Reliability Engineering Teams dafür, dass die nicht-funktionalen Eigenschaften (Performance, Stabilität, Effizienz und Sicherheit) unseres Systems die hohen Erwartungen unserer Kunden erfüllen. Du bist begeisterter Infrastructure-Software-Engineer und befähigst mit deinem Code unsere Entwicklungs- und Customer-Success-Teams die beste Mitarbeiterapp für Blue-Collar-Workers bereitzustellen. Du hast Spaßan unseren topaktuellen Technologien und liebst es, bei der Lösung anspruchsvoller Problemstellungen mit deiner Kreativität und deinem Biss über dich hinauszuwachsen.
Deine Aufgaben:
- Elastic Computing: Du hilfst uns dabei, bis in den Himmel zu skalieren. Dazu baust du unseren Kubernetes-basierenden Stack weiter aus und treibst die Weiterentwicklung unsrer System- und Softwarearchitektur voran
- Zero Downtime: Du arbeitest daran, dass Flip möglichst immer verfügbar ist. Zero-Downtime-Rollouts, Redundanzkonzepte und Migrationsstrategien sind dein Thema.
- Visibility and Troubleshooting: Du entwickelst unser Systemmonitoring, -profiling und unsere Log-Aggregation weiter und identifizierst aufziehende Probleme
- Security and Privacy: Du sorgst dafür, dass Flip eine sichere Anwendung bleibt und die Privatsphäre unserer Anwender schützt.
- Safety and Resilience: Du kümmerst dich um die Betriebssicherheit und die Belastbarkeit unseres System und treibst Verbesserungen in diesem Feld voran
- Infrastructure-Engineering: Du entwirfst, entwickelst und optimierst unsere Produktions-, Entwicklungs- und Hostinginfrastruktur
- Platform-Management: Du entwickelst unser Developer Tooling und unser Provisioning- und Management-System für den Plattformbetrieb weiter (python/django) und sorgst so dafür, dass unsere Engineers und unser Customer-Success-Team effizient arbeiten kann
- CI/CD: Du hilfst uns dabei, unsere CI/CD-Pipeline weiter zu verbessern und verhilfst dem Team somit zu noch schnelleren Feedback-Zyklen und sehr guter Testplattformen
Qualifikationen
Anforderungen:
- Betrieb von hochskalierbaren, verteilten Cloud- und Clustersystemen
- Kubernetes und Docker
- System Management Knowhow &Linux System Internals
- Metrics, Alerting und Logging (z.B. Loki, Grafana, Zabbix und Sentry)
- Software Entwicklung (z.B. Python, Kotlin, Go, …)
- Scripting (Bash &Make)
- Verhandlungssicheres Deutsch und Englisch
Should-Have:
- Cloud-Infrastruktur (z.B. Azure, AWS, GCP)
- PostgreSQL bzw. relationale Datenbanken
- Django Framework
- Message Queueing, Event Streaming (RabbitMQ, NATS, ...)
- Helm
- Agile Arbeitsstrukturen: Scrum und Kanban
Nice-to-Have:
- On Premise Knowhow
- Gitlab CI
- Pulumi
- ArgoCD
Good-To-Know
- Wir fördern deine kreative Ideen, neue Wege und deine Weiterbildung;Der Mastery Day ist ein Tag im Sprint an dem du eigene Visionen umsetzten oder deine Skills verbessern kannst
- Flexibles Arbeiten in unserem flippigen Büro in Stuttgart, 100% Remote möglich
- Abhängig von Berufserfahrung und Qualifikationen kann das Gehalt verhandelt werden
Lass dich von unseren Mitarbeiter:innen überzeugen: https://www.kununu.com/de/flip-app/kommentare
#K8s #Docker #Python #Go #PostgreSQL #CICD #Git #GitLab #YouTrack #HomeOffice #Remote #Developer #RemoteDeveloper #Entwickler #Scrum #Agile #Sprint #Stuttgart #StartUp