Od 20 lat specjalizujemy się w pozyskiwaniu profesjonalistów z szeroko pojętej branży informatycznej oraz branż pokrewnych. Nasza główna siedziba znajduje się we Wrocławiu. Od 2017 roku spółka działa pod nazwą IFIRMA SA, jednak usługi rekrutacyjne niezmiennie świadczymy jako Power Media. Jesteśmy ekspertami w łączeniu wykwalifikowanych talentów z pracodawcami, którzy ich poszukują. Nawiązujemy trwałe relacje z naszymi klientami zarówno na rynku polskim, jak i zagranicznym.
Nr wpisu do Rejestru Agencji Zatrudnienia: 1264
SRE/DevOps Engineer
Firma technologiczna, z główną siedzibą w USA (New York), rozwijającą zaawansowaną platformę AI dla branży medycznej, wspierającą optymalizację procesów w szpitalach i placówkach opieki zdrowotnej. Pomagają zmniejszać koszty operacyjne, eliminować nieefektywności i poprawiać doświadczenia pacjentów. Ich platforma wykorzystuje sztuczną inteligencję (AI), analizę danych w czasie rzeczywistym (RTLS, EHR) oraz automatyzację do zarządzania personelem, sprzętem i przestrzenią medyczną.
Stanowisko: Site Reliability Engineer.
Model pracy: hybrydowy lub w pełni zdalny.
Zakres obowiązków
- Projektowanie i utrzymanie wysoce dostępnej, odpornej na awarie i skalowalnej infrastruktury chmurowej (AWS).
- Wdrażanie i monitorowanie SLOs, SLIs oraz SLAs w celu śledzenia niezawodności systemu i optymalizacji jego dostępności.
- Nadzór nad wdrożeniami platformy produkcyjnej.
- Monitorowanie opóźnień, ruchu, błędów i kondycji systemu przy użyciu nowoczesnych narzędzi do obserwowalności.
- Przeprowadzanie analiz przyczyn źródłowych (RCA) i post-mortem, aby stale zwiększać odporność systemu.
- Automatyzacja zarządzania infrastrukturą za pomocą Terraform, Ansible lub Pulumi.
- Wdrażanie CI/CD pipelines, zapewniając płynne i bezpieczne wdrożenia.
- Tworzenie mechanizmów samonaprawczych przy użyciu operatorów Kubernetes, auto-skalowania i detekcji awarii.
- Zapewnienie zgodności z regulacjami HIPAA, GDPR oraz innymi przepisami dotyczącymi ochrony danych w sektorze zdrowia.
- Definiowanie i realizacja planów awaryjnych (Disaster Recovery – DR) oraz strategii ciągłości działania.
- Zarządzanie i optymalizacja środowisk AWS pod kątem wydajności i kosztów.
- Wdrażanie i utrzymanie narzędzi do obserwowalności, budowanie frameworków alertowania i reakcji w czasie rzeczywistym.
- Tworzenie i wdrażanie najlepszych praktyk w zakresie logowania, debugowania i monitorowania wydajności.
- Udział w całodobowych dyżurach on-call (24/7) - średnio 1 x w miesiącu
Firma oferuje
- Stałą współpracę na podstawie umowy o pracę lub B2B,
- Możliwość udziału w akcjach firmy,
- Pracę nad innowacyjną platformą AI dla sektora healthcare,
- Możliwość pracy przy projektach mających wpływ na przyszłość technologii medycznej
- Pracę w międzynarodowym środowisku (współpraca z zespołem z USA),
- Możliwość w pełni zdalnej lub hybrydowej (biuro w Krakowie),
- Pracę w zespole ekspertów AI, DevOps i Data Science,
- Elastyczny czas pracy i duża autonomia w działaniu,
- Realny wpływ na rozwój platformy, która poprawia jakość opieki zdrowotnej,
- Benefity: prywatna opieka medyczna i system kafeteryjny.
Wymagania
- Minimum 4 lata doświadczenia w roli Site Reliability Engineer
- Bardzo dobra znajomość Kubernetes, Docker i AWS,
- Doświadczenie w automatyzacji infrastruktury z użyciem Terraform, Ansible lub Pulumi,
- Umiejętność analizy i optymalizacji systemów pod kątem wydajności i kosztów,
- Znajomość systemów monitoringu i logowania (Prometheus, Grafana, ELK, OpenTelemetry),
- Dobra znajomość języka Python, Golang lub Bash w zakresie automatyzacji,
- Doświadczenie w pracy z systemami przetwarzania danych w czasie rzeczywistym (Kafka, streaming),
- Znajomość najlepszych praktyk w zakresie cyberbezpieczeństwa, zarządzania siecią i load balancingu,
- Bardzo dobra znajomość j. angielskiego (min. B2) – codzienna praca w międzynarodowym zespole,
- Mile widziane: doświadczenie w branży medycznej i znajomość regulacji (HIPAA, GDPR).