Track This Job
Add this job to your tracking list to:
- Monitor application status and updates
- Change status (Applied, Interview, Offer, etc.)
- Add personal notes and comments
- Set reminders for follow-ups
- Track your entire application journey
Save This Job
Add this job to your saved collection to:
- Access easily from your saved jobs dashboard
- Review job details later without searching again
- Compare with other saved opportunities
- Keep a collection of interesting positions
- Receive notifications about saved jobs before they expire
AI-Powered Job Summary
Get a concise overview of key job requirements, responsibilities, and qualifications in seconds.
Pro Tip: Use this feature to quickly decide if a job matches your skills before reading the full description.
⏰ Start: ASAP 👈
Cześć! 👋
Dla naszego klienta poszukujemy ML Engineera z doświadczeniem w tworzeniu środowisk reinforcement learning (RL) oraz skalowalnych systemów ewaluacji modeli. Klient to wiodący dostawca rozwiązań do oceny i optymalizacji systemów AI. Z ich rozwiązań korzysta wiele międzynarodowych firm by doskonalic agentów AI i wykrywać problemy wydajnościowe dużych modeli językowych. Firma działa na styku AI, system engineeringu i badań nad AGI.
W zespole będziesz mieć realny wplyw na kształtowanie sposobu, w jaki przyszłe modele AI będą trenowane, dostrajane i oceniane. Będziesz odpowiadać m.in. za projektowanie i implementację zaawansowancyh środowisk RL - dlatego jest to dla nas kluczowa kompetencja. W zakres Twojej odpowiedzialności będzie wchodzić również tworzenie skalowalnych systemów kształtujących zachowanie nowoczesnych modeli AI.
Praca w małym, wysoko wyspecjalizowanym zespole inżynierów i scientists. Ze względu na strefę czasową klienta, chcielibyśmy znaleźć kandydata, który może pracować do godziny 17:00, a okazjonalnie do 18:00.
Codzienne Zadania
📍 Projektowanie i implementacja środowisk RL wspierających dużą skalę eksperymentów i ewaluacji agentów
📍 Budowa pipeline’ów do generowania zadań, dynamicznych zbiorów danych i symulowanych środowisk (o różnej złożoności i losowości)
📍 Tworzenie modeli nagród oraz weryfikatorów, które automatycznie oceniają trajektorie i rozumowanie modeli
📍 Współpraca z infrastructure and systems engineers przy skalowaniu, telemetryzacji i zapewnianiu powtarzalności środowisk
📍 Projektowanie API i frameworków do orkiestracji eksperymentów, resetowania i oceny agentów
📍 Optymalizacja wydajności środowisk, logowania oraz reprodukowalności nagród w środowiskach rozproszonych
Wymagania
⚡️ 5 lat doświadczenia w obszarze data science, ML infrastructure lub pokrewnych
⚡️ Bardzo dobra znajomość Pythona i programowania systemowego
⚡️ Znajomość koncepcji reinforcement learningu (modelowanie nagród, dynamika środowiska, weryfikacja i ewaluacja agentów)
⚡️ Wiedza z zakresu monitoringu, metryk i pipeline’ów danych dla ewaluacji RL
⚡️ Doświadczenie z frameworkami RL lub symulacyjnymi (Gymnasium, PettingZoo, Isaac Gym, Ray RLlib, itp.)
⚡️ Doświadczenie w projektowaniu skalowalnych pipeline’ów zadań, symulacjach przeglądarkowych lub API (np. Playwright, Selenium) lub frameworków obliczeń rozproszonych
⚡️ Angielski umożliwiający swobodną komunikację w międzynarodowym zespole
Mile Widziane
⚡️ Zainteresowanie obszarem AI safety / AGI alignment
Jak działamy i co oferujemy?
🎯 Stawiamy na otwartą komunikację zarówno w procesie rekrutacji jak i po zatrudnieniu - zależy nam na klarowności informacji dotyczących procesu i zatrudnienia
🎯 Do rekrutacji podchodzimy po ludzku, dlatego upraszczamy nasze procesy rekrutacyjne, żeby były możliwie jak najprostsze i przyjazne kandydatowi
🎯 Pracujemy w imię zasady "remote first", więc praca zdalna to u nas norma, a wyjazdy służbowe ograniczamy do minimum
🎯 Oferujemy prywatną opiekę medyczną (Medicover) oraz kartę Multisport dla kontraktorów
Jak aplikować? 👈
Prześlij nam zgłoszenie za pomocą formularza!
Key Skills
Ranked by relevanceReady to apply?
Join Crodu and take your career to the next level!
Application takes less than 5 minutes