-
View all jobs
Le poste
Descriptif du poste
Qui sommes-nous ?
Ringover est une entreprise innovante qui repousse les limites de l’intelligence artificielle appliquée à la communication. Notre équipe R&D IA travaille sur des domaines de pointe tels que le Text-to-Speech (TTS), Large Language Models (LLM), Named Entity Recognition (NER) et Speech-to-Text.
Nous avons notre propre infrastructure (datacenter & GPUs) et utilisons également des solutions cloud (Azure, Scaleway, Vast.ai) pour une meilleure élasticité. Dans un contexte de forte croissance, nous recherchons un Ingénieur en Développement Logiciel IA capable d’optimiser notre pipeline de production IA et d’améliorer l’efficacité de nos modèles en exploitation.
Votre mission
En tant qu’Ingénieur en Développement Logiciel IA, vous jouerez un rôle clé dans l’optimisation des modèles IA en production. Vous interviendrez sur l’optimisation des inférences, le scaling des ressources GPU et l’amélioration des performances globales des systèmes.
Vos Responsabilités
Optimisation GPU & Inférence
Expérience
✨ Des Conditions Qui Prennent Soin De Toi
Descriptif du poste
Qui sommes-nous ?
Ringover est une entreprise innovante qui repousse les limites de l’intelligence artificielle appliquée à la communication. Notre équipe R&D IA travaille sur des domaines de pointe tels que le Text-to-Speech (TTS), Large Language Models (LLM), Named Entity Recognition (NER) et Speech-to-Text.
Nous avons notre propre infrastructure (datacenter & GPUs) et utilisons également des solutions cloud (Azure, Scaleway, Vast.ai) pour une meilleure élasticité. Dans un contexte de forte croissance, nous recherchons un Ingénieur en Développement Logiciel IA capable d’optimiser notre pipeline de production IA et d’améliorer l’efficacité de nos modèles en exploitation.
Votre mission
En tant qu’Ingénieur en Développement Logiciel IA, vous jouerez un rôle clé dans l’optimisation des modèles IA en production. Vous interviendrez sur l’optimisation des inférences, le scaling des ressources GPU et l’amélioration des performances globales des systèmes.
Vos Responsabilités
Optimisation GPU & Inférence
- Transformer et optimiser les modèles pour maximiser les performances en production (TorchServe, ONNX, TensorRT...)
- Réduire les temps d’inférence et la consommation des GPUs en optimisant la gestion mémoire et le parallélisme
- Mettre en place des benchmarks pour évaluer les performances et la scalabilité
- Concevoir et améliorer l’architecture logicielle des pipelines IA en production (flux synchrones/asynchrones)
- Déployer et monitorer les modèles dans un environnement haute disponibilité
- Automatiser les workflows ML avec des outils de MLOps
- Anticiper le provisionning des machines en fonction des besoins
- Identifier les goulets d’étranglement et proposer des solutions d’optimisation
- Collaborer avec les équipes DevSecOps et Data pour assurer un déploiement fluide et efficace
Expérience
- 5 ans minimum en développement logiciel en C++ et Python
- Fine tuning de modèle via Python (gestion des données, pipeline de validation, PyTorch), conversion de modèle Torch vers ONNX
- Expérience dans l’intégration sur cible en utilisant le langage de programmation C++ (pré-traitement, inférence, post-traitement, CUDA, TensorRT, ONNX)
- Compréhension des flux synchrones/asynchrones pour une exploitation performante des modèles
- Langages : Python, C++ et/ou Golang
- Frameworks IA : PyTorch (ou équivalent)
- Optimisation GPU : TensorRT, ONNX, TorchServe…
- MLOps & déploiement : Kubernetes, Docker, Triton Inference Server
- Bases de données : Clickhouse, TiDB, LanceDB, Weaviate
- Curieux, polyvalent, orienté solution
- Capacité à prendre du recul sur les architectures et à challenger l’existant
- Proactif dans l’exploration de nouvelles approches
✨ Des Conditions Qui Prennent Soin De Toi
- Une mutuelle isolée prise en charge à 100 %.
- 6 semaines de congés.
- Une organisation hybride avec du télétravail et une allocation de 20 € brut par mois.
- Un forfait mobilité durable jusqu’à 700 € par an (dont 50 % du Pass Navigo) ou une indemnité carburant de 300 € par an, selon ton mode de transport.
- Une ambiance conviviale et une équipe multiculturelle.
- Des moments de partage grâce à des afterworks et des activités variées.
- Des espaces détente pour souffler en journée : sport, piano, jeux vidéo…
- Une journée par trimestre dédiée au bénévolat avec Numérique pour Tous.
Key Skills
Ranked by relevance
c
pytorch
python
kubernetes
docker
cloud
Related Jobs
3 roles aligned with this opportunity
View Job Details
Related
Graduate AI software engineer
2026-04-10
Full-time
Entry
France
Software Development
Engineering
View Job Details
Related
Sustaining Operations Engineer
2026-04-07
Full-time
Not Applicable
Romania
Software Development
Engineering
View Job Details
Related
Software engineer, intern
2026-04-11
Internship
Entry
Romania
Software Development
Engineering
Login to Apply
- Posted
- Apr 15, 2025
- Type
- Full-time
- Level
- Mid-Senior
- Location
- Montrouge
- Company
- Ringover North America
Industries
Software Development
Categories
Engineering
Information Technology
Related Jobs
3 roles aligned with this opportunity
View Job Details
Related
Graduate AI software engineer
2026-04-10
Full-time
Entry
France
Software Development
Engineering
View Job Details
Related
Sustaining Operations Engineer
2026-04-07
Full-time
Not Applicable
Romania
Software Development
Engineering
View Job Details
Related
Software engineer, intern
2026-04-11
Internship
Entry
Romania
Software Development
Engineering