DaCodes.
GCP AI Platform MLOps Engineer (DevOps + Machine Learning Operations)
DaCodes.Argentina1 day ago
Full-timeOther
¡Trabaja en DaCodes!

Somos una firma de expertos en software y transformación digital de alto impacto.

Durante 10 años hemos creado soluciones enfocadas en la tecnología e innovación gracias a nuestro equipo de +220 talentosos #DaCoders, incluyendo desarrolladores, arquitectos, diseñadores UX/UI, PMs, QA testers y más. Nuestro equipo colabora en proyectos con clientes en LATAM y Estados Unidos, logrando resultados sobresalientes.

En DaCodes, tendrás la oportunidad de impulsar tu desarrollo profesional, trabajar en diversos proyectos dentro de distintas industrias, y contribuir al diseño, implementación y optimización de infraestructuras en la nube.

Nuestros DaCoders tienen un gran impacto en el éxito de nuestro negocio y el de nuestros clientes.

¿Te interesa?

Requirements

Este puesto corresponde a un Machine Learning Operations Engineer, pero con un enfoque distinto al MLOps tradicional. En lugar de centrarse en entrenamiento de modelos o experimentación, este rol está orientado a la operación, despliegue y mantenimiento de plataformas de IA en producción dentro de GCP.

El perfil ideal combina:

Competencias de DevOps / Cloud Engineering

  • CI/CD con GitLab
  • IaC (Terraform)
  • Orquestación con Kubernetes/GKE
  • Gestión de IAM, VPCs, redes y seguridad
  • Automatización y operación de servicios cloud de alta concurrencia

Competencias de MLOps orientadas a IA aplicada

  • Frameworks multiagente (LlamaIndex Workflows, LangGraph, ADK)
  • Vertex AI y MLflow para trazabilidad y operación
  • Manejo de estados, sesiones y eventos
  • Monitoreo y control de costos por tokenización en LLMs

El rol se centra en construir, automatizar y operar la infraestructura necesaria para sistemas basados en IA y agentes, asegurando escalabilidad, eficiencia y trazabilidad dentro del ecosistema Google Cloud Platform.

REQUERIMIENTOS

Skills Deseables

  • Experiencia en la construcción de pipelines CI/CD con GitLab, incluyendo integración con GCP , MLflow , Vertex AI, Artifact Registry.
  • Experiencia en el proceso de deployment de workflows multiagente, orientados a frameworks de alta concurrencia como LlamaIndex Workflows, LangGraph, ADK, con manejo de sesiones, estados, eventos e ingeniería de contexto.
  • Experiencia programación e implementación de Infraestructura como Código (IaC) utilizando Terraform.
  • Experiencia en configuración y orquestación de Kubernetes o Google Kubernetes Engine (GKE), incluyendo esquemas de CPU y GPU compartidas.
  • Dominio de servicios como Google Cloud Run, Google Compute Engine, Cloud Functions, Pub/Sub, administración de IAM Roles, Elastic Load Balancers, Identity-Aware Proxy (IAP), Secret Manager, Cloud SQL y Dataflow, Networks, VPCs , Reglas de comunicacion en general GCP. (Si está certificado mejor)
  • Implementación de sistemas de trazabilidad y monitorización con MLflow, Grafana, Datadog y Looker Studio.
  • Conocimientos de dimensionamiento de capacidades computacionales para cargas de alta demanda y concurrencia, así como técnicas de aceleración por GPU.

Nice to Have

  • Ciencia de datos
  • Conocimientos en técnicas avanzadas de procesamiento de lenguaje natural (NLP)

Principales Responsabilidades

  • Implementar los ambientes requeridos por el squad de IA.
  • Asegurar las buenas prácticas de deployment, incluyendo branching, naming y versioning.
  • Implementar diferentes estrategias de branching, incluyendo CI/CD, GitFlow, entre otras.
  • Ser owner de los deployments y coordinar los esfuerzos relacionados con dicho proceso.
  • Apoyar al equipo con autenticaciones, permisos, roles, accesos, etc.
  • Dimensionar los costos de infraestructura previo a la implementación de sistemas orientados a IA y arquitecturas basadas en agentes.
  • Monitorizar costos de infraestructura y costos asociados a la tokenización de entrada y salida de los LLM utilizados por los workflows agenticios.

Benefits

🚀 Integración a marcas globales y startups disruptivas.

🏡 Trabajo remoto/Home office.

📍 En caso de requerir modalidad híbrida o presencial, serás informado desde la primera sesión.

⏳ Horario ajustado a la célula de trabajo/proyecto asignado.

📅 Trabajo de lunes a viernes.

🎉 Día off en tu cumpleaños.

🏥 Seguro de gastos médicos mayores (aplica para México).

🛡️ Seguro de vida (aplica para México).

🌎 Equipos de trabajo multiculturales.

🎓 Acceso a cursos y certificaciones.

📢 Meetups con invitados especiales del área de IT.

📡 Eventos virtuales de integración y grupos de interés.

📢 Clases de inglés.

🏆 Oportunidades dentro de nuestras diferentes líneas de negocio.

🏅 Orgullosamente certificados como Great Place to Work.

Key Skills

Ranked by relevance