CAF (Construcciones y Auxiliar de Ferrocarriles)
Data Scientist
CAF (Construcciones y Auxiliar de Ferrocarriles)Spain12 days ago
Full-timeEngineering, Information Technology
¿Estas interesado/a en crecer como profesional, participando activamente en las decisiones del proyecto y hacerlo de la mano de un equipo experimentado y en un entorno de trabajo cercano y colaborativo? ¡Esta es tu oportunidad!

Si quieres trabajar para conseguir un mundo más sostenible y responsable con su entorno, en CAF Digital Services creemos y trabajamos en la movilidad sostenible, uno de los principales retos a los que se enfrenta la sociedad actual. En CAF Digital Services mejoramos la disponibilidad de los trenes y el bienestar de los pasajeros a través de la analítica de datos y la digitalización. Trabajamos con las tecnologías de mantenimiento y operación más innovadoras para maximizar la calidad de servicio de los trenes.

¿Qué te ofrecemos?

Ambiente de Trabajo Positivo: Podrás ser parte de un gran equipo altamente cualificado en el que estarás rodeado/a de personas con un gran espíritu colaborativo en el que te encontrarás un ambiente cercano y muy agradable.

Conciliación: Nuestro modelo híbrido te permitirá conciliar a la perfección la vida familiar y la vida laboral.

Aprendizaje y Autonomía: Te animaremos a que trabajes de manera autónoma, con el apoyo de nuestra formación, con un producto altamente tecnológico y en un mercado internacional.

Seguridad y estabilidad: CAF lleva más de 100 años trabajando en un camino que se extiende hacia el futuro, brindándote la seguridad que necesitas.

¿Qué te hará triunfar en esta posición?

  • Poseer estudios universitarios en Matemáticas, Estdística, Ingeniería o disciplinas afines con formación en Inteligencia Artificial, Ciencia de Datos o Análisis Avanzado.
  • Dominio sólido de Machine Learning y Deep Learning: Conocimiento profundo de algoritmos supervisados y no supervisados, redes neuronales (CNN, RNN, Transformers), modelos de clasificación, regresión, clustering y arquitecturas modernas de IA.
  • Experiencia práctica construyendo modelos de IA end-to-end: Desde la exploración y preparación de datos, feature engineering y entrenamiento, hasta validación, optimización, despliegue y monitorización en producción.
  • Experiencia práctica con plataformas cloud y entornos de desarrollo colaborativos tales como Databricks, AWS (S3, EMR, Lambda, SageMaker u otros servicios relacionados con datos y ML).
  • Competencia técnica avanzada en Python y PySpark: Capacidad para trabajar con grandes volúmenes de datos, construir pipelines distribuidos y transformar datasets complejos en entornos de Big Data.
  • Capacidades teconológicas aplicada a la IA: Uso avanzado de Python y su ecosistema científico (NumPy, pandas, scikit-learn, PyTorch o TensorFlow), con código modular y orientado a objetos preparado para escalabilidad y mantenimiento.
  • Rigor científico en el desarrollo de modelos: Habilidad para comparar arquitecturas, realizar experimentos controlados, ajustar hiperparámetros, evaluar métricas relevantes y documentar de forma estructurada cada iteración del modelo.
  • Comprensión profunda del ciclo de vida del dato: Experiencia trabajando con pipelines de datos, integración con APIs, limpieza, transformación y manejo de grandes volúmenes de información.
  • Mentalidad orientada al impacto: Más allá de la precisión del modelo, serás capaz de traducir necesidades reales en soluciones inteligentes, robustas y aplicables a los procesos y productos de la organización.

¿Cuál va a ser tu misión en la empresa?

Tu misión será diseñar, desarrollar y desplegar soluciones de Inteligencia Artificial y Analítica que impulsen el valor del negocio, permitiendo automatizar procesos, anticipar comportamientos, detectar patrones y generar insights accionables.

Serás la referencia técnica dentro del equipo, contribuyendo a la evolución del ecosistema LeadMind mediante la integración de modelos de aprendizaje automático y profundo en herramientas, productos y procesos.

Trabajarás junto a equipos técnicos, de datos, producto y negocio para transformar información en decisiones y funcionalidades inteligentes, impulsando una cultura data-driven y de innovación continua.

Responsabilidades de la posición:

  • Diseñar y entrenar modelos de Machine Learning y Deep Learning, seleccionando arquitecturas, técnicas de regularización, optimizadores y estrategias de entrenamiento.
  • Construir pipelines de datos y de entrenamiento, integrando fuentes diversas, asegurando calidad del dato y aplicando buenas prácticas de ingeniería.
  • Desarrollar código limpio, modular y escalable en Python y Pyspark, aplicando principios de ingeniería de software (tests, control de versiones, buenas prácticas de diseño) y programación orientada a objetos para explotar el dato.
  • Evaluar y validar modelos mediante experimentación, análisis estadístico, visualización de resultados, comparación de métricas y pruebas controladas.
  • Integrar soluciones gráficas o analíticas que permitan al operador explotar el dato tratado.
  • Colaborar con equipos multidisciplinares para transformar problemas reales en soluciones basadas en IA, analizando impacto, riesgos y viabilidad técnica.
  • Monitorizar y mejorar modelos existentes, realizando retraining, análisis de drift y ajustes continuos para asegurar robustez y rendimiento.
  • Documentar decisiones, experimentos, configuraciones y resultados, garantizando reproducibilidad y transferencia de conocimiento.
  • Mantenerse actualizado/a en tendencias de IA, nuevas arquitecturas, bibliotecas, técnicas de optimización de modelos y mejores prácticas en datos.

Por tanto, si te interesa trabajar en una empresa digital para conseguir un mundo más sostenible y responsable con su entorno, comprometida con la igualdad de oportunidades y que cuenta con un de Igualdad no lo dudes e inscríbete en la oferta ahora.

Key Skills

Ranked by relevance