-
CompuGroup Medical SE & Co. KGaA

Data Scientist

CompuGroup Medical SE & Co. KGaA
Spain · Full-time · Not Applicable

CGM Clinical es la compañía con más instalaciones en España de sistemas de información hospitalarios, de historia clínica electrónica y de ayuda a la decisión.

En todo el mundo, CGM implanta sistemas de información a más de 400.000 clientes de 40 países, incluidos 68 hospitales públicos en España.

Todos los días, 10.000 empleados de CGM en todo el mundo crean soluciones de Salud Digital innovadoras que ayudan a curar y cuidar a las personas.

Actualmente, estamos buscando Científicos/as de Datos con experiencia en entornos Big Data y analítica avanzada para diseñar, desarrollar y desplegar modelos de Machine Learning e IA en el sector sanitario.

1.1Funciones

Titulación: Ingeniería en Informática, Biomédica, Telecomunicaciones, Matemáticas, Física, Estadística o similar.

  • Analizar, preparar y explorar datos clínicos y asistenciales para la construcción de modelos predictivos y prescriptivos.
  • Diseñar, desarrollar, validar y desplegar modelos de Machine Learning / Deep Learning (clasificación, regresión, series temporales, segmentación, NLP, etc.) utilizando Python y/o Scala.
  • Desarrollar y mantener notebooks y librerías reutilizables para análisis exploratorio, visualización y prototipado rápido (por ejemplo, con Jupyter, PySpark, Spark MLlib, etc.).
  • Trabajar con datos de salud estandarizados (HL7/FHIR u otros estándares y codificaciones médicas) para generar datasets de alta calidad orientados a casos de uso clínicos y de negocio.
  • Documentar experimentos, modelos, datasets y resultados, garantizando trazabilidad y reproducibilidad de los modelos.
  • Colaborar con equipos de Gobierno del Dato y de IT para asegurar el cumplimiento de normativas de seguridad y privacidad (por ejemplo, anonimización/pseudonimización, RGPD) en el uso de datos de salud.
  • (Sera un Plus) Conocimientos y experiencia en MLOps: versionado de modelos y datos, automatización de pipelines, monitorización en producción y gestión de drift.

1.2 Requisitos

Competencias generales:

  • Al menos 2 años de experiencia como Científico/a de Datos desarrollando modelos de Machine Learning en entornos productivos, preferiblemente sobre grandes volúmenes de datos (Big Data).
  • Dominio de Python y/o Scala orientado a ciencia de datos (por ejemplo: pandas, NumPy, scikit-learn, PySpark, Spark MLlib).
  • Conocimientos sólidos de estadística aplicada, probabilidad y métodos de modelado (regresión, clasificación, árboles de decisión, gradient boosting, clustering, reducción de dimensionalidad, validación cruzada, etc.).
  • Experiencia en análisis exploratorio de datos, limpieza, tratamiento de valores perdidos, outliers y creación de variables (feature engineering).
  • Manejo de SQL para extracción y transformación de datos.
  • Conocimientos de herramientas de desarrollo y control de versiones como Git, GitLab, y uso de notebooks (Jupyter o similares) para el desarrollo de modelos.
  • Uso habitual de metodologías ágiles (Scrum / Kanban) y herramientas de gestión de tareas como Jira.
  • Capacidad de comunicación para traducir resultados analíticos complejos en conclusiones comprensibles para perfiles no técnicos (clínicos, negocio).

Competencias Específicas

  • Conocimiento de datos de salud (historias clínicas electrónicas, datos de laboratorio, farmacia, episodios asistenciales, etc.).
  • Familiaridad con estándares de interoperabilidad sanitaria, especialmente HL7/FHIR.
  • Conocimientos de codificaciones médicas como CIE-9/CIE-10, SNOMED-CT u otras ontologías clínicas.

Valorables / Plus

  • Experiencia en MLOps: CI/CD para modelos, MLflow, herramientas de seguimiento de experimentos, despliegue de modelos como APIs, monitorización de rendimiento y drift.
  • Experiencia en entornos Big Data (Cloudera Data Platform u otros) y herramientas asociadas (Spark, HDFS, Kafka, NiFi, Hive/Impala).
  • Experiencia con librerías de Deep Learning (TensorFlow, Keras, PyTorch) y/o NLP aplicadas a texto clínico.
  • Certificaciones en datos, analítica o plataformas cloud (por ejemplo, Cloudera, AWS, Azure, GCP) serán valoradas positivamente.

1.3 ¿Qué te ofrecemos?

  • Empleo estable en un sector con un gran potencial de desarrollo.
  • Beneficios sociales (seguro médico y cheque comida).
  • Formación continua para tu desarrollo profesional.
  • Flexibilidad laboral.
  • Modelo híbrido de trabajo (con gran % de jornada en formato teletrabajo).

Key Skills

Ranked by relevance

machine learning spark deep learning big data python mlops tensorflow pytorch gitlab pandas mlflow scala kafka cloud scrum keras numpy cicd git sql aws gcp das
Login to Apply
Posted
Apr 14, 2026
Type
Full-time
Level
Not Applicable
Location
Madrid

Industries

IT Services IT Consulting

Categories

Engineering Information Technology

Related Jobs

3 roles aligned with this opportunity

View all jobs
View Job Details
Accenture DACH
Related

Senior Data & Machine Learning Engineer (all genders)

2026-05-21

Full-time
Not Applicable
Austria
IT Services
Engineering
View Job Details
CompuGroup Medical SE & Co. KGaA
Related

Senior Backend Engineer

2026-05-11

Full-time
Not Applicable
Romania
IT Services
Engineering
View Job Details
CompuGroup Medical SE & Co. KGaA
Related

Python Developer

2026-05-06

Full-time
Not Applicable
Portugal
IT Services
Engineering