SRE - Observabilidad Operación

¡Sumate a Primary y sé parte de la transformación digital del mercado financiero!

En Primary buscamos un perfil técnico para incorporarse al área de Operaciones / SDP, con foco en la observabilidad, performance y confiabilidad operativa de plataformas de mercado.

El rol tendrá una mirada preventiva sobre el comportamiento de los eventos críticos del mercado, interpretando métricas técnicas en contexto de negocio y colaborando en la evolución de un modelo de prácticas de confiabilidad y observabilidad dentro de la organización.

Será una pieza clave para anticipar riesgos operativos y fortalecer la estabilidad de plataformas de misión crítica.

Principales Desafíos y Tareas Generales del rol

Monitoreo y Análisis Operativo

Supervisar en tiempo real el comportamiento de plataformas críticas, analizando indicadores como volumen de órdenes, latencia, throughput, colas de procesamiento y tiempos de respuesta.
Interpretar métricas de infraestructura (CPU, memoria, disco y red) en relación directa con la carga operativa y el flujo de mercado.
Ejecutar el análisis exhaustivo de registros (logs) y telemetría en plataformas de observabilidad (como Datadog) para la identificación y diagnóstico preciso de anomalías, asegurando la detección temprana de incidentes que afecten la continuidad del servicio.
Monitorear proactivamente la infraestructura y aplicaciones utilizando herramientas de APM, analizando fuentes de datos críticas para minimizar el tiempo medio de detección (MTTD) y proporcionar información clave para la remediación de fallas.

Observabilidad y Confiabilidad

Trabajar activamente con plataformas de observabilidad para analizar dashboards, interpretar alertas y detectar patrones anómalos o desvíos respecto al comportamiento esperado.
Colaborar en la mejora continua de indicadores operativos, definición de umbrales y construcción de vistas que traduzcan métricas técnicas en impacto de negocio.

Anticipación y Gestión Preventiva

Identificar señales tempranas de picos de carga, degradación de performance o riesgo de saturación de capacidad.
Elevar alertas preventivas y proponer acciones antes de que se materialicen incidentes, especialmente en jornadas de alta sensibilidad operativa.

Contexto de Mercado

Comprender la dinámica del mercado financiero y sus eventos relevantes (aperturas, cierres, vencimientos, jornadas de alta volatilidad), correlacionando dichos eventos con el comportamiento técnico de las plataformas.

Mejora Continua y aspecto clave del perfil

Participar en análisis post-incidente (post-mortems), documentar aprendizajes y contribuir a la construcción progresiva de prácticas de confiabilidad dentro del área de Operaciones.

Requisitos:

Observabilidad y Monitoreo

Experiencia en el uso de herramientas de monitoreo y observabilidad como Grafana, Prometheus, Datadog, KELK Stack o similares.
Capacidad para interpretar métricas, logs y alertas en entornos productivos de alta criticidad.

Sistemas y Performance

Conocimientos sólidos de entornos Linux, fundamentos de performance de aplicaciones y administración de recursos.
Comprensión de arquitecturas distribuidas, procesamiento de eventos y comportamiento bajo carga.

Networking y Fundamentos Técnicos

Conocimientos de latencia, throughput, conectividad y posibles cuellos de botella en entornos de red.
Interés por la confiabilidad, estabilidad y prevención de incidentes.

Competencias blandas valoradas

Capacidad de análisis sistémico y pensamiento orientado a anticipación.
Comunicación clara, trabajo colaborativo y buen desempeño bajo presión en contextos de mercado abierto.

SRE - Observabilidad Operación

Key Skills

Related Jobs

Desarrollador Backend

Desarrollador Java Ssr

Desarrollador .Net

Related Jobs

Desarrollador Backend

Desarrollador Java Ssr

Desarrollador .Net

Cookie Settings