Primary
SRE - Observabilidad Operación
PrimaryArgentina3 days ago
Full-timeEngineering, Information Technology
¡Sumate a Primary y sé parte de la transformación digital del mercado financiero!

En Primary buscamos un perfil técnico para incorporarse al área de Operaciones / SDP, con foco en la observabilidad, performance y confiabilidad operativa de plataformas de mercado.

El rol tendrá una mirada preventiva sobre el comportamiento de los eventos críticos del mercado, interpretando métricas técnicas en contexto de negocio y colaborando en la evolución de un modelo de prácticas de confiabilidad y observabilidad dentro de la organización.

Será una pieza clave para anticipar riesgos operativos y fortalecer la estabilidad de plataformas de misión crítica.

Principales Desafíos y Tareas Generales del rol

Monitoreo y Análisis Operativo

  • Supervisar en tiempo real el comportamiento de plataformas críticas, analizando indicadores como volumen de órdenes, latencia, throughput, colas de procesamiento y tiempos de respuesta.
  • Interpretar métricas de infraestructura (CPU, memoria, disco y red) en relación directa con la carga operativa y el flujo de mercado.
  • Ejecutar el análisis exhaustivo de registros (logs) y telemetría en plataformas de observabilidad (como Datadog) para la identificación y diagnóstico preciso de anomalías, asegurando la detección temprana de incidentes que afecten la continuidad del servicio.
  • Monitorear proactivamente la infraestructura y aplicaciones utilizando herramientas de APM, analizando fuentes de datos críticas para minimizar el tiempo medio de detección (MTTD) y proporcionar información clave para la remediación de fallas.

Observabilidad y Confiabilidad

  • Trabajar activamente con plataformas de observabilidad para analizar dashboards, interpretar alertas y detectar patrones anómalos o desvíos respecto al comportamiento esperado.
  • Colaborar en la mejora continua de indicadores operativos, definición de umbrales y construcción de vistas que traduzcan métricas técnicas en impacto de negocio.

Anticipación y Gestión Preventiva

  • Identificar señales tempranas de picos de carga, degradación de performance o riesgo de saturación de capacidad.
  • Elevar alertas preventivas y proponer acciones antes de que se materialicen incidentes, especialmente en jornadas de alta sensibilidad operativa.

Contexto de Mercado

  • Comprender la dinámica del mercado financiero y sus eventos relevantes (aperturas, cierres, vencimientos, jornadas de alta volatilidad), correlacionando dichos eventos con el comportamiento técnico de las plataformas.

Mejora Continua y aspecto clave del perfil

  • Participar en análisis post-incidente (post-mortems), documentar aprendizajes y contribuir a la construcción progresiva de prácticas de confiabilidad dentro del área de Operaciones.

Requisitos:

Observabilidad y Monitoreo

  • Experiencia en el uso de herramientas de monitoreo y observabilidad como Grafana, Prometheus, Datadog, KELK Stack o similares.
  • Capacidad para interpretar métricas, logs y alertas en entornos productivos de alta criticidad.

Sistemas y Performance

  • Conocimientos sólidos de entornos Linux, fundamentos de performance de aplicaciones y administración de recursos.
  • Comprensión de arquitecturas distribuidas, procesamiento de eventos y comportamiento bajo carga.

Networking y Fundamentos Técnicos

  • Conocimientos de latencia, throughput, conectividad y posibles cuellos de botella en entornos de red.
  • Interés por la confiabilidad, estabilidad y prevención de incidentes.

Competencias blandas valoradas

  • Capacidad de análisis sistémico y pensamiento orientado a anticipación.
  • Comunicación clara, trabajo colaborativo y buen desempeño bajo presión en contextos de mercado abierto.

Key Skills

Ranked by relevance