Cientista de Dados - Análises Avançadas e Multiômica
Com 70 anos de existência, o Einstein Hospital Israelita ainda mantém uma premissa: inovar e crescer, sempre com excelência. Ajudamos a salvar vidas, difundir o conhecimento em educação, prevenção e inovação em saúde. Além da atuação em setores assistenciais, temos oportunidades na área de Inovação, Tecnologia, Pesquisa, Ensino, entre outras. Seguimos oferecendo qualidade, afirmando nosso compromisso com a Responsabilidade Social e com o propósito de levar uma gota de Einstein para cada cidadão. Valorizamos a diversidade e inclusão de todos os talentos e buscamos profissionais que compartilhem deste mesmo propósito!
Informações sobre a área de trabalho
Área: Análises Avançadas e Multiômica
Horário: 09h às 19h
Modelo: Híbrido ou remoto
Sumário
Responsável por identificar soluções para os problemas de negócios e contribuir nas tomadas de decisões, usando habilidades de matemática, de estatística, de programação, de machine learning e de mineração de dados. Comunicar previsões e resultados para o cliente demandante, através de visualizações de dados eficazes. Desenvolver arquiteturas, algoritmos e soluções inovadoras para saúde. Projetar novos modelos estatísticos e ferramentas de coleta de dados e usar técnicas avançadas de análise estatística, probabilidade e deep learning.
Responsabilidades
• Tratar, transformar e organizar dados desorganizados (estruturados, semi-estruturados ou não estruturados), com uso de habilidades em matemática, estatística, programação, machine learning e outros, aplicando suas capacidades analítica, de conhecimento de negócio, de compreensão contextual, para identificar soluções para os problemas de negócios e contribuir na tomada de decisões e estratégias da instituição.
• Realizar pesquisas sem direção e formular perguntas abertas aos dados
• Extrair grandes volumes de dados de múltiplas fontes internas e externas
• Empregar os programas de análise sofisticadas, machine learning e métodos estatísticos para preparar os dados para uso em modelagem preditiva e prescritiva
• Explorar e analisar dados de uma variedade de ângulos para determinar fraquezas escondidas, tendências e / ou oportunidades
• Conceber soluções orientadas a dados para os desafios mais prementes
• Inventar novos algoritmos para resolver problemas e criar novas ferramentas para automatizar o trabalho
• Comunicar previsões e resultados para o cliente demandante, através de visualizações de dados eficazes
• Recomendar mudanças nos procedimentos e estratégias da Instituição"
No segmento de Machine Learning:
• Pesquisar e desenvolver novos algoritmos.
• Aplicar esses algoritmos e criar soluções."
• Desenvolver e ajustar modelos fundacionais
No segmento de Visualização de Dados:
• Entender os dados do projeto em desenvolvimento e reproduzir os mesmos de forma visual que atendam as demandas do cliente.
• Adotar gráficos, tabelas, relatórios e, principalmente, narrativas para apresentar a um público não técnico as conclusões de um projeto de análise de dados.
Requisitos
• Matemática: cálculo multivariável e álgebra linear (matrizes, autovalores e autovetores, regra da cadeia, matriz de jacobiana, gradiente, tensores e maldição da dimensionalidade) ;
• Estatística descritiva: média, mediana, moda, distribuições (tais como: normal, poisson, binomial e chi-square), correlação, variância, teorema do limite central e desvio padrão e variância;
• Estatística inferencial: teste de hipótese (tais como: p-values, intervalos de confiança), testes de significância (tais como: z-test, t-test e ANOVA) e regressão (regressão linear e regressão logística);
• Probabilidades: regra do produto, inferência bayesiana x frequentista, variáveis aleatórias, independência, condicionalidade, marginalização e lei da probabilidade total;
• Data wrangling: limpeza e manipulação de dados, extrair informações de arquivos (tais como: CSV e XML), regular expressions, transformações matemáticas e domínio de queries em banco de dados relacionais;
• Programação em linguagens de data science (tais como: R, Python, SQL e Matlab). Conhecimentos de pacotes open source especificos para Data Science como: Tensorflow, Pytorch, Transformers, Unsloth ,Keras, Numpy, Pandas, Tidyverse, entre outros;
• Métodos de machine learning: aprendizagem supervisionada (tais como: decision trees, naive bayes, logistic regression, random forest, SVM e redes neurais) e aprendizagem não supervisionada (tais como: algoritmos de clusterização, PCA e SVD);
• Métodos de deep learning: adaptação de modelos grande e leves através de técnicas como LoRA, QLoRA, GRPO, GPO e aprendizado não supervisionado como contrastive learning;
• Comunicação, visualização de dados e data storytelling: conhecimento do negócio do cliente, entendendo os dados de forma visual da área e sabendo comunicar sob forma de vizualização seus insights para o mesmo. Bibliotecas de vizualização de dados (tais como: GGPLOT, SHINY, MATPLOTLIB e SEABORN);
• Conhecimento de processos de dados e analytics.
Desejável:
• Graduação completa;
• Nível de inglês avançado;
• Outros Métodos de machine learning: reinforcement learning (tais como: Q-learning, TD-learning e algoritmos genéticos) e deep learning (tais como: redes neurais, CNN, RNN e GAN);
• Otimização. Conhecimento de algoritmos de otimização e utilização de softwares como Gurobi;
• Experiment Design: teste A/B, controle de variáveis, escolha de bons grupos de teste e controle, tamanho da amostra, nivel de confiança, estatística bayesiana, bootstrapping, simulação e experimento SMART (Specific, Measurable, Actionable, Realistic, Timely);
• Outras ferramentas: Debugging, testing, controle de versão (Git) e model deploy;
• Conhecimento de funcionamento e manutenção de banco de dados NoSQL. (Tais como: Cassandra, MongoDB, CouchDB, Documento de grafos, entre outros);
• Configuração e manutenção do ecosistema Hadoop (tais como: HDFS, Spark, MapReduce, Pig, Hive, Impala, Flume, Sqoop, Zookeeper, Oozie, Hue, Kafka, Scala e Python;
• Conhecimento de funcionamento e manutenção de banco de dados relacionais. MS SQL Server, Oracle, MySQL e PostgreSQL.
Einstein Benefícios – Compartilhando Bem-Estar
- Cuidados com a saúde: Programa Cuidar com serviços realizados no Einstein para promover a saúde e bem-estar dos colaboradores e dependentes, Clínicas Einstein, Telemedicina, Convênio Farmácia, Convênio Médico, Assistência Odontológica e Consultório Dental in Company.
- Bem-Estar: Wellhub (Gympass), TotalPass, Coral, Programa de Orientação Pessoal e SESC.
- Para você e sua família: Licença paternidade estendida, Seguro de Vida, Creche ou Auxílio Creche para mães ou pais com guarda legal, Auxílio para Filhos com Deficiência e Previdência Privada com taxa zero.
- Alimentação: Vale Alimentação, Vale Refeição ou Refeitório no local de trabalho.
- Mobilidade: Vale Transporte, Fretado, Estacionamento, Aplicativo de Caronas e Circular Metrô.
- Clube de Benefícios: Para economizar e obter vantagens nas compras de produtos e serviços de diversas categorias, como Beleza e Fitness, Comer e Beber, Compras, Cultura e Lazer, Educação Ensino Einstein, Turismo e muito mais.
- Programa Mais Conectados: Trabalho remoto nas modalidades Teletrabalho ou Híbrido conforme atividade e área de atuação.
**Os benefícios podem sofrer alteração de acordo com a convenção coletiva, unidade de trabalho e políticas vigentes.
Key Skills
Ranked by relevance
Related Jobs
3 roles aligned with this opportunity
Desenvolvedor (Machine Learning - Foco em HPC)
2026-05-21
Oportunidades de Carreira: Desenvolvedor (Machine Learning - Foco em HPC) (1307577)
2026-05-20
Oportunidades de Carreira: Assistente Atendimento I - Jabaquara (1308904)
2026-05-21
- Posted
- Feb 20, 2026
- Type
- Full-time
- Level
- Mid-Senior
- Location
- Brazil
- Company
- Einstein Hospital Israelita
Industries
Categories
Related Jobs
3 roles aligned with this opportunity
Desenvolvedor (Machine Learning - Foco em HPC)
2026-05-21
Oportunidades de Carreira: Desenvolvedor (Machine Learning - Foco em HPC) (1307577)
2026-05-20
Oportunidades de Carreira: Assistente Atendimento I - Jabaquara (1308904)
2026-05-21