-
METEOJOB by CleverConnect

DATA SCIENTIST - Stage - Analyse automatisée de documents pour lutte contre la fraude documentaire F/H

METEOJOB by CleverConnect
France · Internship · Entry

Description Du Poste

Contexte

La MAIF, cherche à répondre à des nouveaux besoins, spécifiquement sur la question de la fraude documentaire. Cela s'inscrit dans son plan de lutte contre la fraude à l'assurance, pour répondre à la fois aux exigences règlementaires et pour préserver la collectivité des sociétaires tant sur une dimension éthique qu'économique. À ce titre, nous souhaitons explorer et développer en interne de nouvelles modalités d'analyses de documents, en plus des cas que nous adressons actuellement.

La MAIF, comme toutes les sociétés d'assurance, est victime d'attaques organisées et planifiées pouvant présenter un impact économique important.

Ce stage vise à mettre en place une démarche de recherche et développement pour analyser des documents servant de justificatifs à des sinistres en gestion à la MAIF. Ces documents servent pour leur grande majorité à motiver une indemnisation de préjudice subi par le sociétaire. Ces documents seront analysés durant toute la durée du stage, à la recherche d'anomalies permettant de lever des soupçons de fraude.

Objectifs

Vous devrez notamment réimplémenter une ou plusieurs techniques de l'état de l'art pour détecter des altérations volontaires et des falsifications au sein de documents. Il peut s'agir par exemple d'une modification sur un montant de facture ou d'une modification de la personne facturée. Vous serez amené(e) à déployer cette implémentation dans le système opérant pour que toute falsification détectée soit signalée aux acteurs de la lutte contre la fraude du groupe MAIF.

Vous contribuerez à l'amélioration des connaissances dans différents aspects de l'informatique industrielle ainsi qu'en recherche scientifique :

⁃ Lecture de bibliographie scientifique et apprentissage de l'état de l'art sur une discipline donnée ;

⁃ Implémentation d'algorithmes de l'état de l'art dans les domaines de l'analyse d'images et du traitement de données numériques ;

⁃ Analyse de documents et des images par des techniques d'apprentissage machine ou profond ;

⁃ Découverte d'un système industriel de gestion de données et interactions avec les métiers MAIF en charge de la lutte contre la fraude.

À l'issue du stage, vous aurez également contribué directement à la lutte contre la fraude documentaire en ayant déployé dans le système opérant une alerte qui sera utilisée par les équipes de lutte contre la fraude.

Description Du Profil

Pour ce stage, nous recherchons un candidat ou une candidate avec des compétences en cours d'acquisition en ingénierie logicielle et data science ou analyse d'images, et notamment :

⁃ Master en cours ou formation en école d'ingénieur spécialisé dans l'analyse de données, IA, de documents et d'images ou équivalent.

⁃ Expérience en machine learning et/ou deep learning, connaissances théoriques et pratiques.

⁃ Expérience dans la manipulation des documents (métadonnées, images au niveau pixel, utilisation de CNN, connaissances théoriques et pratiques basiques sur les réseaux de neurones et les réseaux à convolution).

⁃ Première expérience (stage, projet important) en analyse d'images et machine learning.

⁃ Compétences en génie logiciel et maitrise des concepts de fondamentaux de l'architecture et bonnes pratiques de code (coder proprement, patrons de conceptions, pratiques de CI/CD, etc.).

⁃ Technologies classiques en analyse d'image et machine learning : Python, PyTorch/ PyTorchLightning, Pandas/Polars, ScikitLearn/Genstim, HuggingFace's transformers.

⁃ Maitrise des fondamentaux de la gestion de logiciel : CI/CD, système de gestion de version (Git).

Pour candidater

⁃ CV, listes des projets réalisés et ce qu'ils ont apportés concrètement au regard de l'offre actuel, dépôt GitHub/GitLab, contributions publiques à des logiciels libres ou open source, portfolio personnel, etc.

⁃ Stage pour profil équivalent M2 / Ingénieur avec une expérience en analyse d'images et des compétences en ingénierie logicielle ;

⁃ Application à la lutte contre la fraude documentaire ;

⁃ Février à juin/juillet 2024 ;

⁃ Potentiellement (convention en cours d'établissement) en collaboration et co-encadrement avec un laboratoire de recherche en informatique, spécialisé dans l'analyse de documents et la lutte contre la fraude documentaire ;

⁃ Poursuite envisagée en thèse CIFRE sur la période 2025 - 2028 (notamment sous conditions d'acceptation du projet par l'ANRT).

Key Skills

Ranked by relevance

python pytorch pandas gitlab
Login to Apply
Posted
Nov 01, 2024
Type
Internship
Level
Entry
Location
Niort

Industries

Technology Information Internet

Categories

Engineering Information Technology

Related Jobs

3 roles aligned with this opportunity

View all jobs
View Job Details
In Tandem
Related

Product Data Scientist

2026-06-16

Full-time
Associate
France
Technology
Engineering
View Job Details
Kelea
Related

Data Scientist

2026-06-15

Full-time
Not Applicable
Spain
Technology
Engineering
View Job Details
Veepee
Related

Data Scientist

2026-06-12

Full-time
Not Applicable
France
Retail
Engineering