STAGE DATA SCIENTIST IA GENERATIVE / NLP
at Societe Generale
Posted 13 days ago
No clicks
- Compensation
- Not specified EUR
- City
- Paris
- Country
- France
Currency: € (EUR)
Stage de Data Scientist IA Générative / NLP au sein du DataLab de Société Générale Assurances, pour explorer et enrichir les solutions IA existantes en IA Générative, NLP et graphes. Vous expérimenterez des approches avancées comme Retrieval Augmented Generation (RAG) et Graph RAG, effectuerez des NLP-clustering, comparerez différents modèles et frameworks et contribuerez à l’intégration des modèles dans des APIs et des workflows batch. Vous participerez à l’optimisation des performances et à la construction d’une librairie interne pour réutiliser les travaux, tout en documentant les résultats et en effectuant une veille technologique. Le stage est à Paris La Défense, 4 à 6 mois, à partir d’avril 2026, avec 50% télétravail possible.
Vos missions au quotidien
Société Générale Assurances, compagnie d'assurance du Groupe Société Générale, recherche un stagiaire Data Scientist pour travailler au sein du pôle IA du DataLab. Cette direction (13 personnes) réalise des études statistiques à haute valeur ajoutée auprès d’interlocuteurs variés (autres directions, filiales, distributeurs…). La direction développe également des solutions d’Intelligence Artificielle ayant pour but d’améliorer la connaissance client et l’efficacité opérationnelle des services de gestion de l’entreprise.
Quelques exemples de missions réalisées :
1) Participation à la construction et déploiement de solutions d’IA (NLP, IA Générative, Computer vision et Speech Analytics) pour optimiser les processus dans différents services de gestion : analyse automatique des verbatims clients, catégorisation automatique d’emails, extraction d’informations depuis des documents scannés, analyse du contenu audio des appels téléphoniques, ...)
2) Travaux R&D : transparence des algorithmes d’IA, application des LLM, travaux avec l’actuariat autour de l’utilisation de nouvelles données pour la tarification (analyse des données télématiques, données météo, modélisation de la probabilité de retard des vols, ...)
Votre rôle
Le stage consistera à explorer et à enrichir les solutions existantes du datalab en combinant les avancées récentes en IA Générative, NLP et technologies de graphes. Vous serez amené(e) à travailler sur :
· Expérimentation d’approches avancées de Retrieval Augmented Generation (RAG), incluant la variante Graph RAG, afin d’améliorer la pertinence des réponses en exploitant des connaissances structurées sous forme de graphes (relations, entités, contextes métier).
· Mise en œuvre de techniques de NLP-clustering (regroupement automatique de textes, segmentation de corpus, détection de thématiques ou de tendances) pour l’analyse de grands volumes de textes divers.
· Test et comparaison de différents modèles et frameworks liés à l’IA Générative, au NLP et aux graphes.
· Participation à l’optimisation des performances (temps d’inférence, scalabilité, qualité des clusters ou des réponses générées) et à l’intégration des modèles dans des APIs ou des workflows batch.
· Construction d’une librairie interne pour garantir la réutilisabilité et la mutualisation des travaux dans les différents projets du datalab.
· Documentation des travaux réalisés et contribution à la veille technologique sur les thématiques innovantes du laboratoire.
Et si c’était vous ?
Etudiant en 2ième ou 3ième année d’école d’ingénieur ou d’une formation orientée data science / software engineering, vous connaissez le cycle de vie d’un projet data science et avez une forte appétence pour le développement d’algorithmes de type NLP ou IA Générative à l’Etat de l’art. Afin de déployer en production (API, batch) les modèles développés, une connaissance des « bonnes pratiques » du développement software (écriture de code modulaire et documenté, bonnes pratiques de collaboration et de versioning, tests unitaires, documentation).
Stack logicielle utilisée
- Requis : Python, librairies de ML standards (scikit-learn, PyTorch, Hugging Face Transformers…), librairies de GenAI (LangChain, LangGraph, OpenAI…)
- Sont un plus : expérience avec des technologies de graphes (NetworkX, Neo4j…), MLflow, Kedro, CI/CD Gitlab
Informations générales
Poste à pourvoir en stage pour une durée de 4 à 6 mois, basé à Paris La Défense (92). Télétravail possible à hauteur de 50% par semaine. Le début du stage est fixé à Avril 2026.
Plus qu’un poste, un tremplin
Dès votre arrivée, vous serez intégré(e) dans nos équipes et apprendrez chaque jour aux côtés de nos experts qui vous accompagneront dans vos missions. Progressivement, vous gagnerez en autonomie sur vos projets pour faire de cette expérience un vrai accélérateur de carrière. Vous découvrirez également toute la diversité de nos métiers, dans un secteur qui évolue et innove en permanence.
Pourquoi nous choisir ?
Notre mission chez Société Générale Assurances
Protéger durablement nos assurés et leurs biens, à chaque étape de leur vie.
Nous proposons une offre complète en assurance vie, épargne retraite et protection des personnes et des biens, pour les particuliers, professionnels et entreprises.
Un engagement responsable
3 000 collaborateurs en France et dans 6 pays.
15 millions de clients accompagnés avec exigence et bienveillance.
Un rôle actif en tant qu’investisseur responsable au service de l’économie réelle.
Un environnement propice à l’épanouissement
Intégration personnalisée : journées d’accueil, accompagnement RH et managérial.
Développement des compétences : formations variées, apprentissage continu, mobilité interne.
Moments d’échange : rencontres régulières avec le management pour partager la stratégie et les projets clés.
Rejoignez une entreprise qui innove
Créer, innover, entreprendre : c’est notre ADN.
Que vous soyez là pour quelques mois ou toute une carrière, vous aurez un impact positif sur l’avenir.




