Création dynamique de dictionnaires de données ou de thesaurus.
Elaboration d’une approche/d’un outil NLP capable d’extraire le champ lexical employé en fonction de divers contextes métiers.

Missions

  • Analyser l’état de l’art afin d’identifier les approches de conception dynamique de dictionnaires de données.
  • Implémenter les solutions les plus prometteuses et évaluer les performances de chacune.
  • Proposer une nouvelle approche de conception pouvant être sujette à la rédaction d’un article de recherche.
  • Capitaliser sur vos travaux afin de concevoir une nouvelle offre OCTO.

Conditions

Type de stage : Stage de fin d'étude, stage de pré-embauche
Lieu : Paris
Rémunération : 1500 € bruts
Date : 2020

Profil

  • Vous avez une formation en Data Science (Machine Learning, statistiques).
  • Vous savez développer en Python et vous connaissez les principales librairies de Data Science.
  • Une connaissance sur des approches NLP est un plus. Vous êtes motivé·e par l’exploration, l’identification et l’implémentation de solutions à l’état de l’art et par la conception de nouvelles approches.
  • Bien que focalisé·e sur les aspects Data Science, vous êtes prêt·e à présenter votre solution à divers clients.

Contexte

Étape 1 : Étude de l’état de l’art
Vous analyserez l’état de l’art afin de déterminer les approches récentes de conception dynamique de dictionnaires de données et les évaluerez afin d’identifier les solutions les plus prometteuses.

Étape 2 : Implémentation des approches les plus prometteuses
Vous implémenterez les approches les plus prometteuses et les testerez sur des jeux de données issus de différents marchés afin d’évaluer leurs performances respectives.

Étape 3 : Proposition d’une nouvelle approche
En fonction des performances des approches, il est possible de devoir adapter plusieurs approches pour concevoir une approche généralisable. Le cas échéant, l’approche sera comparée au benchmark de l’état de l’art et pourra être sujette à la rédaction d’un article de recherche.

Étape 4 : Construction d’une solution et test chez différents clients
Vous travaillerez sur la structuration de la solution d’un point de vue Business afin qu’elle puisse être intégrée aux offres d’OCTO.

Objectifs du stage

L’objectif du stage consiste à identifier ces approches de génération automatique de dictionnaires de données en fonction du contexte, les implémenter, évaluer leurs performances et proposer des améliorations basées sur les dernières techniques de NLP.

Encadrement

Vous effectuerez votre stage au sein de la tribu Applied Intelligence Data Science & Data Advisory (AIDA), et serez encadré·e par un Octo, spécialiste en Data Science. Vous serez suivi·e tout au long de votre projet (entretiens hebdomadaires avec votre tuteur, soutien de la tribu AIDA ainsi que de la communauté OCTO).