Modernisation patrimoine décisionnel avec Snowflake & Dataiku
Expérimentation de Snowflake en interaction avec la plateforme analytique Dataiku au travers de la mise en place d’une maquette visant à migrer un existant décisionnel on premise vers une plateforme analytique Cloud.

Missions

  • Vos objectifs sont :
  • d’expérimenter la solution Snowflake en l’intégrant avec la plateforme analytique Dataiku
  • de développer une maquette à partir d’un jeu de données issu d’une base de données relationnelle (de type PostgreSQL) contenant des données fictives et montrer le chemin de migration/modernisation vers une plateforme Snowflake/Dataiku
  • de présenter le résultat de l’expérimentation à la communauté OCTO

Conditions

Type de stage : stage de fin d'études
Lieu : Paris
Rémunération : 1500 € bruts
Date : 2021

Profil

  • Vous êtes en dernière année d'école d'ingénieur ou équivalent, vous avez une spécialisation dans le domaine de la data science et de l’analytique avancée
  • Vous avez un intérêt pour le Data Engineering, le Machine Learning et l’Intelligence Artificielle. Plus largement, vous avez une grosse appétence pour la technique
  • Vous disposez de compétences sur les langages suivants : R et/ou Python et/ou Java
  • Vous avez des notions sur la conception de modèle de données (SQL, NoSQL, schéma en étoile…)

Contexte

Expérimentation de Snowflake en interaction avec la plateforme analytique Dataiku au travers de la mise en place d’une maquette visant à migrer un existant décisionnel on premise vers une plateforme analytique Cloud.

Objectifs du stage

Etape 1 : Phase de lancement :
Prendre connaissance de la situation fictive initiale et de la base de données fictive initiale
Prendre en main les environnements à disposition (PostgreSQL, Dataiku, Snowflake)
Etape 2 : Construction et développement d’une maquette :
Migration des données du SI relationnel et traditionnel (on premise) vers une cloud data platform Snowflake
Simulation de modernisation des processus BI fictifs de collecte et restitutions (ETL, Reporting) vers des jobs et restitutions Snowflake/Dataiku
Constitution de la maquette end-to-end
Etape 3 : Analyse des travaux effectués et rédaction du document de synthèse :
Analyse des travaux (difficultés rencontrées, “lessons learned”, apports observés, points d’attention…)
Rédaction du document de synthèse et résultats de l’expérimentation (rapport de stage)

Livrables attendus :
Maquette
Document de synthèse contenant les résultats de l’expérimentation
Modalités techniques d'intégration des deux solutions

Encadrement

Vous serez encadré.e par Thomas, Manager OCTO de la tribu APA, certifié sur Dataiku & Snowflake et pourrez vous s’appuyer sur les autres experts décisionnels et data-scientists de la tribu. Vous serez suivi.e. tout au long de votre projet (entretiens hebdomadaires avec votre tuteur, soutien de la communauté OCTO, feedback des pairs…). Vous participerez à toutes les initiatives collectives de la tribu APA, de la league HAPI et d’OCTO. Pour postuler : recrutement-stage@octo.com