Le Cloud & la Data Science.
Créer un projet Open Source pour aider les Data Scientists à utiliser le Cloud.

Missions

  • Identifier les besoins des Data Scientists lors de leur utilisation du Cloud.
  • Concevoir un utilitaire simple d'emploi pour exploiter au mieux les différents Cloud majeurs.
  • Implémenter le code imaginé en conception, dans les règles de l'art d'un logiciel Open Source (documenté, intégralement testé, etc.).
  • Faire la promotion de l'outil par le biais d'articles et de talks.

Conditions

Type de stage : Stage de fin d'étude, pré-embauche
Lieu : OCTO Technology 34 avenue de l'Opéra 75002 Paris
Rémunération : 1500 € bruts
Date : 2020

Profil

  • Vous êtes à l'aise avec Python.
  • Vous avez l'esprit d'initative.
  • Vous êtes capable de travailler en autonomie pour concevoir intégralement un outil, et vous êtes fièr·e de publier votre code sur Internet.
  • Vous avez une appétence pour les solutions Cloud majeurs (AWS,Azure, GCP).

Contexte

Étape 1 : Identifier les besoins des Data Scientists
Faire des interviews, rechercher les "best practices", puis les synthétiser dans un document.

Étape 2 : Concevoir un outil
Identifier les paramètres principaux et secondaires, les fonctionnalités offertes, les degrés de liberté.

Étape 3 : Implémenter l'outil
- Dans un premier temps avec un seul fournisseur de Cloud, pour valider la proposition de valeur, puis avec les deux autres (voir plus).
- Rédiger les tests unitaires et d'intégration complets de l'outil.
- Rédiger une documentation complète d'installation et d'utilisation.

Étape 4 : Partage
- Publier le code sur Github ou Gitlab.
- Rédiger un article expliquant la démarche et les bénéfices à utiliser l'outil pour un Data Scientist. Ce dernier sera probablement publié dans GNU Linux Mag.
- Rédiger un résumé de l'article pour le Blog OCTO.
- Présenter les travaux réalisés lors de talks (interne ou externe OCTO).

Objectifs du stage

Vous réaliserez un outil Open Source permettant de rendre le plus simple possible le déclenchement d'un calcul de Data Science sur le Cloud.

Encadrement

Vous serez encadré·e par un Consultant Sénior de la tribu Big Data Analytics, et vous aurez des réunions hebdomadaires de suivi de votre stage. Vous aurez le soutien de ce dernier et de la communauté en cas de difficultés techniques, dans la plus pure tradition OCTO.