Descriptif général et objectifs :
Le programme de formation BIG MAMA est conçu pour apporter une formation complémentaire aux étudiants voulant s’orienter vers les métiers de la data (analyse de donnée, machine learning et big data). Le programme s’articule autour de deux axes :
- Une formation théorique « en ligne » : ici, le programme tire partis des nombres ressources disponibles en ligne(Mooc, livres, conférences). En parallèle, BIG MAMA, forte de son expérience, fournit aux étudiants une « carte » et un « programme » pour exploiter au mieux les dites ressources.
- Une formation pratique : construite autour de 5 challenges de « Data science », la formation « pratique » vise à confronter les étudiants à des problématiques réelles. Pour ce faire, BIG MAMA mettra à dispositions des étudiants de la donnée réelle et des outils spécifiquement conçu pour accompagner les travaux de data science.
Compétences acquises au terme de la formation :
À la fin du programme, les étudiants ayant suivi le programme avec assiduité devraient être capable d’occuper des positions de Data Scientist dite « junior ». Ils auront développé les compétences nécessaires pour concevoir des algorithmes de machine learning à grande échelle et pour valoriser au maximum la donnée mise à leur disposition. En autre les étudiants reçus devraient être capable de :
Effectuer une analyse exploratoire structurée et efficace.
Concevoir des algorithmes des machines learning performants.
Mettre en œuvre des plans d’expérience robuste, rigoureux et reproductibles.
Déployer des algorithmes de machine learning en production
Intégrer le ’machine learning’ à des applications WEB.
Programme :
Pré requis du programme :
Bases en statistiques
Bases en probabilité
Bases en informatique
Cours Machine Learning :
Apprentissage statistiques simple ( Andrewng – coursera )
Apprentissage par renforcement ( youtube )
Systèmes de recommandation (Documents + challenge Amazon )
Cours d’informatique :
Python
Spark + EcosystèmeHadoop
Elastic Search.
Fonctionnement des API REST + OAuth
Streaming 101.
Data vizualisation.
Bases de GIT.
Architecture logicielle.
Nettoyage de données (OpenRefine ).
Challenges de data science :
- Challenge d’apprentissage par renfoncement : L’idée est de concevoir un algorithme capable de jouer àpacman.
- Challenge en recommandation de produits : Comment recommander des produits aux internautes pour augmenter le panier moyen.
- Challenge « Publicité en ligne »: Comment prédire qui va cliquer sur un espace publicitaire?
- Challenge « Prédiction du temps de trajet d’un voyage UBER » (données de la ville de New YORK)
- Challenge « Analyse de sentiment sur web algérien francophone »: L’objectif ici est d’établir une « cartographie » des quotidiens+blogs francophones algériens pour déterminer le dégrée d’optimisme relatif des différentes publications sur les sujets qu’ils traitent. Ce projet est structurant et complet dans le sens ou l’étudiant sera amène à concevoir une application pour la collecte de la donnée, une seconde pour son traitement et une troisième pour la visualisation interactive des résultats.
Au-delà des problématiques spécifiques à la data sciences. Nous pensons que ce projet sera bénéfique à tous étudiant en informatiques tant il mimique sous beaucoup d’aspects les conditions de travail réelles d’un programmeur.
F.A.Q:
Combien ça coûte aux étudiants ?
Le programme est gratuit.
Quels sont les engagements pris par les étudiants pour participer au programme ?
Les étudiants s’engagent à ne pas tricher et à être assidus.
Comment postuler ?
Consulter vos boites mail pour remplir un formulaire en ligne (Quinze d’étudiants seront retenus pour la formation).