UE1.5 · 4 ECTS

Projet d'Initiation Data

60h Projet — 7 phases. Première analyse de données de bout en bout, en équipe, sur un dataset public malgache.

7 Phases60h Projet👥 3-4 pers.
1

Phase 1 : Kickoff — équipe, dataset, charte de projet

Semaine 20Atelier · 2h

Formez votre équipe de 3-4 personnes. Choisissez un dataset public malgache (instat.mg, fao.org/faostat, data.worldbank.org). Définissez 3 questions analytiques. Signez la charte de projet.

📋 Checklist de livraison
✅ Code Python commenté dans un Jupyter Notebook
✅ Dataset nettoyé exporté en CSV
✅ README.md du dépôt GitHub mis à jour
✅ Slides préparées
2

Phase 2 : Audit et compréhension des données

Semaine 21Atelier · 2h

Explorez le dataset : dimensions, types, valeurs manquantes, doublons. Évaluez la qualité : quelles colonnes sont exploitables ? Rédigez un rapport d'audit de 2 pages.

📋 Checklist de livraison
✅ Code Python commenté dans un Jupyter Notebook
✅ Dataset nettoyé exporté en CSV
✅ README.md du dépôt GitHub mis à jour
✅ Slides préparées
3

Phase 3 : Nettoyage complet du dataset

Semaine 22Atelier · 2h

Appliquez le pipeline de nettoyage : supprimer doublons, imputer les NaN, corriger les types, traiter les outliers avec la règle 1.5×IQR. Exportez le dataset propre.

📋 Checklist de livraison
✅ Code Python commenté dans un Jupyter Notebook
✅ Dataset nettoyé exporté en CSV
✅ README.md du dépôt GitHub mis à jour
✅ Slides préparées
4

Phase 4 : Analyse exploratoire — EDA

Semaine 23Atelier · 2h

Analysez chaque variable (distributions, quartiles). Calculez les corrélations. Formulez 3 hypothèses testables à partir des patterns observés.

📋 Checklist de livraison
✅ Code Python commenté dans un Jupyter Notebook
✅ Dataset nettoyé exporté en CSV
✅ README.md du dépôt GitHub mis à jour
✅ Slides préparées
5

Phase 5 : Visualisation et storytelling

Semaine 24Atelier · 2h

Créez 3 visualisations professionnelles avec titre, axes labellisés, source. Construisez une narration : quel est le message de chaque graphique ?

📋 Checklist de livraison
✅ Code Python commenté dans un Jupyter Notebook
✅ Dataset nettoyé exporté en CSV
✅ README.md du dépôt GitHub mis à jour
✅ Slides préparées
6

Phase 6 : Rédaction rapport et slides

Semaine 25Atelier · 2h

Rédigez le rapport (5-8 pages, structure IMRAD). Préparez les slides (10-12 max, 1 idée par slide). Répétez la présentation 3 fois chronométrée.

📋 Checklist de livraison
✅ Code Python commenté dans un Jupyter Notebook
✅ Dataset nettoyé exporté en CSV
✅ README.md du dépôt GitHub mis à jour
✅ Slides préparées
7

Phase 7 : Soutenance du projet

Semaine 26Atelier · 2h

Présentez 10 minutes devant le jury. Répondez aux questions 5 minutes. Évaluez les autres équipes. Intégrez les retours du jury.

📋 Checklist de livraison
✅ Code Python commenté dans un Jupyter Notebook
✅ Dataset nettoyé exporté en CSV
✅ README.md du dépôt GitHub mis à jour
✅ Slides préparées