Etape 1 : Python pour la data (2 mois)
- Python : syntaxe, fonctions, classes
- pandas et numpy pour la manipulation de donnees
- Matplotlib et Seaborn pour la visualisation
- Jupyter Notebooks
Etape 2 : Mathematiques et statistiques (2-3 mois)
- Statistiques descriptives et inferentielles
- Probabilites et distributions
- Algebre lineaire (vecteurs, matrices)
- Calcul differentiel (gradient)
- Tests statistiques (t-test, chi-2)
Etape 3 : Machine Learning (3-4 mois)
- Regression lineaire et logistique
- Arbres de decision et Random Forest
- SVM, KNN, Naive Bayes
- Clustering (K-Means, DBSCAN)
- Reduction de dimensionnalite (PCA)
- Validation croisee, overfitting, regularisation
- Feature engineering
Etape 4 : Deep Learning (2 mois)
- Reseaux de neurones (perceptron, backpropagation)
- CNN pour la vision (images)
- RNN/LSTM pour les sequences
- Transformers et NLP moderne
- TensorFlow ou PyTorch
Etape 5 : MLOps et production (1-2 mois)
- Docker pour le packaging
- APIs de prediction (FastAPI)
- MLflow pour le tracking
- Deploiement cloud (AWS SageMaker ou GCP Vertex AI)
Etape 6 : Specialisation
Choisissez un domaine : NLP, Computer Vision, Recommandation, Time Series, IA generative.
Timeline
12-18 mois. Un background en maths/ingenierie reduit significativement la duree.