Difference avec Data Scientist
Le ML Engineer se concentre sur la mise en production des modeles, pas sur la recherche. Il est a mi-chemin entre Data Scientist et Software Engineer.
Etape 1 : Software Engineering solide (2-3 mois)
- Python avance (OOP, design patterns)
- Tests unitaires et d'integration
- Git workflow professionnel
- Clean code et refactoring
- API design (FastAPI, Flask)
Etape 2 : Machine Learning applique (3-4 mois)
- scikit-learn en profondeur
- Feature engineering avance
- Pipelines de preprocessing
- Evaluation et selection de modeles
- Hyperparameter tuning
Etape 3 : Deep Learning (2-3 mois)
- PyTorch (standard industrie)
- Training distribue
- Transfer learning et fine-tuning
- Transformers (Hugging Face)
- LLMs et IA generative
Etape 4 : Production (2-3 mois)
- Serving : FastAPI, TorchServe, vLLM
- Conteneurisation Docker
- Kubernetes pour le scaling
- Batch vs real-time inference
- GPU optimization et quantization
Etape 5 : MLOps (2 mois)
- MLflow / Weights & Biases
- Feature stores
- Model registry et versioning
- Monitoring (data drift, model decay)
- Pipelines automatises (Airflow, Kubeflow)
Timeline
12-18 mois pour un profil avec des bases en dev ou data science.