Prerequis
3+ ans en DevOps, backend dev ou sysadmin. Maitrise de Linux, reseaux et scripting.
Etape 1 : Principes SRE (1 mois)
- Le livre SRE de Google
- SLOs, SLIs, Error Budgets
- Toil et automatisation
- Blameless post-mortems
- On-call et incident management
Etape 2 : Observabilite avancee (2-3 mois)
- Les 3 piliers : metrics, logs, traces
- Prometheus + Grafana (metriques)
- ELK/Loki (logs)
- Jaeger/Tempo (traces distribuees)
- OpenTelemetry
- Alerting intelligent
Etape 3 : Performance et capacite (2 mois)
- Load testing (k6, Locust)
- Capacity planning
- Profiling et optimization
- Auto-scaling et resource management
- CDN et caching strategies
Etape 4 : Chaos Engineering (1 mois)
- Principes du chaos engineering
- Chaos Monkey, Litmus, Gremlin
- Game days
- Resilience testing
Etape 5 : Automatisation avancee (2 mois)
- IaC avancee (Terraform modules, Crossplane)
- Self-healing systems
- Runbook automation
- Platform engineering
Timeline
6-12 mois de specialisation post-DevOps.