Database
Intermediaire Amazon Web Services 138 EUR 170 minutes

AWS Data Engineer Associate

Certification AWS pour l'ingenierie de donnees et les pipelines de donnees cloud.

Prix examen
138 EUR
Duree examen
170 minutes
Validite
3 ans
Niveau
Intermediaire
Prerequis : Experience en ingenierie de donnees, connaissance AWS de base

AWS Data Engineer Associate : les pipelines de donnees sur AWS

La certification AWS Certified Data Engineer - Associate est la plus recente du programme AWS. Elle valide les competences pour concevoir, construire et maintenir des pipelines de donnees sur AWS.

Domaines de l'examen

Ingestion et transformation des donnees (34%) : le domaine le plus important. Concevoir des pipelines d'ingestion batch et streaming. Services : AWS Glue (ETL), Kinesis (Data Streams, Firehose, Analytics), Lambda, Step Functions, EMR (Apache Spark), Athena.

Stockage et gestion des donnees (26%) : choisir le bon service de stockage selon le cas d'usage. S3 (lifecycle policies, partitioning), Redshift, DynamoDB, RDS/Aurora, Lake Formation (gouvernance du data lake). Gestion du catalogue de donnees avec Glue Data Catalog.

Operations des pipelines de donnees (22%) : automatiser, monitorer et depanner les pipelines. CloudWatch, EventBridge, SNS pour les alertes. Orchestration avec Step Functions et MWAA (Managed Apache Airflow). Logging et audit.

Securite et gouvernance des donnees (18%) : IAM, Lake Formation (permissions fine-grained au niveau table/colonne/ligne), chiffrement KMS, VPC endpoints, masquage des donnees sensibles. Conformite RGPD, retention et suppression des donnees.

Services AWS pour l'ingenierie de donnees

Ingestion :

  • Kinesis Data Streams : ingestion de donnees en streaming temps reel
  • Kinesis Data Firehose : livraison de donnees en streaming vers S3, Redshift, OpenSearch
  • AWS DMS : migration de bases de donnees avec replication continue (CDC)
  • AWS AppFlow : integration de donnees SaaS (Salesforce, Slack, SAP)

Transformation :

  • AWS Glue : ETL serverless avec Spark, crawlers pour la decouverte de schema
  • Amazon EMR : clusters Spark/Hive/Presto pour le big data
  • Amazon Athena : requetes SQL serverless sur S3

Stockage :

  • Amazon S3 : stockage objet pour le data lake (Parquet, ORC, JSON, CSV)
  • Amazon Redshift : entrepot de donnees analytique (columnstore, distribution, sort keys)
  • Amazon DynamoDB : NoSQL pour les acces a faible latence

Orchestration :

  • AWS Step Functions : orchestration visuelle de workflows
  • Amazon MWAA : Apache Airflow gere pour les DAGs complexes

Architecture Data Lake sur AWS

L'examen teste votre comprehension de l'architecture data lake moderne :

  • Raw zone (Bronze) : donnees brutes dans S3, format original
  • Curated zone (Silver) : donnees nettoyees, dedupliquees, format Parquet
  • Consumption zone (Gold) : donnees aggregees, pret pour l'analytique et le ML
  • Gouvernance : Lake Formation pour les permissions, Glue Data Catalog pour les metadonnees

Preparation

  1. AWS Skill Builder : cours officiels gratuits pour le Data Engineer Associate
  2. Labs pratiques : construisez un pipeline complet (ingestion S3, transformation Glue, requetes Athena, visualisation QuickSight)
  3. Glue et Kinesis : ce sont les services les plus testes, maitrisez-les en profondeur
  4. Examens blancs : Tutorials Dojo et examens pratiques AWS
  5. Documentation : les best practices AWS pour les data lakes et les pipelines de donnees

Impact sur le salaire

+10 a 20% selon experience et marche

Besoin d'un accompagnement pour vos certifications ?

Decrivez votre parcours pour des recommandations personnalisees.

Recevoir des conseils

Questions frequentes

Cette certification remplace-t-elle la Big Data Specialty ?
Oui, AWS a retire la certification Big Data Specialty et l'a remplacee par la Data Engineer Associate. Cette derniere est plus moderne, couvre les services recents et est de niveau Associate plutot que Specialty.
Faut-il connaitre Apache Spark pour cette certification ?
Des connaissances de base en Spark sont utiles car AWS Glue et EMR utilisent Spark. Vous devez comprendre les concepts (DataFrames, transformations, actions) mais pas ecrire du code Spark complexe.

Pages liees

Chaque semaine, le meilleur de la tech francaise

Tendances, salaires, outils et opportunites — directement dans votre boite mail.

Gratuit. Desabonnement en un clic. Pas de spam.