Documentation, certifications, livres et plan d'etude
Guide de bonnes pratiques pour les architectures data sur AWS. Couvre les piliers : excellence operationnelle, securite, fiabilite, performance et optimisation des couts.
Documentation complete pour configurer et gerer un Data Lake securise avec Lake Formation. Inclut la gestion des permissions, le catalogage et la gouvernance.
Architectures de reference pour les solutions analytiques : streaming, batch, lakehouse, data mesh sur AWS.
Framework d'architecture couvrant la conception de systemes data sur GCP. Inclut les patterns de Data Warehouse, Data Lake et traitement en streaming.
Guide complet de BigQuery : optimisation des requetes, partitionnement, clustering, materialized views, BI Engine et controle des couts.
Collection de solutions architecturales preconstruites pour les cas d'usage analytiques courants, de l'IoT au machine learning.
Architectures de reference pour les donnees sur Azure : Modern Data Warehouse, Lambda/Kappa architecture, streaming analytics.
Documentation de la plateforme analytique unifiee Fabric : OneLake, Data Factory, Synapse Data Engineering, Power BI integre.
Guide de conception pour les workloads data : fiabilite, securite, optimisation des couts et excellence operationnelle sur Azure.
| Certification | Organisme | Difficulte | Duree Prep. | Pertinence |
|---|---|---|---|---|
| TOGAF 10 Certified | The Open Group | Intermediate | 4-6 semaines | Architecture d'entreprise, frameworks, gouvernance |
| AWS Certified Data Engineer - Associate | Amazon Web Services | Associate | 6-8 semaines | Data pipelines, ingestion, transformation sur AWS |
| Google Cloud Professional Data Engineer | Google Cloud | Professional | 8-10 semaines | Architecture data sur GCP, BigQuery, Dataflow, ML |
| Azure Data Engineer Associate (DP-203) | Microsoft | Associate | 6-8 semaines | Synapse, Data Factory, Databricks sur Azure |
| Databricks Data Engineer Associate | Databricks | Associate | 4-6 semaines | Lakehouse, Delta Lake, Spark, Unity Catalog |
| Snowflake SnowPro Core | Snowflake | Foundation | 3-4 semaines | Architecture Snowflake, performance, securite |
| CDMP (Certified Data Management Professional) | DAMA International | Variable | 8-12 semaines | Gouvernance, qualite, architecture globale |
| FinOps Certified Practitioner | FinOps Foundation | Foundation | 2-3 semaines | Optimisation des couts cloud |
Format : 2 examens (Foundation + Certified)
Contenu : ADM, Architecture Content Framework, Enterprise Continuum, Architecture Capability
Cout : ~500-700 EUR (les 2 examens)
Validite : Permanente (pas de renouvellement)
Format : 85 questions, 170 minutes
Contenu : Ingestion (Kinesis, Glue), Transformation (EMR, Glue ETL), Serving (Redshift, Athena), Securite et Gouvernance
Cout : 150 USD
Validite : 3 ans
Format : 50-60 questions, 120 minutes
Contenu : Design de systemes data, pipelines ML, BigQuery, Dataflow, Pub/Sub, securite et compliance
Cout : 200 USD
Validite : 2 ans
Format : 50 questions, 60 minutes
Contenu : Principes FinOps, Inform/Optimize/Operate, showback/chargeback, unit economics
Cout : 300 USD (inclut formation)
Validite : 2 ans
Comparaison detaillee des architectures Data Warehouse, Data Lake, Data Lakehouse et Data Mesh. Excellent pour comprendre quand utiliser chaque approche et comment les combiner.
La reference absolue pour la modelisation dimensionnelle. Indispensable meme dans un contexte Lakehouse car les principes de modelisation restent fondamentaux.
Vue d'ensemble du Data Engineering moderne : ingestion, transformation, serving, orchestration, securite. Excellent complement pour comprendre l'ecosysteme complet.
Architecture data a l'echelle de l'entreprise : patterns d'integration, data mesh, gouvernance federee, APIs de donnees. Tres pertinent pour les grandes organisations.
Comprendre le reseau dans les architectures cloud : VPC, peering, private link, hybride. Important pour la securite et la performance des data platforms.
Le livre fondamental sur les systemes distribues, la replication, le partitionnement, les transactions. Essentiel pour comprendre les compromis architecturaux.
Documentation officielle de TOGAF 10 : ADM, Architecture Content Framework, meilleures pratiques. Necessaire pour la certification et la pratique de l'architecture d'entreprise.
Le guide de reference pour la gestion des couts cloud. Couvre les principes FinOps, les pratiques organisationnelles, les outils et les metriques. Indispensable pour maitriser les budgets data.
Objectifs : Comprendre les patterns architecturaux (Warehouse, Lake, Lakehouse), les open table formats (Iceberg, Delta, Hudi), et le concept de Medallion Architecture.
Actions : Lire les chapitres 1-3 de "Deciphering Data Architectures". Completer les lecons 1-2 du Module 4.1. Installer un environnement local avec MinIO + Iceberg + Spark.
Objectifs : Maitriser les services data des deux premiers cloud providers. Comprendre les architectures de reference et les cas d'usage.
Actions : Completer les lecons 3-4 du Module 4.1. Creer un free tier AWS et un projet GCP. Deployer un pipeline simple sur chaque plateforme (S3+Glue+Athena, GCS+Dataflow+BigQuery).
Objectifs : Decouvrir Azure et Microsoft Fabric. Apprendre TOGAF ADM pour les architectes data. Maitriser les couches de securite data.
Actions : Completer les lecons 5-8 du Module 4.1. Commencer la lecture de "TOGAF Standard v10". Creer les premiers artefacts TOGAF pour un projet fictif. Passer le Quiz Architecture.
Objectifs : Maitriser les data contracts, la validation de schemas et la couche semantique.
Actions : Completer les lecons 10-12 du Module 4.2. Rediger un data contract complet pour un dataset reel. Implementer une validation avec Soda ou Great Expectations. Configurer un semantic layer basique avec dbt.
Objectifs : Comprendre les patterns d'acces aux donnees : REST, GraphQL, gRPC. Decouvrir la data virtualization.
Actions : Completer les lecons 13-15 du Module 4.2. Creer une API REST simple exposant des donnees. Experimenter avec Hasura ou Denodo (version gratuite) pour la virtualisation. Passer le Quiz Data Contracts.
Objectifs : Appliquer les principes FinOps aux plateformes data. Savoir estimer et optimiser les couts.
Actions : Completer les lecons 16-18 du Module 4.3. Utiliser les calculateurs de prix AWS/GCP/Azure pour estimer les couts d'une architecture. Creer un dashboard de suivi des couts.
Objectifs : Synthetiser tous les apprentissages en designant une data platform complete. Valider les acquis avec l'examen final.
Actions : Completer le Projet (lecon 19) : designer une data platform de bout en bout incluant ingestion, stockage, traitement, serving, securite, contracts et estimation des couts. Passer l'Examen Final Phase 4.
Outil en ligne de commande pour valider, tester et documenter les data contracts au format YAML. Supporte la detection de breaking changes et la generation de documentation.
Moteur de requetes distribue pour la federation multi-sources. Supporte +30 connecteurs (PostgreSQL, MongoDB, S3/Iceberg, Elasticsearch, Kafka, etc.).
Semantic layer API-first avec cache de pre-aggregation integre. Expose les metriques via REST, GraphQL et SQL. Ideal pour les applications data.
Plateforme de lakehouse ouverte avec data virtualization, reflections (cache automatique), et support natif Apache Iceberg. Edition Community gratuite.
S3 (5 Go), Glue (1M objets catalogue), Athena (premiers 1 To/mois gratuits). Ideal pour tester une architecture AWS data complete.
10 Go de stockage + 1 To de requetes/mois gratuitement. Pas besoin de carte bancaire. Parfait pour pratiquer BigQuery et GCS.
$200 de credits pour 30 jours + services gratuits pendant 12 mois. Inclut ADLS, Synapse Serverless, et Cosmos DB.
Cluster Spark gratuit (1 noeud), notebooks interactifs, Delta Lake. Ideal pour pratiquer Spark, Delta et les lakehouse patterns.
$400 de credits pendant 30 jours (tous les clouds). Suffisant pour tester warehouses, Iceberg tables, data sharing et gouvernance.
The Open Group propose des ressources d'apprentissage et des examens blancs pour preparer la certification TOGAF 10.
Parcours officiel AWS couvrant S3, Glue, Athena, Redshift, Lake Formation. Inclut des labs pratiques sur la console AWS.
Specialisation de 5 cours par Google Cloud couvrant BigQuery, Dataflow, Pub/Sub, Cloud Composer. Preparation a la certification GCP PDE.
Parcours gratuit Microsoft couvrant Synapse, Data Factory, ADLS, Databricks sur Azure. Labs interactifs inclus.
Formation et certification officielle FinOps. Couvre les principes Inform/Optimize/Operate, showback/chargeback, et unit economics.