📚 Ressources Phase 3

Ecosysteme Modern Data Stack - Cours, livres, certifications et outils

📄
Documentation Officielle

❄ Snowflake Documentation

Documentation complete de Snowflake : architecture, SQL, fonctions, administration, et bonnes pratiques.

GratuitReference
docs.snowflake.com ↗

☁ Google BigQuery Docs

Documentation officielle BigQuery : guides, reference SQL, meilleures pratiques, tarification.

GratuitReference
cloud.google.com/bigquery/docs ↗

⚡ Databricks Documentation

Guides Databricks : Spark, Delta Lake, Unity Catalog, MLflow, SQL Warehouses.

GratuitReference
docs.databricks.com ↗

🔨 dbt Documentation

Guide complet dbt : installation, modeles, tests, macros, packages, deployment.

GratuitEssentiel
docs.getdbt.com ↗

🌈 Apache Airflow Docs

Documentation Airflow : concepts, tutoriels, reference API, providers, bonnes pratiques.

GratuitReference
airflow.apache.org ↗

🔄 Dagster Documentation

Guides Dagster : Software-Defined Assets, integrations, deployment, testing.

GratuitReference
docs.dagster.io ↗

🎓
Cours en Ligne

dbt Fundamentals

Cours officiel dbt Labs. Apprenez les bases de dbt : modeles, tests, documentation. Prerequis: SQL basique.

GratuitDebutant4-6h
dbt Learn ↗

★ Recommande comme premier cours dbt

The Complete dbt Bootcamp

Bootcamp complet dbt sur Udemy : du zero au heros. Projet complet avec Snowflake, tests, CI/CD.

Intermediaire12h
Udemy ↗

Snowflake - The Complete Masterclass

Masterclass Snowflake : architecture, SQL, performance, data sharing, Snowpipe, preparation SnowPro.

Complet20h
Udemy ↗

Google Cloud Data Engineer

Preparation certification GCP Data Engineer. BigQuery, Dataflow, Pub/Sub, Dataproc, BigLake.

Certification40h
Coursera ↗

Apache Airflow: The Hands-On Guide

Par Marc Lamberti (Astronomer). Le meilleur cours Airflow : DAGs, operators, TaskFlow API, production deployment.

Intermediaire12h
Udemy ↗

★ Le cours Airflow le plus recommande

Snowflake Learn (Hands-on Labs)

Labs interactifs Snowflake officiels : guides pratiques, tutoriels, badges, preparation certifications.

GratuitPratique
learn.snowflake.com ↗

Databricks Academy

Cours officiels Databricks : Spark, Delta Lake, Unity Catalog, MLflow. Preparation certifications.

Gratuit/$$Certification
databricks.com/learn ↗

dbt Advanced Materializations

Cours avance dbt Labs : incremental models, snapshots, hooks, packages avances.

GratuitAvance3h
dbt Learn ↗

🏆
Certifications Recommandees

CertificationEditeurDureePrixDifficulte
SnowPro Core (COF-C02)Snowflake115 min, 100 questions$175Intermediaire
Google Professional Data EngineerGoogle Cloud120 min, 50-60 questions$200Avance
Databricks Data Engineer AssociateDatabricks90 min, 45 questions$200Intermediaire
Databricks Data Engineer ProfessionalDatabricks120 min, 60 questions$300Avance
dbt Analytics Engineering Certificationdbt Labs60 min, 65 questions$200Intermediaire

💡 Conseil du Mentor

Passez la SnowPro Core en premier : c'est la plus demandee sur le marche et la plus accessible. Ensuite, visez la Google Professional Data Engineer ou Databricks Associate selon votre ecosysteme. La certification dbt est un bonus apprecie par les recruteurs.

📚
Livres Recommandes

📖 Fundamentals of Data Engineering

Par Joe Reis & Matt Housley (O'Reilly, 2022). LE livre de reference pour comprendre tout l'ecosysteme modern data stack. Couvre ingestion, transformation, stockage, serving.

EssentielIntermediaire

★★★★★ La bible du Data Engineer moderne

📖 Data Pipelines Pocket Reference

Par James Densmore (O'Reilly, 2021). Guide pratique et concis pour construire des pipelines de donnees fiables et maintenables.

PratiqueIntermediaire

📖 Spark: The Definitive Guide

Par Bill Chambers & Matei Zaharia (O'Reilly, 2018). Reference complete pour Apache Spark : DataFrames, Structured Streaming, MLlib.

ReferenceAvance

📖 Delta Lake: The Definitive Guide

Par Denny Lee et al. (O'Reilly, 2024). Tout sur Delta Lake : ACID, time travel, optimization, Unity Catalog, Liquid Clustering.

SpecialiseIntermediaire

📖 Apache Iceberg: The Definitive Guide

Par Tomer Shiran et al. (O'Reilly, 2024). Reference complete sur Iceberg : architecture, partition evolution, hidden partitioning, multi-engine.

SpecialiseAvance

📖 Analytics Engineering with SQL and dbt

Par Rui Machado & Helder Russa (O'Reilly, 2024). Guide pratique pour les analytics engineers : workflow dbt, tests, CI/CD, deployment.

PratiqueIntermediaire

🔧
Outils & Plateformes

🔨 Airbyte

Plateforme d'integration de donnees open source. 350+ connecteurs pour synchroniser vos sources vers votre warehouse.

Open SourceELT
docs.airbyte.com ↗

🔌 Fivetran

Leader du ELT manage. Connecteurs automatises avec CDC integre. Ideal pour les equipes qui ne veulent pas gerer l'infra.

ELT Manage
fivetran.com/docs ↗

📊 Apache Iceberg

Format de table open pour les data lakes. ACID transactions, time travel, schema evolution, partition evolution.

Open SourceTable Format
iceberg.apache.org ↗

🚀 Prefect

Orchestrateur Python-native moderne. Alternative a Airflow avec meilleure DX et event-driven workflows.

Open SourceOrchestration
docs.prefect.io ↗

🔎 Debezium

Change Data Capture distribue. Capte les changements de bases de donnees en temps reel via Kafka Connect.

Open SourceCDC
debezium.io ↗

📃 DataHub

Data catalog open source (LinkedIn). Metadata management, data lineage, data discovery pour votre stack.

Open SourceData Catalog
datahubproject.io ↗

🔬 Elementary

Monitoring et observabilite pour dbt. Detecte les anomalies, genere des rapports de qualite, alertes Slack automatiques.

Open SourceData Quality
elementary-data.com ↗

📊 Metabase

Outil de BI open source. Dashboards, questions en langage naturel, embedding. Alternative gratuite a Looker/Tableau.

Open SourceBI
metabase.com ↗

🚀 astronomer-cosmos

Integration dbt + Airflow par Astronomer. Convertit automatiquement les modeles dbt en tasks Airflow avec dependances.

Open SourceAirflow + dbt
astronomer-cosmos ↗

💻
Plateformes de Pratique

❄ Snowflake Free Trial

Essai gratuit 30 jours avec $400 de credits. Suffisant pour completer toutes les lecons Snowflake et preparer SnowPro.

Gratuit 30j$400 credits
signup.snowflake.com ↗

☁ BigQuery Sandbox

BigQuery gratuit sans carte bancaire. 1 TB de requetes/mois et 10 GB de stockage. Ideal pour apprendre.

Gratuit permanent1 TB/mois
BigQuery Sandbox ↗

⚡ Databricks Community Edition

Cluster gratuit pour apprendre Spark et Delta Lake. Notebooks interactifs, pas de limite de temps.

Gratuit permanentSpark + Delta
community.cloud.databricks.com ↗

🔨 dbt Learn Platform

Environnement sandbox dbt Cloud gratuit pour les cours officiels. Projet pre-configure avec Snowflake.

Gratuitdbt Cloud
courses.getdbt.com ↗

🔌 Airbyte Local (Docker)

Deployez Airbyte en local avec Docker. Testez l'ingestion de vos sources PostgreSQL, APIs, fichiers vers votre DWH.

Open SourceDocker
Airbyte Local ↗

🔄 Dagster University

Cours interactifs gratuits par l'equipe Dagster. Apprenez les Software-Defined Assets, l'integration dbt, et le deploiement.

GratuitDagster
courses.dagster.io ↗

👥
Communautes & Veille

💬 dbt Community Slack

30K+ membres. LA communaute de reference pour dbt et Analytics Engineering. Channels par sujet, aide rapide.

GratuitCommunaute
Rejoindre ↗

💬 Locally Optimistic Slack

Communaute de data leaders et analytics engineers. Discussions strategiques sur l'organisation data.

GratuitLeadership
locallyoptimistic.com ↗

📰 Data Engineering Weekly

Newsletter hebdomadaire avec les meilleures ressources data engineering, articles, et nouveautes de l'ecosysteme.

GratuitNewsletter
dataengineeringweekly.com ↗

🎥 Seattle Data Guy (YouTube)

Ben Rogojan. Excellentes videos sur le data engineering, modern data stack, career advice.

GratuitYouTube
YouTube ↗

🎤
Conferences & Events

ConferenceFocusFormatQuand
dbt CoalesceAnalytics Engineering, dbtHybrideOctobre
Snowflake SummitSnowflake, Data CloudSan FranciscoJuin
Databricks Data+AI SummitSpark, Delta Lake, AISan FranciscoJuin
Data CouncilData Engineering, ArchitectureMulti-villesMars/Sept
Current (Confluent)Kafka, StreamingAustinSeptembre

🎯 Plan d'etude recommande (Phase 3)

Semaines 1-6: Choisissez un cloud DWH (Snowflake recommande) et completez la masterclass + labs officiels.
Semaines 7-10: dbt Fundamentals (gratuit) puis le bootcamp Udemy. Construisez un projet dbt complet.
Semaines 11-14: Airflow hands-on guide. Deployez un DAG orchestrant votre pipeline dbt.
Semaines 15-16: Integrez Airbyte et testez les formats de fichiers. Passez la certification SnowPro Core.