Objectifs de la formation

Concevoir une architecture Lakehouse avancee - Modelisation medallion (Bronze/Silver/Gold), partitionnement, optimisation des tables Delta
Maitriser PySpark dans Fabric - Transformations complexes, jointures, fonctions fenetrees, UDF et optimisation des performances
Gerer les donnees avec Delta Lake - Time travel, MERGE (upsert), compaction, vacuum et gestion de schema evolution
Orchestrer des pipelines complexes - Data Factory avance, parametrisation, gestion d'erreurs, ingestion incrementale
Integrer les sources de donnees heterogenes - API REST, fichiers cloud, bases SQL, streaming avec Eventstream
Mettre en place la gouvernance des donnees - Lineage, securite, monitoring des pipelines et bonnes pratiques DevOps

Architecture Medallion

Bronze / Silver / Gold sur Lakehouse

PySpark Avance

Transformations complexes et optimisation

FR / EN

Formation dispensee en francais ou en anglais

Programme detaille (3 jours)

Jour 1 : Architecture Lakehouse et Ingestion Avancee

Architecture medallion (Bronze/Silver/Gold) : principes, avantages, implementation
OneLake en profondeur : shortcuts, mirroring, organisation des donnees
Data Factory avance : parametrisation de pipelines, variables, expressions dynamiques
Ingestion incrementale : watermark, change data capture, pattern SCD Type 2
Gestion d'erreurs et logging dans les pipelines
Atelier pratique : Construire un pipeline d'ingestion incrementale multi-sources avec gestion d'erreurs

Jour 2 : PySpark Avance et Delta Lake

PySpark avance : fonctions fenetrees (window functions), aggregations complexes, pivot
Optimisation Spark : partitionnement, caching, broadcast joins, plan d'execution
Delta Lake en profondeur : MERGE (upsert), DELETE, UPDATE avec predicats
Time travel et versionning : restauration, audit, comparaison de versions
Schema evolution et enforcement : gestion des schemas evoluant dans le temps
Atelier pratique : Transformer les donnees Bronze en Silver puis Gold avec PySpark et Delta MERGE

Jour 3 : Integration, Gouvernance et Projet Final

Eventstream : ingestion de donnees en temps reel depuis Event Hubs, IoT
Data Warehouse dans Fabric : SQL endpoint, vues, procedures stockees T-SQL
Securite et gouvernance : RLS, CLM, lineage des donnees, Microsoft Purview
Monitoring et DevOps : deploiement de pipelines, Git integration, CI/CD
Projet final : Architecture data platform complete - ingestion multi-sources, transformation medallion, gouvernance et monitoring

Prerequis

Connaissance de SQL - Maitrise des SELECT, JOIN, GROUP BY, sous-requetes
Notions de Python - Variables, boucles, fonctions (les bases de PySpark sont couvertes)
Connaissance de base de Microsoft Fabric - Avoir suivi le Bootcamp Fabric Foundation ou equivalent
Experience avec les donnees - Avoir deja travaille avec des fichiers CSV, bases de donnees ou outils BI

Public cible

Data engineers - Qui veulent maitriser le Lakehouse et les pipelines de donnees sur Fabric
Developpeurs Spark/Databricks - Qui souhaitent migrer vers l'ecosysteme Microsoft Fabric
Architectes data - Qui doivent concevoir des architectures data modernes sur Fabric
Ingenieurs ETL/SSIS - Qui veulent evoluer vers le Data Engineering moderne avec Spark
Equipes internationales - Formation dispensee en francais ou en anglais

Devenez Data Engineer Fabric

3 jours (24h)

799€

1 500€

✔ Bootcamp 100% pratique
✔ Architecture Medallion complete
✔ Certification incluse
✔ Support expert pendant 3 mois
✔ Environnement Fabric fourni
✔ Disponible en FR et EN

Prerequis recommande : Bootcamp Fabric Foundation ou experience equivalente

Bootcamp Fabric Data Engineering - 100% Pratique sur Cas Reels

Objectifs de la formation

Architecture Medallion

PySpark Avance

FR / EN

Programme detaille (3 jours)

Jour 1 : Architecture Lakehouse et Ingestion Avancee

Jour 2 : PySpark Avance et Delta Lake

Jour 3 : Integration, Gouvernance et Projet Final

Prerequis

Public cible

Devenez Data Engineer Fabric

Formations Connexes

Fabric Foundation

Fabric Analytics

Bootcamp Power BI

Demander plus d'informations ou un devis