Delta Lake est un projet open source visant à créer une couche de stockage de données transactionnelles au-dessus d’un lac de données.
Ajoute la prise en charge de la sémantique relationnelle pour les opérations de données par lots et en continu,
Permet la création d’une architecture Lakehouse dans laquelle Apache Spark peut être utilisé pour traiter et interroger des données dans des tables basées sur des fichiers sous-jacents dans le lac de données.
La propriété Location indique les dossiers de stockage des fichiers parquets présents : abfss://files@datalakeXXXXXXX.dfs.core.windows.net/delta/products-delta
Affiche le contenu de la table :
%%sql
USE AdventureWorks;
SELECT*FROM ProductsExternal;
La suppression de la table (DROP TABLE) conserve les fichiers sources.
Table gérée
La table est stockée dans un metastore situé : files > synapse > workspaces > synapseXXXXXXX > wharehouse > basededonnees.db > nomtable > *.parquet.