Support formation Microsoft Azure

...

Gérer et superviser les activités d’un entrepôt de données dans Azure Synapse Analytics [WiP]

Gonzague Ducos

Mettre à l’échelle des ressources de calcul dans Azure Synapse Analytics

Capacité de mise à l’échelle des ressources de calcul pour les pools SQL ou Spark.

L’unité d’échelle est une abstraction de la puissance de calcul connue sous le nom de Data Warehouse Unit (DWU).

Augmenter (« scale-up ») ou diminuer (« scale-down ») la puissance de calcul pour répondre aux besoins.

⁠

Ensuite ajuster le curseur pour mettre à l’échelle le pool SQL

ALTER DATABASE mySampleDataWarehouse

MODIFY (SERVICE_OBJECTIVE = 'DW300c');

Set-AzSqlDatabase -ResourceGroupName "resourcegroupname" -DatabaseName "mySampleDataWarehouse" -ServerName "sqlpoolservername" -RequestedServiceObjectiveName "DW300c"

Mise à l’échelle de pools Apache Spark dans Azure Synapse Analytics

Durant la création d’un pool Spark, il est possible de définir un nombre minimal et un nombre maximal de nœuds quand l’option Mise à l’échelle automatique est sélectionnée.

Le nombre minimal de nœuds ne peut pas être inférieur à trois.

La mise à l’échelle automatique surveille :

Métrique

Description

Total Pending CPU

Nombre total de cœurs requis pour commencer l’exécution de tous les nœuds en attente.

Total Pending Memory

Mémoire totale (en Mo) nécessaire pour commencer l’exécution de tous les nœuds en attente.

Total Free CPU

Somme de tous les cœurs inutilisés sur les nœuds actifs.

Total Free Memory

Somme de la mémoire inutilisée (en Mo) sur les nœuds actifs.

Used Memory per Node

Charge sur un nœud. Un nœud sur lequel 10 Go de mémoire sont utilisés est considéré comme étant plus sollicité qu’un nœud avec 2 Go de mémoire utilisés.

There are no rows in this table

⁠

Mis à l’échelle dans les conditions suivantes :

Scale-up

Scale-down

« Total pending CPU » est supérieur à la valeur de « Total free CPU » pendant plus de 1 minute.

« Total pending CPU » est inférieur à la valeur de « Total free CPU » pendant plus de 2 minutes.

« Total pending memory » est supérieur à la valeur de « Total free memory » pendant plus de 1 minute.

« Total pending memory » est inférieur à la valeur de « Total free memory » pendant plus de 2 minutes.

There are no rows in this table

⁠

Mettre en pause le calcul dans Azure Synapse Analytics

Dans le portail Azure, vous pouvez utiliser la commande Mettre en pause dans le pool SQL dédié.

Elle peut aussi être utilisée dans Azure Synapse Studio pour les pools Apache Spark, dans le hub Gérer.

Gérer des charges de travail dans Azure Synapse Analytics [WiP]

Utiliser Azure Advisor pour passer en revue des recommandations

Azure Advisor adresse des messages personnalisés avec des informations sur les bonnes pratiques à mettre en œuvre pour optimiser la configuration de vos services Azure.

Portail Azure > Advisor

Domaines suivants :

Coût

Sécurité

Fiabilité

Excellence opérationnelle

Performances

Fonctionnement d’Azure Synapse Analytics avec Azure Advisor

Azure Synapse Analytics capture les données de télémétrie suivantes :

Informations sur l’asymétrie des données et sur les tables répliquées.

Données statistiques sur les colonnes.

Données d’utilisation de TempDB.

Cache adaptatif.

Les recommandations d’Azure Advisor sont vérifiées toutes les 24 heures.

Utiliser des vues de gestion dynamique pour identifier et résoudre les problèmes de performance des requêtes

Les vues de gestion dynamique permettent de superviser l’activité des pools SQL Azure Synapse Analytics à l’aide du langage Transact-SQL.

Identifier et de résoudre les goulots d’étranglement qui nuisent aux performances des charges de travail actives.

Egalement utilisées par d’autres services comme Azure Advisor pour fournir des recommandations sur Azure Synapse Analytics.

90 vues de gestion dynamique différentes.

récupérer des informations sur les aspects suivants du service :

Informations et activité de connexion

Requêtes et demandes d’exécution SQL

Informations d’index et de statistiques

Activité de blocage et de verrouillage de ressources

Activité du service de déplacement des données

Erreurs

Analyse des connexions

-- Other Active Connections

SELECT * FROM sys.dm_pdw_exec_sessions where status <> 'Closed' and session_id <> session_id();

Surveillance de l’exécution des rêquetes

Toutes les requêtes exécutées sur le pool SQL sont journalisées dans sys.dm_pdw_exec_requests.

Étape 1

Identifier la requête que vous souhaitez examiner

-- Monitor active queries

SELECT *

FROM sys.dm_pdw_exec_requests

WHERE status not in ('Completed','Failed','Cancelled')

AND session_id <> session_id()

ORDER BY submit_time DESC;

-- Find top 10 queries longest running queries

SELECT TOP 10 *

FROM sys.dm_pdw_exec_requests

ORDER BY total_elapsed_time DESC;

Noter l’ID de la requête

Étape 2

-- Find the distributed query plan steps for a specific query.

-- Replace request_id with value from Step 1.

SELECT * FROM sys.dm_pdw_request_steps

WHERE request_id = 'QID####'

ORDER BY step_index;

Utiliser l’ID de requête pour récupérer le plan SQL distribué (DSQL) des requêtes dans sys.dm_pdw_request_steps.

Envisagez d’optimiser vos distributions de table pour réduire le déplacement des données

Étape 3

Utilisez l’ID de requête et l’index de l’étape pour récupérer des détails dans sys.dm_pdw_sql_requests :

-- Find the distribution run times for a SQL step.

-- Replace request_id and step_index with values from Step 1 and 3.

SELECT * FROM sys.dm_pdw_sql_requests

WHERE request_id = 'QID####' AND step_index = 2;

Quand l’étape de la requête est en cours d’exécution, DBCC PDW_SHOWEXECUTIONPLAN peut être utilisé pour récupérer le plan estimé de SQL Server dans le cache du plan SQL Server pour l’étape en cours d’exécution dans une distribution particulière

-- Find the SQL Server execution plan for a query running on a specific SQL pool or control node.

-- Replace distribution_id and spid with values from previous query.

DBCC PDW_SHOWEXECUTIONPLAN(1, 78);

Étape 4

Utilisez l’ID de requête et l’index de l’étape pour récupérer des informations sur une étape de déplacement des données en cours d’exécution sur chaque distribution dans sys.dm_pdw_dms_workers.

-- Find information about all the workers completing a Data Movement Step.

-- Replace request_id and step_index with values from Step 1 and 3.

SELECT * FROM sys.dm_pdw_dms_workers

WHERE request_id = 'QID####' AND step_index = 2;

Vérifiez la colonne total_elapsed_time pour voir si une distribution particulière prend plus de temps que les autres pour le déplacement des données.

Pour la distribution de longue durée, vérifiez la colonne rows_processed pour voir si le nombre de lignes déplacées dans le cadre de cette distribution est nettement plus élevé qu’avec les autres.

Vous pouvez aussi superviser d’autres aspects des pools SQL Azure Synapse, notamment :

Supervision des attentes

Supervision de tempdb

Supervision de la mémoire