Database
 sql >> Base de données >  >> RDS >> Database

Pivotement, non pivotement et fractionnement de colonnes dans l'éditeur de requête Power BI

Pour référence, Power BI est un logiciel de visualisation et d'analyse de données développé par Microsoft. Power BI peut être utilisé pour la visualisation de données statiques et interactives. Avant de pouvoir créer des visualisations réelles avec Power BI, vous pouvez effectuer un prétraitement des données à l'aide de l'éditeur de requête Power BI.

Avec l'éditeur de requêtes, vous pouvez effectuer diverses tâches de transformation de données, telles que la modification des types de colonnes, la gestion des valeurs manquantes, la suppression de lignes et de colonnes, le pivotement et l'annulation du pivotement des colonnes, le fractionnement des colonnes, etc.

Dans cet article, vous verrez comment faire pivoter, annuler le pivotement et fractionner des colonnes à l'aide de l'éditeur de requête Power BI.

Importation d'un ensemble de données dans l'éditeur de requête

L'ensemble de données utilisé comme exemple dans cet article est dans un format de fichier CSV qui peut être téléchargé à l'aide de ce lien kaggle. Téléchargez le fichier CSV dans votre système de fichiers local.

Ensuite, ouvrez Power BI Desktop, cliquez sur le bouton "Obtenir des données" dans le menu supérieur. Dans la liste déroulante, sélectionnez "Texte/CSV" comme indiqué ci-dessous.

Power BI prendra un certain temps pour importer les données. Une fois les données chargées, vous devriez voir la fenêtre ci-dessous.

L'ensemble de données contient des informations sur la population, la superficie, le taux de natalité, le taux de mortalité, la densité de population, le PIB par habitant, les téléphones pour 1000, etc. pour tous les pays du monde. Pour charger les données dans l'éditeur de requête, cliquez sur le bouton "Transformer les données".

L'éditeur de requête ressemble à ceci :

Dans l'éditeur de requête, vous pouvez effectuer divers prétraitements tels que le pivotement, l'annulation du pivotement et le fractionnement des colonnes.

Théorie du pivotement et du non-pivotement

Avant de passer aux colonnes pivotantes et non pivotantes avec l'éditeur de requêtes Power BI. Considérons un exemple très basique d'unpivoting.

Non pivoté

Supposons que vous disposiez d'un ensemble de données contenant les informations suivantes. Les lignes du tableau suivant correspondent aux pays, tandis que les colonnes affichent des informations sur le PIB par habitant et le taux d'alphabétisation pour les pays correspondants dans les lignes. (Remarque :ce ne sont que des valeurs fictives, pas les valeurs réelles)

Pays PIB par habitant Taux d'alphabétisation
France 30 000 95 %
Allemagne 25 000 96 %

Si vous ne pivotez pas une seule colonne, par exemple, le PIB par habitant, l'ensemble de données avec une colonne non pivotée ressemblera à ceci.

Pays Attribut Valeur Alphabétisation
France PIB par habitant 30 000 95 %
Allemagne PIB par habitant 25 000 96 %

Vous pouvez voir que la colonne PIB par habitant a été remplacée par deux colonnes, à savoir, Attribut et Valeur. Les valeurs de la colonne "Attribut" correspondent au nom de la colonne non pivotée, tandis que la colonne "Valeur" contient les valeurs qui existaient auparavant dans la colonne non pivotée. Étant donné qu'une seule colonne n'est pas pivotée, les valeurs de la colonne "Attribut" seront toujours les mêmes. De plus, le nombre de lignes dans l'ensemble de données avec une colonne non pivotée restera le même.

Essayons maintenant de voir ce qui se passe lorsque nous dépivotons deux colonnes. Nous ne pivoterons pas les colonnes du PIB par habitant et du taux d'alphabétisation dans l'ensemble de données d'origine. L'ensemble de données avec deux colonnes non pivotées ressemble à ceci.

Pays Attribut Valeur
France PIB par habitant 30 000
France Taux d'alphabétisation 95 %
Allemagne PIB par habitant 25 000
Allemagne Taux d'alphabétisation 96 %

Dans l'ensemble de données ci-dessus, vous pouvez voir que pour chaque nom de pays, la colonne "Attribut" contient désormais deux valeurs uniques :le PIB par habitant et le taux d'alphabétisation. La colonne "Valeur" contient les valeurs correspondantes pour les attributs. Notez que le nombre de lignes a doublé. De même, si vous annulez le pivotement de trois colonnes, le nombre de lignes dans un ensemble de données est multiplié par trois.

Pivotant

Le pivotement, comme son nom l'indique, fait référence au processus utilisé pour inverser un ensemble de données non pivoté dans sa forme d'origine. Par exemple, en faisant pivoter la table d'entrée ressemble à ceci :

Pays Attribut Valeur
France PIB par habitant 30 000
France Taux d'alphabétisation 95 %
Allemagne PIB par habitant 25 000
Allemagne Taux d'alphabétisation 96 %

Après application du pivot sur les colonnes "Attribut" et "Valeur", le jeu de données prend la forme suivante :

Pays PIB par habitant Taux d'alphabétisation
France 30 000 95 %
Allemagne 25 000 96 %

Maintenant que nous savons ce que sont le pivotement et le non-pivotement, voyons comment les mettre en œuvre avec Power BI.

Pivotement et non pivotement avec Power BI

Voyons d'abord un exemple de la façon d'annuler le pivotement d'une seule colonne avec l'éditeur de requête Power BI. Si vous regardez le jeu de données, il contient une colonne nommée "Population". Pour annuler le pivot de la colonne "Population", cliquez sur l'en-tête de la colonne, puis sélectionnez l'option "Transformer" dans le menu supérieur. Vous verrez un nouveau menu avec plusieurs options apparaître en haut, cliquez sur l'option "Unpivot Columns" dans le menu, puis cliquez sur "Unpivot Columns" dans la liste déroulante, comme indiqué ci-dessous :

La colonne "Population" sera remplacée par les colonnes "Attribut" et "Valeur", comme indiqué ci-dessous :

Maintenant, pour faire pivoter une colonne, vous avez deux options. Vous pouvez cliquer sur l'option "x Colonnes non pivotées" dans la fenêtre "Étapes appliquées", comme indiqué dans la capture d'écran suivante.

L'autre option consiste à sélectionner une colonne, puis à sélectionner "Transform -> Pivot Column" dans le menu supérieur, comme indiqué ci-dessous.

Lors du pivotement d'une colonne, vous devez spécifier la colonne qui contient les valeurs de la colonne non pivotée. Dans notre cas, la colonne "Valeur" contient des valeurs pour la colonne "Attribut" non pivotée. Regardez la capture d'écran suivante pour référence.

La colonne "Population" pivotée ressemble à ceci :

Déplacez la colonne « Population » juste à côté de la colonne « Pop. Densité (par mètre carré) » en cliquant sur l'en-tête de colonne « Population » et en faisant glisser, comme illustré dans la capture d'écran suivante.

Ensuite, nous détacherons deux colonnes, c'est-à-dire "Population" et "Pop". Densité (par mille carré) ». Sélectionnez les deux en-têtes de colonne, puis annulez-les, comme indiqué ci-dessous :

Après l'annulation du pivotement, vous devriez voir les deux colonnes suivantes créées dans l'ensemble de données. Vous pouvez voir que la colonne "Attribut" contient désormais des informations sur "Population" et "Pop. Densité (par mile carré)".

Sélectionnez les deux en-têtes de colonne (CTRL + clic), puis faites glisser les colonnes juste à côté de la colonne "Pays", comme indiqué ci-dessous.

Maintenant, vous pouvez voir les noms de "pays", leur population totale et leur densité de population par mile carré. Changeons le nom de la colonne "Attribut" en "Type de population" puisque la colonne "Attribut" affiche deux types de population :la population totale et la densité de population par mile carré. L'ensemble de données avec un nom d'en-tête de colonne mis à jour ressemble à ceci :

Fractionner les colonnes

Avant de diviser les colonnes, nous remplacerons certaines valeurs dans la colonne "Type de population".

La valeur « Population » dans la colonne « Type de population » fait référence à la population totale. Nous remplacerons la valeur "Population" par "Pop. Total » afin qu'il ait le même modèle que « Pop. Densité (par mille carré) ». Pour remplacer les valeurs dans les colonnes, allez dans "Transformer -> Remplacer les valeurs", comme indiqué dans la capture d'écran suivante.

Après avoir remplacé les valeurs, le jeu de données ressemble à ceci.

Maintenant, nous allons diviser la colonne "Type de population" en deux. Ses cinq premiers caractères seront ajoutés à la première colonne, tandis que les caractères restants seront ajoutés à l'autre colonne. Pour diviser une colonne, allez dans "Transformer -> Diviser les colonnes". Nous allons diviser par cinq premiers caractères, par conséquent, sélectionnez l'option "Diviser par nombre de caractères" dans la liste déroulante. Nous allons diviser la colonne par les 5 premiers caractères les plus à gauche. Pour référence, regardez la capture d'écran suivante.

Une fois les colonnes divisées, vous devriez voir les deux colonnes suivantes.

Nous n'avons besoin que de la colonne "Population Type.2" car elle contient des informations sur le type ou l'échelle de la population. Cliquez sur la colonne « Type de population.1 », puis sélectionnez « Supprimer ».

Enfin, vous pouvez renommer la colonne "Population Type.2" en "Population Type" comme indiqué ci-dessous.

Dans la figure suivante, vous pouvez voir qu'il existe deux types différents de valeurs de population pour chaque pays. La valeur « Total » dans la colonne « Type de population » fait référence à la population totale du pays. La valeur réelle de la population totale est stockée dans la colonne « Valeur de la population ». De même, la valeur "Densité (par mètre carré)" indique que cette valeur de population fait référence à la densité de population.

Conclusion

En résumé, l'article vous montre comment effectuer un pivotement et unpivotement dans l'éditeur de requêtes Power BI. De plus, il couvre la théorie de base derrière les colonnes pivotantes et non pivotantes illustrées par des exemples clairs. Enfin, l'article explique comment le processus de fractionnement des colonnes est implémenté dans l'éditeur de requête Power BI.