Database
 sql >> Base de données >  >> RDS >> Database

Tutoriel SSIS pour les débutants :pourquoi, quoi et comment ?

Les services d'intégration SQL Server (SSIS) font partie intégrante du logiciel de base de données Microsoft SQL Server. Cela rend le travail de gestion des données beaucoup plus facile avec ses différentes fonctionnalités. Dans ce didacticiel, nous approfondirons SSIS au niveau conceptuel, dans l'ordre suivant :

  • Qu'est-ce que l'intégration de données ?
  • Pourquoi SSIS ?
  • Qu'est-ce que SSIS ?
  • Fonctionnalités de SSIS
  • Comment fonctionne SSIS ?
    • Processus ETL
    • Entreposage de données
  • Exigences pour SQL Server Integration Services
    • Installation de SQL Server
    • Installer les outils de données SQL Server
  • Qu'est-ce que le package SSIS ?

Commençons.

Qu'est-ce que l'intégration de données ?

L'intégration de données est un processus dans lequel des données hétérogènes sont récupérées et combinées sous une forme et une structure incorporées. Par exemple, chaque entreprise doit de nos jours traiter de grands ensembles de données provenant de sources variées. Ces données doivent être traitées pour fournir des informations pertinentes permettant de prendre des décisions commerciales. Une solution simple serait donc l'intégration de données. Il intégrera essentiellement toutes vos données présentes dans les différentes bases de données et les combinera sur la même plateforme.

Voici quelques façons de réaliser l'intégration des données :

Maintenant que vous avez compris l'intégration des données, voyons pourquoi SSIS est utilisé. SSIS signifie SQL Server Integration Services.

Pourquoi SSIS ?

  • Les données peuvent être chargées en parallèle vers de nombreuses destinations variées
  • SSIS supprime le besoin des programmeurs chevronnés
  • Intégration étroite avec d'autres produits de Microsoft
  • SSIS est moins cher que la plupart des autres outils ETL
  • SIS fournit une interface graphique pour transformer facilement les données
  • Intégrer la BI dans un processus de transformation de données
  • Gestion robuste des erreurs et des événements

En avançant dans ce didacticiel SSIS, voyons de quoi il s'agit exactement et comment cela fonctionne.

Qu'est-ce que SSIS ?

SQL Server Integration Services (SSIS) est un composant du logiciel de base de données Microsoft SQL Server qui peut être utilisé pour effectuer un large éventail de tâches d'intégration et de transformation de données.

  • Intégration des données : Il combine les données résidant dans différentes sources et offre aux utilisateurs une vue unifiée de ces données
  • Flux de travail : Il peut également être utilisé pour automatiser la maintenance des bases de données SQL Server et les mises à jour des données analytiques multidimensionnelles

Fonctionnalités de SSIS

Certaines des fonctionnalités permettant d'utiliser SSIS sont :

  • Transformations organisées et de recherche
  • Intégration étroite avec les autres familles Microsoft SQL
  • Fournit des environnements de studio riches
  • Fournit de nombreuses fonctions d'intégration de données pour de meilleures transformations
  • Connectivité de données haut débit

Vous pouvez parcourir la vidéo ci-dessous qui couvre toutes les bases, y compris les concepts d'entreposage de données utilisés pour l'extraction, la transformation et le chargement de données (ETL). Il est idéal pour les débutants et les professionnels qui souhaitent approfondir leurs bases de MSBI.

En avançant dans le didacticiel SSIS, voyons comment cela fonctionne exactement.

Comment fonctionne SSIS ?

SSIS se compose de trois composants principaux, à savoir :

  • Données opérationnelles
  • Processus ETL
  • Entrepôt de données

Ces tâches de transformation de données et de création de flux de travail sont effectuées à l'aide du « paquet SSIS », dont il sera question plus loin dans ce blog. Pour aller de l'avant avec le didacticiel SSIS, commençons par comprendre en détail chacun de ces composants :

Données opérationnelles

Un magasin de données opérationnelles (ODS) est une base de données conçue pour intégrer des données provenant de plusieurs sources pour des opérations supplémentaires sur les données. C'est l'endroit où la plupart des données utilisées dans l'opération en cours sont hébergées avant d'être transférées vers l'entrepôt de données pour un stockage ou un archivage à plus long terme.

Processus ETL

ETL est un processus d'extraction, de transformation et de chargement des données. Extraire, transformer et charger (ETL) est le processus d'extraction des données à partir de diverses sources, de transformation de ces données pour répondre à vos besoins, puis de chargement dans un entrepôt de données cible. ETL fournit une SOLUTION UNIQUE pour tous ces problèmes.

  • Extraire
  • Transformer
  • Charger

Extrait : L'extraction est le processus d'extraction des données à partir de diverses sources de données homogènes ou hétérogènes en fonction de différents points de validation.

Transformation : Dans la transformation, des données entières sont analysées et diverses fonctions y sont appliquées afin de charger les données dans la base de données cible dans un format épuré et général.

Charger : Le chargement est le processus de chargement des données traitées dans un référentiel de données cible en utilisant un minimum de ressources.


Entreposage de données

  • Entrepôt de données capture les données de diverses sources pour une analyse et un accès utiles.
  • Entrepôt de données est un grand ensemble de données accumulées qui est utilisé pour assembler et gérer des données provenant de diverses sources dans le but de répondre à des questions commerciales. Par conséquent, aide à prendre des décisions.

Exigences pour les services d'intégration SQL Server

Pour travailler avec SSIS, vous devez installer les éléments suivants :

  • SQL Server
  • Outils de données SQL Server

Jetons un coup d'œil au processus d'installation.

Installation du serveur SQL

Accédez au site Web :https://www.microsoft.com/en-au/sql-server/sql-server-downloads pour installer SQL Server. Vous pouvez installer la dernière version ou la version précédente selon votre choix.

Il existe donc différentes éditions de SQL Server, à savoir :

    • Essai gratuit : Vous bénéficiez d'un essai gratuit de 180 jours de SQL Server 2017 sous Windows.
    • Édition développeur : Il s'agit d'une édition gratuite complète, concédée sous licence pour une utilisation en tant que base de données de développement et de test dans un environnement hors production.
    • Édition Express : Express est une édition gratuite de SQL Server, idéale pour le développement et la production d'applications de bureau, Web et de petits serveurs.

Ensuite, voyons comment installer les outils de données.

Outils de données SQL Server

Accédez au site Web :https://docs.microsoft.com/en-us/sql/ssdt/previous-releases-of-sql-server-data-tools-ssdt-and-ssdt-bi?view=sql-server -ver15 et consultez les différentes versions fournies par Microsoft. Reportez-vous à la capture d'écran ci-dessous avec la version récente de SSDT ainsi que le lien de téléchargement.

Dans ce tutoriel, j'installerai la version 15.9.1. Alors commençons.

Étape 1 : Lorsque vous ouvrez le fichier .exe, il vous sera demandé de redémarrer le système avant l'installation.

Étape 2 : Une fois que vous avez redémarré votre système, vous êtes prêt à partir. Cliquez simplement sur le bouton "Suivant" et suivez les instructions à l'écran.

Étape 3 : Il montrera les outils requis et les fonctionnalités telles que la base de données SQL Server, SSAS, SSRS et SSIS. Assurez-vous de tous les vérifier et cliquez sur le bouton "installer". Reportez-vous à la capture d'écran ci-dessous pour la même chose.

Ensuite, dans le didacticiel SSIS, nous discuterons du package SSIS et de la manière dont vous pouvez le créer à l'aide des outils ci-dessus.

Qu'est-ce que le package SSIS ?

Un package est un bloc fondamental dans lequel vous allez de l'avant et codez dans SSIS. Maintenant, "code" ne fait référence à aucun langage de programmation, c'est le développement que vous faites. Donc, fondamentalement, votre développement se fait à l'intérieur d'un package. Comme indiqué ci-dessus, SSIS est essentiel pour ETL, et le package SSIS effectuera le processus ETL. Par conséquent, il s'agit d'un objet qui implémente la fonctionnalité des services d'intégration pour extraire, transformer et charger des données . Un package est composé de :

  • Connexions
  • Éléments de flux de contrôle
  • Éléments de flux de données

C'est tout pour ce tutoriel SSIS. J'espère que vous avez aimé le lire.

Ceci nous amène à la fin de ce blog. J'espère que vous avez aimé ce blog de didacticiel Power BI. Il s'agissait du premier blog de la série Power BI. Ce tutoriel Power BI sera suivi de mon prochain blog, qui se concentrera sur les tableaux de bord Power BI, lisez-le également.

Si vous souhaitez apprendre SSIS et faire carrière dans la visualisation de données ou la BI, consultez notre Certification de formation MSBI qui vient avec une formation en direct dirigée par un instructeur et une expérience de projet réelle. Cette formation vous aidera à comprendre MSBI en profondeur et vous aidera à maîtriser le sujet.

Vous avez une question pour nous ? Veuillez le mentionner dans la section des commentaires du "Tutoriel SSIS" et nous vous répondrons.