La connexion et l'utilisation des données d'une base de données Snowflake AWS à partir d'IRI Workbench (WB) ne sont pas différentes de celles d'une source compatible SQL sur site. Vous parcourez les tables Snowflake et échangez des métadonnées dans Workbench via JDBC. De plus, vous déplacez des données vers et depuis le programme de manipulation de données SortCL (que les produits IRI Voracity et les sous-ensembles IRI de Workbench utilisent) via ODBC.
L'endroit où vous exécutez IRI Workbench et votre produit IRI sous licence (sur site ou dans le cloud) dépend de vous. Nous recommandons cependant d'exécuter SortCL sur le même nœud ou sous-réseau avec Snowflake si les volumes de tables sont suffisamment importants pour prendre en compte le temps de transfert Internet.
Cet article explique étape par étape comment :1) accéder à Snowflake avec ces pilotes pour voir votre schéma et utiliser ses métadonnées dans IRI Workbench; et 2) traiter les données de ces tables dans des travaux compatibles SortCL. Les connexions à Teradata, SAP HANA, EnterpriseDB (PostgreSQL) et toute autre source avec les pilotes ODBC et JDBC sont effectuées de la même manière.
Étape 1 :Obtenir des informations et des pilotes auprès de Snowflake
Prenez note de l'URL, du nom d'utilisateur et du mot de passe nécessaires pour accéder à Snowflake, ainsi que du nom de l'entrepôt et base de données que vous utiliserez. Vos configurations de pilote auront besoin de ces détails.
Téléchargez le pilote ODBC Snowflake en suivant ces étapes et le pilote JDBC en suivant ces étapes. J'ai utilisé le pilote Windows 32 bits pour la compatibilité avec mon exécutable CoSort v10 SortCL et snowflake-jdbc-3.6.10.jar.
Étape 2 :Configurez le pilote ODBC dans votre système d'exploitation
Si vous exécutez une instance Windows comme moi, et comme vous pouvez le voir dans les instructions de Snowflake ici, vous aurez également besoin du runtime gratuit MS Visual C++ :
Exécutez le programme d'installation ODBC approprié à partir de Snowflake, puis configurez le pilote dans votre administrateur de source de données ODBC. Si vous utilisez une version 32 bits de SortCL comme je suis ici, vous devrez utiliser C:\Windows\SysWOW64\odbcad32.exe.
Ajoutez le SnowflakeDISIIDriver à votre DSN utilisateur (ou système). Dans la boîte de dialogue de configuration de Snowflake, entrez votre identifiant et les détails DB/DW comme ceux-ci, y compris le mot de passe :
Après avoir cliqué sur OK, vous pourrez référencer ce DSN à référencer dans le registre de connexion de données IRI Workbench. Mais d'abord…
Étape 3 :Configurer le pilote JDBC dans IRI Workbench
Bien que vous n'ayez pas à le faire en premier, j'aime créer et travailler à partir d'un projet actif pour stocker mes travaux et les artefacts de métadonnées qui proviendront de mes connexions. J'ai créé un dossier dans mon explorateur de projet d'espace de travail appelé Snowflake.
Maintenant, pour utiliser le pilote Snowflake JDBC, connectez-vous à ma base de données dans l'explorateur de sources de données, cliquez d'abord sur Nouveau profil de connexion puis sélectionnez Generic JDBC conducteur :
Cliquez sur Suivant , et dans la boîte de dialogue des propriétés, cliquez sur Nouvelle définition de pilote :
Cela fait apparaître une série d'onglets à remplir :
Cliquez sur la Liste JAR onglet, Ajouter JAR/Zip … et naviguez pour utiliser le fichier Snowflake .jar téléchargé :
Ensuite, dans les Propriétés , spécifiez l'URL de connexion, le nom de la base de données et l'ID utilisateur. Le pilote Classe analyse le fichier .jar en cliquant sur le bouton apparaissant à droite du champ lorsque vous cliquez dans la classe de pilote champ, puis en cliquant sur Parcourir . Utilisez l'option commençant par net .
Une fois ces détails en place, cliquez sur OK . L'écran principal des propriétés s'affiche. Entrez à nouveau votre mot de passe et cliquez sur Enregistrer le mot de passe pour éviter d'être invité lors de l'utilisation de WB. Cliquez sur Facultatif et spécifiez le nom de l'entrepôt en tapant "warehouse=
Une fois connecté à Snowflake Data Warehouse, vous devriez pouvoir développer et accéder à vos catalogues de bases de données disponibles dans la vue Explorateur de sources de données d'IRI Workbench :
Vous pouvez également cliquer avec le bouton droit de la souris sur et renommer "Nouveau JDBC générique" dans la liste de connexion en quelque chose de plus descriptif, comme "Flocon de neige".
Étape 4 :Enregistrez-vous et reliez vos connexions
Ouvrez le registre de connexion de données à partir de l'atelier IRI Fenêtre> Préférences> IRI grouper.
Si le DSN que nous avons créé pour Snowflake ci-dessus n'est pas affiché dans la liste, cliquez sur le bouton Actualiser. Lorsque vous le voyez, double-cliquez sur cette entrée, ou cliquez sur Modifier…, pour ouvrir sa boîte de dialogue de connexion :
Ajoutez un filtre de schéma si vous le souhaitez. Le pilote ODBC n'enregistrant pas le mot de passe, saisissez-le dans le champ Authentification section. Sélectionnez le profil de connexion pour la connexion JDBC :
En enregistrant cette connexion, vous mappez les autorisations entre les exécutables IRI qui déplacent et manipulent les données Snowflake via ODBC et les assistants IRI Workbench qui utilisent votre connexion JDBC pour analyser et utiliser les métadonnées de la table. C'est ce qui permet à IRI Workbench de créer et d'interagir visuellement avec vos mises en page de données et les spécifications de travail au niveau des colonnes.
Étape 5 :Testez les choses
Après cela, tout doit être configuré et vous pouvez vérifier les deux en ouvrant la base de données et la table souhaitées dans Data Source Explorer (qui utilise JDBC). Faites un clic droit sur une table de votre schéma et choisissez Générer DDF dans le menu IRI pour faire apparaître :
Pour obtenir de l'aide pour connecter votre instance Snowflake dans IRI Workbench, contactez votre représentant IRI.