Mégadonnées
Mégadonnées décrit le grand volume de données, structurées ou non structurées, qui inonde quotidiennement une entreprise. Le Big Data traite des moyens d'analyser, d'extraire des informations ou de traiter des ensembles de données trop volumineux ou complexes pour être traités par un logiciel de traitement de données normal.
Les mégadonnées ont les caractéristiques suivantes :
- Volume : La quantité de données générées et stockées
- Variété : Le type et la nature des données
- Vitesse : La vitesse à laquelle les données sont générées et traitées
- Véracité : Qualité des données et valeur des données
L'influence d'Azure sur le Big Data
Microsoft Azure transforme les données en informations exploitables à l'aide d'outils d'apprentissage automatique. Il vous permet de combiner toutes les données à n'importe quelle échelle, et de créer et de déployer des modèles d'apprentissage automatique à grande échelle.
Avec les produits Azure suivants, des analyses avancées peuvent être effectuées sur le Big Data :
- Entrepôt de données SQL
- Usine de données
- Stockage BLOB Azure
- Azure Databrick
- Azure Cosmos DB
- Power BI
Examinons chacun d'eux individuellement.
Entrepôt de données SQL
SQL Data Warehouse est un EDW (Enterprise Data Warehouse) basé sur le cloud qui utilise le traitement massivement parallèle (un grand nombre de processeurs qui effectuent un ensemble de calculs en parallèle) pour exécuter des requêtes complexes sur des pétaoctets de données.
Il vous suffit d'importer du Big Data dans SQL Data Warehouse avec des requêtes PolyBase T-SQL (requêtes qui lisent les données de Hadoop), puis, avec la puissance de MPP, d'exécuter des analyses hautes performances. L'entrepôt de données deviendra alors la version unique de la vérité sur laquelle vous pourrez compter pour obtenir des informations.
Usine de données
Data Factory est un service d'intégration de données cloud qui compose des services de stockage, de déplacement et de traitement de données dans des pipelines de données automatisés. Azure Data Factory est un service d'intégration de données hybride qui vous permet de créer, de planifier et d'orchestrer des flux de travail ETL/ELT (extraire, transformer, charger).
Stockage BLOB Azure
Le stockage Azure BLOB est un stockage d'objets massivement évolutif pour les documents, images, vidéos et audio non structurés. Le stockage Azure BLOB est optimisé pour stocker d'énormes quantités de données non structurées (données qui n'adhèrent pas à un modèle de données ou à une définition particulière), telles que du texte ou des données binaires, par exemple.
Le stockage Azure BLOB a les fonctions suivantes :
- Diffusion de documents ou d'images directement dans un navigateur
- Stockage des fichiers pour un accès distribué
- Diffusion audio et vidéo
- Écrire dans les fichiers journaux
- Stockage des données pour la reprise après sinistre, la sauvegarde, la restauration et l'archivage
Azure Databrick
Azure Databricks est une plate-forme d'analyse simple, rapide et collaborative basée sur Apache Spark (cadre de calcul en cluster à usage général distribué open source, qui fournit une interface pour la programmation de clusters avec parallélisme de données implicite).
Base de données Azure Cosmos
Azure Cosmos DB est un service de base de données distribué à l'échelle mondiale. Il est conçu pour fournir une faible latence, une évolutivité élastique du débit, une sémantique bien définie pour la cohérence des données et une haute disponibilité.
Power BI
Power BI est une suite d'outils d'analyse commerciale qui fournit des informations. Power BI vous permet de vous connecter à des dizaines de sources de données, de simplifier la préparation des données, d'effectuer des analyses ad hoc et de produire des rapports à utiliser sur le Web et sur des appareils mobiles.
Conclusion
Le Big Data a évolué et continue d'évoluer. Avec l'aide des outils Azure, le Big Data devient de plus en plus gérable.