HBase
 sql >> Base de données >  >> NoSQL >> HBase

Base de données opérationnelle dans CDP

Note de la rédaction, août 2020 :CDP Data Center s'appelle désormais CDP Private Cloud Base. Vous pouvez en savoir plus ici.

La base de données opérationnelle (OpDB) de Cloudera dans CDP fournit une OpDB évolutive en temps réel, toujours disponible, qui sert des données structurées traditionnelles aux côtés de nouvelles données non structurées au sein d'une plate-forme opérationnelle et d'entreposage unifiée. Cloudera fournit une base de données opérationnelle qui sert des données structurées traditionnelles aux côtés de nouvelles données non structurées au sein d'une plate-forme open source unifiée.

La base de données opérationnelle vous aide à :

Opérationnalisez l'apprentissage automatique/l'intelligence artificielle pour révolutionner des secteurs tels que la santé, les services publics, etc. 

  • Servez du contenu en temps réel à l'échelle du Web.
  • Permettre l'analyse de Big Data pour des utilisations opérationnelles et hors ligne.
  • Utiliser comme magasin résilient d'enregistrements.

OpDB dans CDP est actuellement disponible sous deux formes :en tant qu'offre entièrement sécurisée et semi-gérée dans CDP Public Cloud - Data Hub, et en tant qu'offre entièrement personnalisable dans CDP Data Center - similaire à ce qui est déjà disponible dans CDH et HDP. Vous pouvez choisir un facteur de forme en fonction de votre stratégie de déploiement et des besoins d'OpDB. La base de données opérationnelle utilise un magasin d'objets tel qu'Amazon S3 comme couche de stockage pour Apache HBase, où les HFiles sont écrits dans le magasin d'objets, mais les WAL sont écrits dans HDFS.

La base de données opérationnelle dans CDP comprend les composants suivants : 

  • Apache Phoenix une interface SQL qui s'exécute sur Apache HBase.
  • Apache HBase est conçu pour une évolutivité massive, vous pouvez donc stocker des quantités illimitées de données sur une seule plate-forme et gérer les demandes croissantes de diffusion de données.
  • Apache ZooKeeper fournit un service de configuration distribué, un service de synchronisation et un registre de dénomination.
  • Apache Knox Gateway fournit une sécurité périmétrique afin que l'entreprise puisse étendre en toute confiance l'accès à de nouveaux utilisateurs.
  • Apache HDFS est utilisé pour écrire les WAL Apache HBase.
  • Le magasin d'objets tel qu'Amazon S3 et Microsoft ADLS Gen2 est utilisé pour stocker les HFiles Apache HBase.
  • Shared Data Experience (SDX) est utilisé pour les fonctionnalités de sécurité et de gouvernance. Les règles de sécurité et de gouvernance sont définies une seule fois et appliquées à toutes les données et charges de travail.
  • IDBroker est une API REST intégrée aux services d'authentification d'Apache Knox. Il permet à un utilisateur authentifié et autorisé d'échanger un ensemble d'informations d'identification ou un jeton contre des jetons d'accès de fournisseur cloud.

Base de données opérationnelle dans la série CDP 

Cet article vous a présenté OpDB sur CDP et son architecture. Vous pouvez en savoir plus sur chaque aspect d'OpDB et découvrir les nouvelles fonctionnalités et capacités d'OpDB dans les prochains articles de cette série. Nous mettrons à jour les liens vers chaque article de blog au fur et à mesure de leur publication.

Accessibilité

L'OpDB de Cloudera garantit que les utilisateurs peuvent accéder aux données stockées ou les récupérer. Il prend en charge à la fois le partitionnement automatique et le partitionnement prédéfini, trois moteurs de requête et plusieurs outils d'intégration de données. Cet article fournit une vue d'ensemble de ces fonctionnalités et d'autres fonctionnalités qui garantissent un haut niveau d'accessibilité.

Administration

OpDB de Cloudera fournit plusieurs outils et fonctionnalités d'administration pour administrer votre charge de travail OpDB. Les administrateurs peuvent déployer OpDB en tant qu'offre entièrement sécurisée et semi-gérée dans CDP Public Cloud - Data Hub et en tant qu'offre entièrement personnalisable dans CDP Data Center (similaire à ce qui est disponible dans CDH et HDP). Cet article vous fournit un aperçu de haut niveau des fonctionnalités et des outils pris en charge pour administrer OpDB dans CDP.

Gestion

OpDB de Cloudera fournit des outils de gestion qui vous aident à gérer efficacement vos charges de travail OpDB. Cet article vous donne un aperçu des outils de gestion et des fonctionnalités d'OpDB dans CDP.

Disponibilité

L'OpDB de Cloudera maintient un haut niveau de disponibilité des données, garantissant que les données requises sont accessibles quand et où elles sont nécessaires, même en cas de défaillance du nœud. Cet article fournit un aperçu des fonctionnalités qui permettent un haut niveau de disponibilité, telles que la haute disponibilité prête à l'emploi, la réplication des données et la protection contre les erreurs.

Intégrité

OpDB de Cloudera fournit diverses fonctionnalités d'intégrité des données, notamment l'intégrité des entités et des domaines, les transactions ACID et l'intégrité non relationnelle. Cet article fournit une vue d'ensemble des fonctionnalités d'intégrité des données d'OpDB.

Assistance aux applications

OpDB de Cloudera prend en charge divers langages, frameworks et applications populaires que vous pouvez utiliser pour accéder aux données stockées dans votre OpDB. Cet article vous donne un aperçu des langages, frameworks et applications pris en charge.

NoSQL et capacités associées

Comme OpDB de Cloudera inclut la base de données NoSQL HBase pour stocker les données, il dispose de capacités NoSQL, telles que des valeurs clés, des capacités de style table et des types de données flexibles. Une intégration étroite dans l'écosystème Hadoop est également fournie, y compris HDFS, Spark et Kafka. Cet article fournit une vue d'ensemble de ces fonctionnalités.

Évolutivité

OpDB de Cloudera est conçu pour une évolutivité élevée, prenant en charge l'évolutivité verticale et horizontale avec un type de données flexible et aucune limite sur la taille des données. Cet article fournit une vue d'ensemble des fonctionnalités et des outils liés à l'évolutivité pris en charge.

Sécurité

OpDB de Cloudera fournit plusieurs solutions de sécurité à différents niveaux, concernant le chiffrement, l'authentification, l'autorisation et l'audit. Cet article fournit un aperçu de ces fonctionnalités et outils liés à la sécurité.

Pour plus d'informations, veuillez consulter :Premiers pas avec la base de données opérationnelle.