Apache Phoenix pour CDH :meilleure nouvelle fonctionnalité pour SGBD
Cloudera adopte et prendra en charge Apache Phoenix pour CDH pendant qu'il l'intègre pour sa plate-forme de données Cloudera sur une base future.
Les versions CDH de Cloudera incluent Apache HBase qui fournit un SGBD NoSQL résilient pour les applications opérationnelles des clients qui souhaitent tirer parti de la puissance du Big Data. Ces applications sont devenues des applications essentielles et essentielles à la mission qui génèrent des revenus et une rentabilité de haut niveau. Ces applications incluent les applications destinées aux clients, les plates-formes de commerce électronique, la détection des risques et des fraudes utilisées dans les coulisses des banques ou servant des modèles d'IA/ML pour les applications et permettant une formation de renforcement supplémentaire de celles-ci en fonction des résultats réels.
Cependant, pour de nombreux clients, HBase a été un voyage trop intimidant — les obligeant à apprendre
- Un nouveau modèle de données tel que HBase est un schéma de table large prenant en charge des millions de colonnes mais pas de jointures et
- Utilisation des API Java au lieu de SQL ANSI
Ils ont demandé à pouvoir utiliser une conception de schéma plus traditionnelle qui ressemble à celle fournie par Oracle ou MySQL et ont accepté de faire des compromis sur la flexibilité, par exemple,
- Ils sont prêts à utiliser les types de données fournis au lieu de définir les leurs
- Ils sont prêts à renoncer à la flexibilité d'avoir une seule colonne ayant plusieurs types en fonction de la ligne en échange d'un seul type dans une seule ligne
Pour permettre aux clients d'accéder facilement aux autres avantages d'Apache HBase (évolutivité illimitée, millions de lignes, évolution du schéma, etc.) tout en offrant des fonctionnalités de type RDBMS (ANSI SQL, jointures simples, types de données hors du box, etc.), nous introduisons la prise en charge d'Apache Phoenix sur CDH.
Pour tous les autres, les applications basées sur Phoenix bénéficient également d'optimisations HBase en arrière-plan, ce qui facilite l'obtention de meilleures performances HBase. Par exemple, Phoenix implémente le salage des clés primaires, afin que les utilisateurs de HBase n'aient pas à réfléchir à cet aspect de la conception des clés.
De plus, les applications basées sur Phoenix peuvent coexister avec les applications HBase, ce qui signifie que vous pouvez utiliser un seul cluster HBase pour prendre en charge les deux. Avec Phoenix, les clients peuvent continuer à utiliser leurs outils de BI et de tableau de bord préférés, comme ils le faisaient avec Hive et Impala dans le passé. Lorsqu'ils utilisent Phoenix, ils peuvent également choisir d'utiliser directement Phoenix avec ces outils en plus de l'option d'utiliser Hive/Impala, éliminant ainsi une étape pour les nouvelles implémentations.
Du point de vue de la sécurité et de la gouvernance (SDX), dans CDH, Phoenix utilise les ACL HBase pour le contrôle d'accès basé sur les rôles pour les tables Phoenix. Phoenix utilise également l'intégration HBase dans Cloudera Navigator pour les informations d'audit.
Cloudera a publié un colis Phoenix 4.14.1 disponible pour les clients CDH 5.16.2 et un colis Phoenix 5.0 disponible pour les clients CDH 6.2+.
Les clients HDP existants bénéficient déjà de la prise en charge d'Apache Phoenix et près de la moitié des utilisateurs de HBase utilisant HDP utilisent actuellement Phoenix, ce qui témoigne de sa popularité dans la communauté des utilisateurs de HBase.
Télécharger Apache Phoenix pour CDH
Créez des applications critiques à l'aide d'Apache Phoenix. Téléchargez le logiciel ici.
Questions fréquentes sur Phénix
Q) Pour quelles charges de travail Phoenix doit-il être utilisé
Phoenix prend en charge les mêmes cas d'utilisation que HBase, principalement des charges de travail à faible latence et à forte simultanéité. Cependant, Phoenix simplifie également l'exploitation des données sous-jacentes à des fins de tableau de bord et de BI
Q) Quel est le mécanisme d'autorisation avec Phoenix ?
Phoenix dépend de HBase pour l'autorisation. Pour les clients CDH, cela utilise les ACL HBase. Pour les clients HDP, cela passe par l'intégration HBase-Ranger
Q) Quelle est l'évolutivité de Phoenix ? Quel est le plus grand cluster connu ?
Phoenix s'adapte à des centaines de To de données. Le plus gros client possède plus de 0,5 Po de données gérées par Phoenix. Des détails sur les cas d'utilisation peuvent être trouvés dans les archives de PhoenixCon et dans les archives des vidéos de la journée NoSQL plus tôt cette année dans les propres mots et diapositives des utilisateurs.
Q) Phoenix prend-il en charge l'indexation secondaire géospatiale ? Quel niveau de prise en charge des données spatiales ?
Il a un support limité pour les données géo-spatiales. Cependant, GeoMesa fournit une couche géospatiale sur HBase qui peut répondre à ce besoin et s'intègre aux applications client. Phoenix, GeoMesa ainsi que JanusGraph et OpenTSDB peuvent tous coexister dans un seul cluster HBase.
Q) Comment créez-vous et utilisez-vous un index ?
Consultez la page d'indexation secondaire de Phoenix pour plus de détails sur l'indexation. À partir de Phoenix 4.8.0, aucune modification de configuration n'est requise pour utiliser l'indexation locale.
Q) Y a-t-il une limite au nombre de colonnes que vous pouvez mettre dans l'index ?
Comme dans un SGBDR, un index est essentiellement une table séparée avec l'index et un lien vers les données source. Si vous indexez toutes les colonnes, vous annulez l'objectif en maintenant deux tables identiques. Les index doivent être utilisés judicieusement car il y a une surcharge non triviale lors de l'écriture (index globaux) ou de la lecture (index locaux).