HBase
 sql >> Base de données >  >> NoSQL >> HBase

Comment :ajouter Cloudera Search à votre cluster à l'aide de Cloudera Manager

Cloudera Manager 4.7 a ajouté la prise en charge de la gestion de Cloudera Search 1.0. Ainsi, les utilisateurs de Cloudera Manager peuvent facilement déployer tous les composants de Cloudera Search (y compris Apache Solr) et gérer tous les services associés, comme tous les autres services inclus dans CDH (la distribution Cloudera d'Apache Hadoop et des projets associés).

Dans ce tutoriel, vous apprendrez les étapes nécessaires à l'ajout de Cloudera Search à un cluster Cloudera Enterprise (CDH + Cloudera Manager).

Installation du colis SOLR

Dans notre exemple, le cluster utilise une parcelle CDH 4.4 et exécute les services Apache ZooKeeper, HDFS et Apache HBase. (Les colis sont un moyen très utile de déployer de nouveaux logiciels et d'effectuer des mises à niveau sans effort via Cloudera Manager.)

Si vous souhaitez télécharger le colis SOLR directement à partir de Cloudera, vous pouvez utiliser les paramètres par défaut pour les "URL de référentiel de colis distants" (sous les Parcels dans l'onglet Administration) comme indiqué ci-dessous :

Définition de l'URL du référentiel de colis

Si vous souhaitez utiliser un référentiel local (c'est-à-dire, téléchargez d'abord le colis à partir de Cloudera, puis installez-le à partir de la copie locale), vous pouvez suivre les instructions ici. Les étapes suivantes consistent à "Télécharger", "Distribuer" et "Activer" le colis à partir de la page Colis de l'onglet Hôtes.

Déploiement de la parcelle SOLR

Une fois le colis activé, vous disposez de tous les composants de Cloudera Search (Solr, Lily HBase Indexer et Apache Flume's Morphlines Sink) prêts à être utilisés avec CDH.

L'étape suivante consiste à ajouter le service Apache Solr à votre cluster. Dans le menu "Actions" de votre cluster sur l'onglet Services, choisissez "Ajouter un service", ce qui vous amène à "l'assistant d'ajout de service" dans Cloudera Manager. Une fois que vous avez suivi les étapes de l'assistant et choisi où les serveurs Solr doivent s'exécuter, vous arriverez sur une page de flux de travail qui initialisera le service Solr et démarrera tous les serveurs Solr.

Mise en place et fonctionnement du service Solr

Ça y est, le service Solr est maintenant prêt à l'emploi ! Suivez les instructions du guide de l'utilisateur de Cloudera Search pour créer des collections et y ajouter des documents à indexer. La capture d'écran ci-dessous montre comment créer une collection à l'aide du schéma Solr par défaut.

Création de la première collection

Ajout de l'indexeur Lily HBase

Cloudera Manager 4.7 prend également en charge l'indexeur Lily HBase inclus avec le colis SOLR. Le service Lily HBase Indexer est un système flexible, évolutif, tolérant aux pannes, transactionnel et en temps quasi réel pour le traitement d'un flux continu de mises à jour de cellules HBase dans des index de recherche en direct. Pour l'utiliser, ajoutez le service "Keystore Indexer" via "l'assistant d'ajout de service".

Cependant, avant de pouvoir utiliser l'indexeur Lily HBase, vous devez vous assurer que la réplication et l'indexation sont activées dans le service HBase du cluster. Vous pouvez modifier ces propriétés sur la page de configuration du service HBase dans la section "Sauvegarde".

Définition des propriétés HBase pour Lily HBase Indexer

Notez également que Cloudera Manager inclut un fichier Cloudera Morphlines par défaut qui peut être utilisé par Lily HBase Indexer. Pour modifier ce fichier afin d'utiliser vos propres fonctions, vous devez accéder au service Keystore Indexer et modifier la configuration de Morphlines comme indiqué ci-dessous :

Modification de Cloudera Morphlines pour Lily HBase Indexer

Une fois ces modifications apportées, vous pouvez commencer à utiliser l'indexeur Lily HBase pour indexer toutes les données entrant dans HBase en suivant les instructions du Guide de l'utilisateur de l'indexeur Lily HBase . Ce billet de blog fournit également un excellent exemple de la façon d'indexer les e-mails à l'aide de HBase et Cloudera Search.

Conclusion

Vous savez maintenant à quel point il est facile de déployer, configurer et gérer un service Cloudera Search sur votre cluster CDH à l'aide de Cloudera Manager. À partir de Cloudera Enterprise 5 (en version bêta au moment de la rédaction), Cloudera Search et l'indexeur Lily HBase s'installeront et démarreront par défaut, ce qui rendra ce processus encore plus facile.

Vikram Srivastava est ingénieur logiciel chez Cloudera.