Database
 sql >> Base de données >  >> RDS >> Database

Tendances ScyllaDB – Comment les utilisateurs déploient la base de données Big Data en temps réel

ScyllaDB est un magasin de données NoSQL distribué open source, réimplémenté à partir de la base de données populaire Apache Cassandra. Sorti il ​​y a à peine quatre ans en 2015, Scylla a enregistré en moyenne une croissance de popularité de plus de 220 % d'une année sur l'autre selon DB-Engines. Nous avons beaucoup entendu parler de cette base de données croissante de la part de la communauté DBA et de nos utilisateurs, et avons décidé de devenir un sponsor du Scylla Summit de cette année pour en savoir plus sur les tendances de déploiement de ses utilisateurs. Dans cet article, nous décomposons les déploiements cloud de ScyllaDB par rapport aux déploiements sur site, les fournisseurs de cloud les plus populaires, les bases de données SQL et NoSQL utilisées avec ScyllaDB, les tâches de gestion les plus chronophages et pourquoi vous devriez utiliser ScyllaDB par rapport à Cassandra.

  • ScyllaDB contre Cassandra
  • ScyllaDB Cloud contre ScyllaDB sur site
  • Fournisseurs cloud les plus populaires pour ScyllaDB
  • Bases de données les plus couramment utilisées avec ScyllaDB
  • Tâches de gestion ScyllaDB les plus chronophages

ScyllaDB contre Cassandra – Quel est le meilleur ?

Vous vous demandez quel magasin à colonnes larges utiliser pour vos déploiements ? Alors que Cassandra est toujours la plus populaire, ScyllaDB gagne rapidement en tant que 7e magasin à colonnes larges le plus populaire selon DB-Engines. Alors, quelles sont certaines des raisons pour lesquelles les utilisateurs choisiraient ScyllaDB plutôt que Cassandra ?

ScyllaDB offre une latence nettement inférieure, ce qui vous permet de traiter un volume élevé de données avec un délai minimal. En fait, selon le rapport d'évaluation des performances de ScyllaDB, leur latence de 99,9 centiles est jusqu'à 11 fois supérieure à celle de Cassandra sur le métal nu AWS EC2. Ce type de performance doit donc avoir un coût, n'est-ce pas ? C'est le cas, mais ils affirment dans ce rapport qu'il s'agit d'une réduction des coûts de 2,5 fois par rapport à l'exécution de Cassandra, car ils peuvent atteindre ces performances avec seulement 10 % des nœuds.

Il existe des dizaines d'articles de qualité sur ScyllaDB par rapport à Cassandra, nous allons donc nous arrêter ici pour que nous puissions aborder le véritable objectif de cet article, décomposer les données utilisateur de ScyllaDB .

ScyllaDB Cloud contre ScyllaDB sur site

ScyllaDB peut être exécuté à la fois dans le cloud public et sur site. En fait, ScyllaDB est le plus souvent déployé dans les environnements de cloud public et sur site au sein d'une seule organisation. Les 44 % des déploiements ScyllaDB exploitant à la fois le cloud et l'informatique sur site pourraient se faire via un environnement cloud hybride exploitant les deux pour une application spécifique, ou en utilisant ces environnements séparément pour gérer différentes applications.

Les déploiements sur site de ScyllaDB et les déploiements dans le cloud de ScyllaDB étaient à 28 % chacun. Vous pouvez exécuter à la fois les logiciels open source gratuits ScyllaDB et ScyllaDB Enterprise dans le cloud ou sur site, et la licence ScyllaDB Enterprise commence à 28 800 $/an pour un total de 48 cœurs.

Quelle est la meilleure façon de déployer #ScyllaDB ? Cloud ou sur siteCliquez pour tweeter

Fournisseurs cloud les plus populaires pour ScyllaDB

Avec 28 % du cluster ScyllaDB exclusivement déployé dans le cloud et 72 % utilisant le cloud dans une certaine mesure, nous étions intéressés de voir quels fournisseurs de cloud sont les plus populaires pour les charges de travail ScyllaDB .

#1. AWS

Nous avons constaté que 39,1 % de tous les déploiements cloud ScyllaDB s'exécutent sur AWS selon les participants à notre enquête. Alors que nous nous attendions à ce qu'AWS soit le fournisseur de cloud numéro 1 pour ScyllaDB, le pourcentage était considérablement inférieur aux réponses de tous les types de bases de données cloud dans cette enquête qui indiquaient que 55 % étaient déployés sur AWS. Ce chiffre est plus conforme à notre récent rapport 2019 sur les tendances des bases de données open source, dans lequel 56,9 % des déploiements cloud ont été signalés comme fonctionnant sur AWS. Cela peut être dû au fait qu'AWS ne prend pas en charge ScyllaDB via ses services de base de données relationnelle (RDS). Nous pourrions donc émettre l'hypothèse qu'à mesure que de plus en plus d'organisations continuent de migrer leurs données vers ScyllaDB, AWS pourrait connaître une baisse de sa clientèle.

#2. Google Cloud

Google Cloud Platform (GCP) était le deuxième fournisseur cloud le plus populaire pour ScyllaDB, avec 30,4 % de tous les déploiements cloud. Google Cloud propose son propre magasin à colonnes larges et sa base de données Big Data appelée Bigtable, qui est en fait classée n ° 111, une sous ScyllaDB à la n ° 110 sur DB-Engines. Le faible coût et les hautes performances de ScyllaDB en font une option attrayante pour les utilisateurs de GCP, d'autant plus qu'il s'agit d'une solution open source par rapport à Bigtable, qui n'est disponible dans le commerce que sur GCP.

#3. Azur

Azure suit en troisième position, représentant 17,4 % de tous les déploiements ScyllaDB dans le cloud d'après les répondants à notre enquête. Azure est un fournisseur de cloud attrayant pour les organisations qui utilisent la suite de services Microsoft.

Quel fournisseur de cloud est le plus populaire pour #ScyllaDB ? AWS contre Azure contre GCPClick To Tweet

Les 13,0 % restants des déploiements cloud ScyllaDB s'exécutent sur les services de cloud computing DigitalOcean, Alibaba et Tencent.

Leur service géré, Scylla Cloud, n'est actuellement disponible que sur AWS, et vous devez utiliser la version ScyllaDB Enterprise pour tirer parti de leur DBaaS. Scylla Cloud prévoit d'ajouter la prise en charge de GCP et d'Azure à l'avenir, mais avec seulement 39 % de rapports sur AWS, nous pouvons supposer que plus de 60 % des déploiements ScyllaDB sont autogérés dans le cloud.

Bases de données les plus couramment utilisées avec ScyllaDB

Comme nous l'avons également constaté dans le rapport 2019 sur les bases de données Open Source, les organisations exploitent en moyenne 3,1 types de bases de données différents. Mais, dans cette enquête, les organisations utilisant ScyllaDB ont déclaré n'utiliser en moyenne que 2,3 types de bases de données différents, soit une réduction de 26 % par rapport à nos résultats de tous les utilisateurs de bases de données open source. Nous avons également constaté que 39 % des déploiements ScyllaDB utilisent uniquement ScyllaDB et n'utilisent aucun autre type de base de données dans leurs applications.

Quelles sont donc les bases de données les plus couramment utilisées en conjonction avec ScyllaDB ? Nous avons constaté que les utilisateurs de ScyllaDB utilisent également les bases de données SQL MySQL 20 % du temps et PostgreSQL 20 % du temps également. La deuxième base de données la plus couramment utilisée avec ScyllaDB était Cassandra, représentée dans 16 % des déploiements, et nous pourrions supposer que cela provient d'organisations testant ScyllaDB comme alternative à Cassandra dans leurs applications, car les deux types de bases de données sont des magasins à colonnes larges.

MongoDB était la quatrième base de données la plus déployée avec ScyllaDB à 12 %. Redis et Elasticsearch étaient à égalité à la cinquième place, tous deux tirant parti de 8 % du temps avec les déploiements ScyllaDB.

Nous avons également constaté que 20 % des déploiements Scylla exploitent d'autres types de bases de données, notamment Oracle, Aerospike, Kafka (qui se transforme désormais en une base de données de diffusion d'événements), DB2 et Tarantool.

Tâches de gestion ScyllaDB les plus chronophages

Nous savons que ScyllaDB est extrêmement puissant, mais est-il facile à utiliser ? Nous avons demandé aux utilisateurs de ScyllaDB quelle était leur tâche de gestion la plus chronophage, et 28 % d'entre eux ont déclaré que Scylla Repair était la tâche de gestion la plus longue. Scylla Repair est un processus de synchronisation qui s'exécute en arrière-plan pour garantir que toutes les répliques contiennent finalement les mêmes données. Les utilisateurs doivent exécuter la commande nodetool repair régulièrement, car il n'y a aucun moyen d'automatiser les réparations dans les versions open source ScyllaDB ou ScyllaDB Enterprise, mais vous pouvez configurer un calendrier de réparation via Scylla Manager.

L'analyse lente des requêtes de ScyllaDB a placé les sauvegardes et les restaurations de ScyllaDB à la deuxième place à 14 % chacune pour la tâche de gestion la plus chronophage. Il ne semble pas que ScyllaDB dispose actuellement d'un analyseur de requêtes disponible pour identifier les requêtes qui doivent être optimisées, mais les utilisateurs peuvent utiliser leur journalisation lente des requêtes pour voir quelles requêtes ont le temps de réponse le plus long. Les sauvegardes ScyllaDB ne peuvent pas non plus être automatisées via les versions open source et entreprise, mais elles indiquent que des sauvegardes récurrentes seront disponibles dans les futures éditions de Scylla Manager. Il n'y a pas non plus de moyen automatisé de restaurer une sauvegarde ScyllaDB, car celles-ci doivent être effectuées manuellement dans toutes les versions.

10 % des utilisateurs de ScyllaDB ont indiqué que l'ajout, la suppression ou le remplacement de nœuds était la tâche la plus chronophage, arrivant à la quatrième place. Ce sont des processus manuels qui peuvent prendre un peu de temps, surtout si vous traitez une grande taille de données. L'ajout de nœuds est utilisé pour faire évoluer un déploiement tandis que leur suppression réduit votre déploiement. Les nœuds doivent être remplacés s'ils sont en panne ou morts, bien qu'un cluster puisse toujours être disponible lorsque plusieurs nœuds sont en panne.

La cinquième place ex aequo à 7 % était les mises à niveau et le dépannage. ScyllaDB Enterprise et open source nécessitent tous deux des étapes importantes pour mettre à niveau un cluster. Les méthodes recommandées passent par une procédure continue afin qu'il n'y ait pas de temps d'arrêt, mais il s'agit d'un processus manuel. L'utilisateur doit donc arrêter un nœud à la fois, effectuer toutes les étapes de mise à niveau, redémarrer et valider le nœud avant de passer à l'exécution de la mêmes étapes pour les nœuds restants du cluster. Du temps certes, mais heureusement pas une tâche quotidienne ! Le dépannage est bien sûr un trou de lapin profond dans lequel plonger, mais les clients ScyllaDB Enterprise reçoivent une assistance critique 24h/24 et 7j/7, et les utilisateurs open source ont accès à une pléthore de ressources, y compris la documentation, les listes de diffusion, l'Université Scylla et un canal souple pour l'utilisateur. discussion.

Quelle est la tâche de gestion #ScyllaDB qui prend le plus de temps ?Cliquez pour tweeter

Les 21 % restants de tâches chronophages signalées par les utilisateurs de ScyllaDB incluent la surveillance, les migrations, le provisionnement, l'équilibrage des fragments, le compactage et les correctifs.

Alors, comment ces résultats se comparent-ils à vos déploiements ScyllaDB ? Vous cherchez un moyen d'automatiser ces tâches de gestion chronophages ? Bien que nous prenions en charge MySQL, PostgreSQL, Redis™* et la base de données MongoDB® aujourd'hui, nous sommes toujours à la recherche de commentaires sur la prochaine base de données à ajouter via nos plans DBaaS. Faites-nous savoir dans les commentaires ou sur Twitter à @scalegridio si vous cherchez un moyen plus simple de gérer vos clusters ScyllaDB dans le cloud ou sur site !