Database
 sql >> Base de données >  >> RDS >> Database

Rapport 2019 sur les bases de données open source :principales bases de données, cloud public vs sur site, persistance polyglotte

Vous êtes prêt à passer d'une base de données commerciale à l'open source et vous voulez savoir quelles bases de données sont les plus populaires en 2019 ? Vous vous demandez si une infrastructure sur site, un cloud public ou un cloud hybride est la meilleure solution pour votre stratégie de base de données ? Ou envisagez-vous d'ajouter une nouvelle base de données à votre application et souhaitez-vous voir quelles combinaisons sont les plus populaires ? Nous avons trouvé toutes les réponses dont vous avez besoin lors de l'événement Percona Live le mois dernier, et avons réparti les informations dans les rapports de tendances gratuits suivants :

  • Principales bases de données utilisées : Open Source ou commercial
  • Analyse de l'infrastructure cloud : Cloud public vs Cloud sur site vs Cloud hybride
  • Tendances de la persistance polyglotte : Nombre de bases de données utilisées et principales combinaisons

Principales bases de données utilisées en 2019

Alors, quelles bases de données sont les plus populaires en 2019 ? Nous avons ventilé les données par bases de données open source par rapport aux bases de données commerciales :

Bases de données open source

Les bases de données open source sont des bases de données communautaires gratuites dont le code source est accessible au grand public et qui peuvent être modifiés ou utilisés dans leur conception d'origine. MySQL, PostgreSQL et MongoDB sont des exemples populaires de bases de données open source.

Bases de données commerciales

Les bases de données commerciales sont développées et maintenues par une entreprise commerciale qui peuvent être utilisées moyennant des frais d'abonnement à une licence et ne peuvent pas être modifiées. Oracle, SQL Server et DB2 sont des exemples populaires de bases de données commerciales.

Meilleures bases de données Open Source

MySQL reste la première base de données gratuite et open source, représentant plus de 30 % de l'utilisation des bases de données open source. Cela n'est pas surprenant, car MySQL occupe cette position de manière constante depuis de nombreuses années selon DB-Engines.

PostgreSQL est arrivé à la 2e place avec 13,4 % de représentation des utilisateurs de bases de données open source, suivi de près par MongoDB à 12,2 % à la 3e place. Cela pourrait à nouveau être attendu sur la base du classement de popularité des tendances DB-Engines, mais nous avons vu MongoDB à la 2e place à 24,6 % il y a à peine trois mois dans notre rapport 2019 Database Trends - SQL vs NoSQL, Top Databases, Single vs Multiple Database Use report .

Quelles sont les meilleures bases de données Open Source en 2019 ? #SQL #NoSQLCliquez pour tweeter

Alors que plus de 50 % de l'utilisation des bases de données open source est représentée par le top 3, nous avons également constaté une bonne représentation pour #4 Redis , #5 MariaDB, #6 Elasticsearch, #7 Cassandra et #8 SQLite. Les 2 derniers % des bases de données représentées incluent Clickhouse, Galera, Memcached et Hbase.

Meilleures bases de données commerciales

Dans ce graphique suivant, nous examinons un rapport unique qui représente à la fois la persistance polyglotte et les tendances de migration : principales bases de données commerciales utilisées avec des bases de données open source.

Nous avons constaté une tendance croissante à exploiter plusieurs types de bases de données pour répondre aux besoins de vos applications, et nous voulions comparer la façon dont les organisations utilisent les bases de données commerciales et open source au sein d'une seule application. . Ce rapport représente également les utilisateurs de bases de données commerciales qui sont également en train de migrer vers une base de données open source. Par exemple, PostgreSQL, la base de données à la croissance la plus rapide en termes de popularité pendant 2 années consécutives, compte 11,5 % de sa base d'utilisateurs représentée par des organisations en cours de migration vers PostgreSQL.

Ainsi, maintenant que nous avons expliqué ce que représente ce rapport, examinons les principales bases de données commerciales utilisées avec l'open source.

Oracle, la base de données n° 1 au monde, représente plus des 2/3 des combinaisons de bases de données commerciales et open source. Ce qui est choquant dans ce rapport, c'est le grand écart entre Oracle et la 2e place Microsoft SQL Server, car il maintient un écart beaucoup plus petit selon DB-Engines. IBM Db2 est arrivé en 3e place, représentant 11,1 % de l'utilisation des bases de données commerciales combinées à l'open source.

Répartition de l'infrastructure cloud par base de données

Regardons maintenant la répartition de la configuration de l'infrastructure cloud par système de gestion de base de données.

Cloud public vs Cloud sur site vs Cloud hybride

Nous avons demandé à nos utilisateurs de bases de données open source comment ils hébergent leurs déploiements de bases de données afin d'identifier les tendances actuelles entre les déploiements sur site, les déploiements dans le cloud public et les déploiements dans le cloud hybride.

De manière surprenante, 49,5 % des déploiements de bases de données open source sont exécutés sur site, se classant au premier rang. Alors que nous anticipions ce résultat, nous avons été surpris du pourcentage sur site. Dans notre récent rapport sur les tendances PostgreSQL 2019, les déploiements de cloud privé sur site représentaient 59,6 %, soit plus de 10 % de plus que ce rapport.

Le cloud public arrive en 2e place avec 36,7 % des déploiements de bases de données open source, ce qui correspond aux 34,8 % de déploiements du rapport PostgreSQL. Le cloud hybride, cependant, a considérablement augmenté par rapport à ce rapport avec une représentation de 13,8 % des bases de données open source contre 5,6 % des déploiements PostgreSQL.

Alors, quelle infrastructure cloud vous convient le mieux ? Voici une présentation rapide du cloud public, du cloud sur site et du cloud hybride :

Quelle infrastructure cloud est la plus populaire pour les bases de données ? Cloud public vs Cloud sur site vs Cloud hybrideCliquez pour tweeter

Cloud public

Le cloud public est un modèle de cloud computing dans lequel les services informatiques sont fournis sur Internet. Généralement acheté via un modèle d'utilisation par abonnement, le cloud public est très facile à configurer, sans investissement initial important, et peut être rapidement mis à l'échelle en fonction de l'évolution des besoins de votre application.

Sur site

Les déploiements sur site ou cloud privé sont des solutions cloud dédiées à une seule organisation exécutées dans son propre centre de données (ou avec un fournisseur tiers hors site). Il existe de nombreuses autres possibilités de personnaliser votre infrastructure avec une configuration sur site, mais cela nécessite un investissement initial important dans les ressources informatiques matérielles et logicielles, ainsi que des responsabilités de maintenance continues. Ces types de déploiement conviennent mieux aux organisations ayant des besoins de sécurité avancés, aux secteurs réglementés ou aux grandes organisations.

Cloud hybride

Un cloud hybride est un mélange de solutions de cloud public et de cloud privé, intégré dans un environnement d'infrastructure unique. Cela permet aux organisations de partager des ressources entre les clouds publics et privés pour améliorer leur efficacité, leur sécurité et leurs performances. Ceux-ci sont particulièrement adaptés aux déploiements nécessitant la sécurité avancée d'une infrastructure sur site, ainsi que la flexibilité du cloud public.

Voyons maintenant quelles infrastructures cloud sont les plus populaires pour chaque type de base de données open source.

Déploiements de bases de données open source :sur site

Dans ce graphique, ainsi que dans les graphiques de cloud public et de cloud hybride ci-dessous, nous décomposons chaque base de données open source individuelle en fonction du pourcentage de déploiements qui exploitent ce type d'infrastructure cloud.

Alors, quelles sont les bases de données open source les plus fréquemment déployées sur site ? PostgreSQL est arrivé en 1ère place avec 55,8 % des déploiements sur site, suivi de près par MongoDB à 52,2 %, Cassandra à 51,9 % et MySQL à 50 % sur site.

Les bases de données open source qui ont signalé moins de la moitié des déploiements sur site incluent MariaDB à 47,2 %, SQLite à 43,8 % et Redis à 42,9 %. La base de données la moins souvent déployée sur site est Elasticsearch à seulement 34,5 %.

Déploiements de bases de données open source : cloud public

Regardons maintenant la répartition des bases de données open source dans le cloud public.

SQLite est la base de données open source la plus fréquemment déployée dans une infrastructure de cloud public avec 43,8 % de leurs déploiements, suivie de près par Redis avec 42,9 %. Les déploiements de cloud public MariaDB ont atteint 38,9 %, puis 36,7 % pour MySQL et 34,5 % pour Elasticsearch.

Trois bases de données sont arrivées avec moins d'1/3 de leurs déploiements dans le cloud public, y compris MongoDB à 30,4 %, PostgreSQL à 27,9 % et Cassandra avec le moins de déploiements dans le cloud public à seulement 25,9 %.

Déploiements de bases de données open source : cloud hybride

Maintenant que nous savons comment les bases de données open source se répartissent entre le cloud sur site et le cloud public, examinons les déploiements exploitant les deux environnements informatiques.

La première base de données open source pour tirer parti des clouds hybrides est Elasticsearch, qui est arrivée à 31 %. La base de données suivante la plus proche pour le cloud hybride est Cassandra avec seulement 22,2 %.

MongoDB était en 3e place pour le pourcentage de déploiements dans un cloud hybride à 17,4 %, puis PostgreSQL à 16,3 %, Redis à 14,3 %, MariaDB à 13,9 %, MySQL à 13,3 %, et enfin SQLite à seulement 12,5 % des déploiements dans un cloud hybride.

Déploiements de bases de données open source : multicloud

En moyenne, 20 % des déploiements de cloud public et de cloud hybride tirent parti d'une stratégie multi-cloud. Le multi-cloud est l'utilisation de deux ou plusieurs services de cloud computing. Nous avons également examiné le nombre de clouds utilisés et constaté que certains déploiements exploitent jusqu'à 5 fournisseurs de cloud différents au sein d'une même organisation :

Les fournisseurs cloud les plus populaires pour l'hébergement de bases de données Open Source

Dans notre dernière analyse sous la répartition de l'infrastructure cloud, nous analysons les fournisseurs de cloud les plus populaires pour l'hébergement de bases de données open source :

AWS est le fournisseur cloud n°1 pour l'hébergement de bases de données open source, représentant 56,9 % de tous les déploiements cloud de cette enquête. Google Cloud Platform (GCP) est arrivé 2e à 26,2 % avec une avance surprenante sur Azure à 10,8 %. Rackspace a ensuite suivi en 4e position représentant 3,1 % des déploiements, et DigitalOcean et Softlayer ont suivi en dernier représentant les 3 % restants des déploiements open source dans le cloud.

Tendances de la persistance polyglotte

La persistance polyglotte est le concept d'utilisation de différentes bases de données pour gérer différents besoins en utilisant chacune pour ce qu'elle fait de mieux pour atteindre un objectif final au sein d'une seule application logicielle. Il s'agit d'une excellente solution pour vous assurer que votre application gère correctement vos données, au lieu d'essayer de satisfaire toutes vos exigences avec un seul type de base de données. Un exemple évident serait SQL qui est bon pour gérer les données structurées par rapport à NoSQL qui est mieux utilisé pour les données non structurées.

Regardons quelques analyses de persistance polyglotte :

Nombre moyen de types de bases de données utilisés

En moyenne, nous avons constaté que les entreprises exploitent les types de base de données 3.1 pour leurs applications au sein d'une même organisation. Un peu plus d'un quart des organisations exploitent un seul type de base de données, certaines signalant jusqu'à 9 types de bases de données différents :

En moyenne, les applications tirent parti de 3,1 différents types de bases de données - Voir la répartition sur site par rapport au cloud publicCliquez pour tweeter

Nombre moyen de types de bases de données utilisés par l'infrastructure

Alors, comment ce nombre se répartit-il entre les types d'infrastructure ? Nous avons constaté que les déploiements de cloud hybride sont plus susceptibles d'exploiter plusieurs types de bases de données, et en moyenne 4,33 types de bases de données à la fois.

Les déploiements sur site exploitent généralement 3,26 types de bases de données différents, et le cloud public arrive en dernière position avec 3,05 types de bases de données exploités en moyenne au sein de leur organisation.

Types de bases de données les plus couramment utilisés ensemble

Examinons maintenant de plus près les types de bases de données les plus couramment exploités ensemble au sein d'une même application.

Dans le tableau ci-dessous, les bases de données dans la colonne de gauche représentent la taille de l'échantillon pour ce type de base de données, et les bases de données répertoriées en haut représentent le pourcentage combiné avec ce type de base de données. Les cellules surlignées en bleu représentent 100 % des combinaisons de déploiement, tandis que le jaune représente 0 % des combinaisons.

Ainsi, comme nous pouvons le voir ci-dessous dans notre carte thermique des combinaisons de bases de données, MySQL est notre base de données la plus fréquemment combinée avec d'autres types de bases de données. Mais, alors que d'autres types de bases de données sont fréquemment exploités en conjonction avec MySQL, cela ne signifie pas que les déploiements MySQL exploitent toujours un autre type de base de données. Cela peut être vu dans la première ligne pour MySQL, car ceux-ci sont plus clairs du bleu au jaune par rapport à la première colonne de MySQL qui montre une correspondance de couleur beaucoup plus élevée avec le bleu représentant 100 % de combinaisons.

Les cellules surlignées d'une bordure noire représentent les déploiements utilisant uniquement ce type de base de données, où encore une fois MySQL prend la première place avec 23 % de leurs déploiements utilisant MySQL seul.

Nous pouvons également observer une tendance similaire avec Db2, où la ligne du bas pour Db2 montre qu'elle est fortement exploitée avec MySQL, PostgreSQL, Cassandra, Oracle et SQL Server, mais un très faible pourcentage d'autres déploiements de bases de données exploitent également Db2, en dehors de SQL Server, qui utilise également DB2 dans 50 % de ces déploiements.

Popularité des bases de données open source SQL et NoSQL

Enfin, nous comparons SQL et NoSQL pour notre rapport de base de données open source. SQL représente plus de 3/5 de l'utilisation de la base de données open source à 60,6 %, contre NoSQL à 39,4 %.

SQL contre NoSQL - Quel type de base de données est le plus populaire en 2019 ? #MySQL #PostgreSQL #MongoDB #RedisCliquez pour tweeter

Nous espérons que ces tendances de base de données ont été perspicaces et ont suscité de nouvelles idées ou validé votre stratégie de base de données actuelle ! Dites-nous ce que vous en pensez ci-dessous dans les commentaires et faites-nous savoir s'il y a une analyse spécifique que vous aimeriez voir dans notre prochain rapport sur les tendances des bases de données ! Consultez nos autres rapports pour en savoir plus sur les tendances dans le domaine des bases de données :

  • Rapport sur les tendances PostgreSQL 2019 :cloud privé vs public, migrations, combinaisons de bases de données et principales raisons d'utilisation
  • Tendances des bases de données 2019 :SQL vs. NoSQL, principales bases de données, utilisation de bases de données uniques ou multiples 
  • Dernières tendances PostgreSQL :tâches les plus chronophages et métriques importantes à suivre

FAQ sur les tendances de la base de données

Quelles sont les bases de données open source les plus populaires ?

MySQL, PostgreSQL et MongoDB. MySQL représente 31,7 % de l'utilisation des bases de données open source, suivi de PostgreSQL à 13,4 % et de MongoDB à 12,2 %.

Quelles sont les bases de données commerciales les plus populaires ?

Oracle est le système de gestion de base de données commercial numéro 1 représentant les 2/3 de l'utilisation, suivi de SQL Server à la 2e place et de DB2 à la 3e place.

Quels sont les fournisseurs cloud les plus populaires pour l'hébergement de bases de données ?

AWS est le premier fournisseur de cloud pour l'hébergement de bases de données open source, représentant 56,9 % de tous les déploiements cloud de cette enquête. Google Cloud Platform (GCP) est arrivé 2e à 26,2 % avec une avance surprenante sur Azure à 10,8 %.

SQL ou NoSQL, quel type de base de données open source est le plus populaire ?

SQL représente plus de 3/5 de l'utilisation de la base de données open source à 60,6 %, contre NoSQL à 39,4 %.

Combien de types de bases de données sont utilisés en moyenne pour une seule application ?

En moyenne, les entreprises exploitent 3.1 types de bases de données pour leurs applications au sein d'une même organisation. Un peu plus d'un quart des organisations utilisent un seul type de base de données, certaines signalant jusqu'à 9 types de bases de données différents.

Y a-t-il davantage de bases de données open source hébergées sur site, dans le cloud public ou dans des clouds hybrides ?

49,5 % des bases de données open source sont hébergées sur site, tandis que 36,7 % se trouvent dans le cloud public et 13,8 % utilisent des clouds hybrides.