Les bases de données d'apprentissage automatique arrivent à maturité. Cela présente d'énormes opportunités pour les professionnels des bases de données qui sont capables d'évoluer pour tirer parti de ce changement.
Actuellement, les professionnels des bases de données, par exemple les administrateurs de bases de données (DBA) et les développeurs de bases de données, comptent parmi les postes les plus importants de toute organisation informatique. Un professionnel des bases de données est responsable de la création, de la gestion et de la fourniture d'un accès contrôlé à une base de données. Avoir la bonne personne en tant que DBA peut aider les entreprises à gagner du temps et à raccourcir le temps de développement des applications. Cependant, avec l'accès croissant à une énorme quantité de données, les responsabilités d'un professionnel des bases de données évoluent rapidement.
Plusieurs technologies ont été développées qui peuvent être utilisées non seulement pour gérer et explorer les données, mais aussi pour aider à prendre des décisions éclairées sur la base des données. L'apprentissage automatique est l'une de ces technologies qui a connu un grand essor au cours de la dernière décennie. Cet article donne un bref aperçu de l'impact de l'apprentissage automatique sur les métiers des bases de données et des avantages de l'apprentissage automatique en tant qu'ensemble de compétences.
Qu'est-ce que l'apprentissage automatique ?
L'apprentissage automatique est un processus de compréhension et d'extraction de modèles utiles à partir de données à l'aide de divers algorithmes statistiques. L'apprentissage automatique est divisé en techniques d'apprentissage supervisées et non supervisées. L'apprentissage automatique est actuellement utilisé pour résoudre de nombreux problèmes complexes tels que la classification des e-mails malveillants et indésirables, la prévision du prix de l'immobilier, la génération de poèmes, la classification des images, etc.
L'apprentissage automatique remplacera-t-il les métiers de la base de données ?
L'une des idées fausses les plus courantes sur l'apprentissage automatique est qu'il va remplacer les humains dans de nombreux emplois. Bien que cela puisse être vrai pour certaines tâches répétitives, l'IA et l'apprentissage automatique vont essentiellement compléter le cerveau humain et non le remplacer. Pour les professionnels des bases de données, les bases de données d'apprentissage automatique ne les remplaceront pas, elles les aideront plutôt énormément.
Il permettra aux professionnels des bases de données de se concentrer beaucoup plus sur la planification et les tâches stratégiques, car il automatisera des tâches plus ennuyeuses et autonomes telles que l'installation, la configuration et les mises à jour régulières de la base de données. Par conséquent, au lieu de craindre l'impact de l'apprentissage automatique sur leur travail, les professionnels des bases de données devraient l'adopter comme un moyen d'accomplir des tâches moins difficiles beaucoup plus rapidement et efficacement. .
Gérer le Big Data est un défi
En raison de l'essor du Web mondial au cours des deux dernières décennies, les données sont disponibles sous toutes les formes et dans toutes les tailles. En fait, le terme big data est souvent utilisé pour désigner l'ensemble de données qui est énorme en volume, arrive à grande vitesse et contient une variété de contenus.
La gestion d'énormes quantités de données non structurées est devenue un défi pour les DBA. Les algorithmes exécutés sur des bases de données d'apprentissage automatique se sont également révélés efficaces avec des données non structurées. Une énorme quantité de données peut facilement être décomposée en informations significatives via des techniques d'apprentissage automatique qui soulignent la nécessité pour les professionnels des bases de données d'acquérir des compétences en apprentissage automatique.
Les bases de données d'apprentissage automatique sont là
Des entreprises telles que Microsoft et Oracle ont déjà commencé à intégrer différentes capacités d'apprentissage automatique dans les bases de données. Par exemple, Microsoft Azure SQL Database dispose d'un module qui suggère et recommande différentes stratégies d'amélioration des performances qui peuvent être appliquées automatiquement. De même, le magasin de requêtes SQL Server fournit un plan pour identifier les requêtes provoquant des goulots d'étranglement de performances. La base de données Oracle 18c contient des capacités d'autoréparation et peut appliquer des correctifs automatiques et une mise à niveau chaque fois qu'un problème de base de données se produit. Une bonne connaissance de l'apprentissage automatique aide en fait les développeurs de bases de données à comprendre la justification des différentes recommandations faites par les outils de base de données d'apprentissage automatique.
L'avènement des bases de données entièrement autonomes
Les bases de données d'apprentissage automatique actuelles ont des capacités limitées. L'objectif des recherches actuelles est de développer des bases de données entièrement automatisées. Ne serait-il pas agréable d'avoir une base de données capable d'anticiper les problèmes qui vont survenir et suffisamment proactive pour prendre des mesures préventives à l'avance ? Ou cela ne faciliterait-il pas la vie d'un professionnel des bases de données si la base de données se sauvegarde automatiquement chaque fois qu'une transaction cruciale se produit ? Il existe de nombreux scénarios dans lesquels les bases de données d'apprentissage automatique sont extrêmement utiles.
Par exemple, les bases de données existantes effectuent des sauvegardes automatiques à un moment précis, mais toutes les transactions de base de données ne valent pas la peine d'être sauvegardées. Dans ce type de scénario, les bases de données d'apprentissage automatique pourraient devenir suffisamment intelligentes pour savoir quand sauvegarder et quand ne pas sauvegarder.
De plus, de nombreux problèmes de base de données peuvent être anticipés à l'avance. Par exemple, dans les scénarios où plusieurs utilisateurs accèdent à différentes ressources de base de données, la probabilité d'un blocage est multipliée par plusieurs. Si cela se produisait, une base de données d'apprentissage automatique pourrait fournir un accès contrôlé aux ressources et éviter un blocage.
Il existe plusieurs groupes de recherche universitaires qui ont tenté de développer des bases de données entièrement autonomes.
Le groupe de recherche sur la base de données Carnegie Mellon a développé le projet OtterTune qui utilise des techniques d'apprentissage automatique et des données de charge de travail provenant d'un grand nombre d'anciennes bases de données pour créer des modèles capables de régler automatiquement de nouvelles charges de travail. La base de données d'apprentissage automatique OtterTune recommande également automatiquement les paramètres optimaux pour un débit amélioré et une latence réduite pour les nouvelles applications de base de données.
Le MIT a également développé un cadre de gestion de base de données open source appelé DBSee r qui prédit les performances pour un ensemble donné de ressources de base de données et identifie également les goulots d'étranglement des performances.
Courbe d'apprentissage
L'apprentissage automatique est souvent défini comme l'intersection de l'informatique et des statistiques. Toute personne ayant des connaissances en informatique peut développer relativement rapidement ses compétences en apprentissage automatique à un niveau intermédiaire si elle développe une compréhension raisonnable des statistiques.
De nombreux outils d'interface graphique et plates-formes cloud telles que Google AI, IBM Watson, Amazon Sagemaker, Azure ML ont simplifié le processus de mise en œuvre des techniques d'apprentissage automatique en fournissant des interfaces de glisser-déposer basées sur l'interface graphique pour les bases de données d'apprentissage automatique. Les utilisateurs n'ont qu'à savoir utiliser l'outil car la majorité du travail (ajout d'ensembles de données, sélection de techniques de prétraitement, formation du modèle et enfin évaluation du modèle) peut être effectuée en quelques clics de souris.
Si un professionnel des bases de données souhaite vraiment faire carrière dans l'apprentissage automatique avancé, il devra acquérir une compréhension approfondie des statistiques. La formation en informatique d'un professionnel des bases de données sera plus que suffisante pour saisir rapidement les concepts d'apprentissage automatique liés à CS.
Cependant, comme nous l'avons dit plus haut, si un professionnel des bases de données ne souhaite utiliser l'apprentissage automatique que pour automatiser des tâches répétitives, une connaissance des outils d'apprentissage automatique basés sur l'interface graphique sera plus que suffisante.
Plusieurs cheminements de carrière
Le succès de l'apprentissage automatique et de l'intelligence artificielle a incité les organisations à développer des équipes dédiées à la science des données composées d'experts qualifiés en apprentissage automatique.
Actuellement, les experts en apprentissage automatique et les professionnels des bases de données ont des cheminements de carrière différents, mais de plus en plus d'organisations s'attendront à ce que les experts en apprentissage automatique ou en science des données aient un certain niveau d'expertise en matière de bases de données, et vice versa.
Étant donné que cela est actuellement en évolution, les professionnels des bases de données ayant une connaissance des compétences en apprentissage automatique sont préférés et ont de meilleures chances d'être embauchés en tant que professionnel des bases de données, ou expert en apprentissage automatique ou quelqu'un avec les deux responsabilités professionnelles.
Verdict final
L'avènement des mégadonnées et des techniques d'apprentissage automatique associées est susceptible d'apporter des changements substantiels dans les responsabilités professionnelles des professionnels des bases de données, car au fil du temps, leur attention se déplacera vers les données de la base de données, car les bases de données d'apprentissage automatique se gèrent de plus en plus elles-mêmes.
L'apprentissage automatique aidera les professionnels des bases de données à automatiser de nombreuses tâches manuelles et laborieuses, et les libérera pour investir du temps et des efforts pour adopter les compétences d'apprentissage automatique et les mettre à profit.
Apprendre les statistiques nécessaires pour passer d'un professionnel de la base de données à une base de données plus large et à l'apprentissage automatique n'est pas simple, mais rapportera de gros dividendes en termes de croissance de carrière et d'opportunités.