À présent, tout le monde sait que les données sont très précieuses. Les grandes entreprises utilisent les données pour prendre des décisions qui, espérons-le, font avancer l'entreprise et atteignent un niveau de rentabilité plus élevé. En tant qu'administrateurs de base de données, nous protégeons les données, en particulier les informations personnelles identifiables (PII). Les systèmes sont piratés pour obtenir des données. Les données ont beaucoup de valeur et il faudrait vivre sous le proverbe pour apprendre cela aujourd'hui.
Ce que je lis rarement, et le sujet de cet article de blog, c'est comment la valeur des données change avec le temps. La valeur des données doit être utilisée pour piloter vos politiques de rétention.
La plupart des données perdent de leur valeur à mesure qu'elles vieillissent. Je travaillais récemment sur un projet concernant les performances des applications et les métriques que nous capturons pour mesurer ces performances. Certaines personnes du projet voulaient conserver ces mesures pendant plus de cinq ans. J'ai pris la parole et j'ai fait savoir au groupe que les mesures de performance vieilles de cinq ans n'avaient aucune valeur. Notre application change trop au fil des ans. Nous ne pouvons pas comparer les performances de l'application aujourd'hui avec les performances de l'application il y a cinq ans. Ce ne sera pas une comparaison de pommes à pommes.
Toutes les valeurs des données ne diminuent pas au même rythme. Dans l'exemple que j'ai donné au paragraphe précédent, les données métriques de performance applicative valent zéro en cinq ans. Cependant, un détaillant qui dispose de données indiquant qu'un client a acheté des couches il y a cinq ans sait maintenant que le client est susceptible d'acheter des vêtements pour un enfant de cinq ou six ans aujourd'hui. Cet enfant est très probablement à l'école primaire et peut avoir besoin de fournitures scolaires. Dans ce cas, les données des achats de ce client il y a cinq ans ont encore une certaine valeur. Les données ne sont pas sans valeur. Cela étant dit, nous n'avons pas besoin de tous les points de données d'il y a cinq ans. Nous n'avons besoin que d'un résumé de l'activité de ce client pour tirer des conclusions significatives sur ses achats actuels et futurs.
Trop souvent, je vois des gens traiter les systèmes de bases de données comme un dépotoir. Les données y sont simplement déversées et très peu de gens réfléchissent à ce qu'il faut faire de ces données à long terme. Très peu de gens réfléchissent à la valeur de ces données sur le long terme. Il y a un coût associé au stockage de ces données. Si les données ont peu ou pas de valeur en raison de leur ancienneté, cela vaut-il le coût de conserver ces données dans la base de données ?
Il existe des stratégies d'atténuation à employer pour les données plus anciennes. L'administrateur de la base de données peut déplacer des données plus anciennes et de moindre valeur vers un niveau de stockage moins cher. Si les données ont une valeur nulle, les données doivent être détruites. Souvent, nous n'avons plus besoin des détails complets de ces anciennes données lorsque des résumés suffisent, auquel cas nous agrégeons les données et stockons les résultats. Alors débarrassez-vous des détails.
En tant qu'administrateur de la base de données, il est de votre responsabilité d'être le gardien de vos données et des ressources nécessaires pour les héberger. Vous devriez toujours demander les étapes appropriées nécessaires pour prendre soin de ces données à mesure qu'elles vieillissent.