Database
 sql >> Base de données >  >> RDS >> Database

Contenu non structuré :une source de carburant inexploitée pour l'IA et l'apprentissage automatique

Par Alex Welsh , Vice-président, Analytics Practice, Ephesoft

Choisiriez-vous où partir en vacances si vous ne pouviez accéder qu'à 10 à 20 % des critiques et des informations sur un site Web de voyage ? Si vous le faites, vous ferez probablement un voyage inoubliable, mais pour des raisons que vous n'aimerez peut-être pas. Pourtant, les organisations gouvernementales et les entreprises - de la fabrication aux compagnies d'assurance, et des soins de santé aux banques - prennent des décisions dans le même sens. Et ils le font depuis des années. Ils examinent les informations simples qu'ils peuvent obtenir à partir de données structurées tout en ignorant leurs données non structurées, qui, selon Deloitte, pourraient représenter 80 à 90 % du contenu généré dans le monde, faisant des données non structurées une formidable source de valeur inexploitée.

Heureusement, les progrès de l'IA (intelligence artificielle) et de l'apprentissage automatique permettent désormais de passer au crible et de trouver un sens à de grandes quantités de données non structurées obtenues à partir de fichiers vidéo et audio, d'e-mails, de journaux, de publications sur les réseaux sociaux et même de notifications. à partir d'appareils Internet des objets (IoT). Toutes ces données peuvent apporter d'énormes avantages, par exemple lorsqu'elles sont utilisées pour automatiser des tâches manuelles intensives et souvent très répétitives. Une tâche, par exemple, consiste à faire attention aux signaux d'alarme :des critères ou des comportements spécifiques qui peuvent indiquer que quelque chose ne va pas et des mesures correctives doivent être prises rapidement. Examinons quelques cas de différents secteurs.

Qu'en est-il d'une réclamation d'assurance qui semble correcte à première vue, mais qui mérite d'être étudiée, ou d'un demandeur d'emploi qui cache peut-être des informations ? Qu'en est-il d'une expédition de produits pharmaceutiques hautement périssables qui n'ont peut-être pas été réfrigérés pendant une partie de leur voyage, ou d'un contrat qui peut enfreindre les lois d'un pays ou rompre un accord existant avec une autre société ? L'important est qu'un drapeau rouge indique des problèmes qui, s'ils ne sont pas contrôlés, pourraient causer de gros dégâts.

L'intelligence artificielle est massivement gourmande en données

Comment l'IA et l'apprentissage automatique permettent-ils une analyse des données plus efficace et efficiente ? En l'alimentant en données. En donnant à un modèle d'apprentissage automatique des exemples de bonnes et de mauvaises transactions, il apprend à faire la distinction entre les deux types. Et plus le modèle d'apprentissage automatique traite de données, plus il renforce ces leçons, améliorant ainsi la précision.

Ainsi, bien que l'IA et l'apprentissage automatique progressent à grands pas, les entreprises et les autres organisations doivent rattraper leur retard. Pensez-y de cette façon :les données sont comme du carburant. Nous en avons besoin pour alimenter notre réflexion afin de prendre des décisions judicieuses. Mais, nous avons extrait toutes les choses faciles, les données structurées qui arrivent dans des packages agréables et soignés. Mais c'est là que l'analogie avec le carburant s'effondre :même si un autre gallon d'essence nous permet de parcourir encore 20 à 30 milles, plus nous mettons de données nous permettant de prendre des décisions nettement meilleures et plus précises, et pas seulement 20 à 30 milles supplémentaires. -valent des kilomètres impairs et pour les rendre encore plus rapides.

Pourtant, pendant si longtemps, une énorme partie de nos données, nos données non structurées, est restée inexploitée parce qu'elle était trop chère et trop difficile à accéder et à traiter. Et, bien que ce ne soit plus le cas à mesure que de nouvelles technologies permettant de collecter et d'analyser des données non structurées deviennent disponibles, de nombreuses personnes dans les entreprises et d'autres organisations ont ignoré ces avancées.

Où se trouve l'argent intelligent

International Data Corporation (IDC) prévoit que d'ici 2020, les organisations qui analysent à la fois les données structurées et non structurées, c'est-à-dire toutes les données pertinentes, et fourniront des informations exploitables réaliseront des gains de productivité supplémentaires de 430 milliards de dollars par rapport à leurs concurrents qui n'effectuent pas une telle analyse de données. Et les entreprises qui comprennent cela n'attendent pas jusqu'en 2020. Un dirigeant d'une compagnie d'assurance multinationale basée en Allemagne considère les données non structurées comme leur plus grand risque. Ils comprennent les chiffres en jeu et veillent à ne pas être pris au dépourvu en rédigeant des polices d'assurance qui les exposent à des responsabilités qu'ils auraient pu éviter.

La puissance combinée du Big Data, de l'IA et de l'apprentissage automatique peut faciliter le traitement des informations liées à des défis encore plus complexes. Par exemple, les banques et d'autres organisations peuvent détecter plus précisément et plus rapidement la fraude, l'évasion fiscale, le blanchiment d'argent et d'autres stratagèmes en exploitant ce qui était auparavant des données non traitées et non structurées. Cela leur permet de détecter et d'arrêter les cas de fraude et d'abus, ainsi que d'éviter les nombreux faux positifs qui peuvent survenir lorsqu'ils s'appuient uniquement sur des données structurées. Les accords de financement du commerce, y compris les contrats et les multiples sources de données, entre pays ou entreprises peuvent également être parcourus pour déterminer s'il existe des fraudes ou des iniquités, qu'elles soient intentionnelles ou non.

De plus, l'IA et l'apprentissage automatique peuvent aider les banques et d'autres types d'entreprises à mieux identifier et vérifier l'identité de leurs clients grâce à des procédures automatisées Know Your Customer (KYC). De telles procédures peuvent aider à empêcher qu'elles ne soient utilisées, délibérément ou par inadvertance, pour des activités de blanchiment d'argent, ainsi qu'à éviter les pots-de-vin et d'autres formes de corruption. Les procédures KYC peuvent également permettre aux entreprises de mieux comprendre les transactions et les besoins financiers de leurs clients, ainsi que les aider à gérer les risques avec plus de prudence. Parmi les autres avantages, citons l'accélération du délai de génération de revenus lors de l'intégration de nouveaux clients, ce qui fait du KYC non pas un coût supplémentaire à supporter, mais plutôt une source de profit.

L'IA et l'apprentissage automatique peuvent augmenter votre compétitivité

Avec tous les avantages tirés de l'IA et de l'apprentissage automatique, ainsi que les avancées technologiques utilisées pour traiter les données structurées et non structurées, il est temps que davantage d'entreprises et d'organisations profitent de la plus grande source d'informations disponible :leurs propres données non structurées.

À propos de l'auteur

Alex Gallois dirige la pratique analytique mondiale d'Ephesoft. Il est un directeur des ventes expérimenté, un chef de projet et un entrepreneur passionné par la résolution des problèmes critiques des clients grâce à des solutions technologiques innovantes et rentables.