Dans le monde réel, les opérations commerciales génèrent un flux continu et exponentiel de données. L'intelligence artificielle traduit ces données du monde réel en éléments virtuels exploitables, mais les nuances du langage se perdent facilement dans cette conversion. Si nous pouvions apprendre aux ordinateurs à comprendre la syntaxe, pourrions-nous améliorer la science de l'information ?
L'un de mes collègues aime à dire que comprendre le langage est plus facile à dire qu'à faire. C'est une idée contre laquelle je pourrais facilement trouver des arguments, si ce n'est que sa phrase elle-même est la preuve que le langage parlé et écrit est souvent plus complexe qu'il n'y paraît, ou que l'intelligence artificielle.
« Nous l'avons oublié à l'âge adulte, mais il faut se rappeler que nous avons passé plusieurs années d'école à apprendre à lire et à écrire », m'a rappelé François-Régis Chaumartin, fondateur de l'éditeur de logiciels de traitement automatique du langage naturel (NLP) Proxem lorsque je l'ai rencontré pour la première fois en 2020. « Pourquoi est-ce si difficile ? Parce que les ambiguïtés sont omniprésentes dans le langage humain. Un seul mot peut recouvrir de nombreux concepts, et un même concept être décrit par de nombreux mots. »
Le langage humain est beau, mais ses subtilités, comme l'argot, les clichés, les tournures de phrases, l'ironie ou les homonymes, pour n'en citer que quelques-unes, sont difficiles à comprendre pour un ordinateur. Dans le monde entier, chaque langue et chaque dialecte ont également leurs propres nuances, ce qui peut facilement entraîner des erreurs de traduction et d'interprétation. C'est pour cette raison que les avancées du traitement automatique des langues (NLP) dans le domaine de la science des données et de l'IA sont restées assez fugaces pendant de nombreuses années.
Pas moins de 80 % des connaissances d'une entreprise sont implicites et se cachent dans des textes, notamment des réglementations, des prescriptions, des contrats, des e-mails et des réseaux sociaux. Sans une analyse sémantique appropriée, les signaux faibles sont facilement négligés. Les fautes d'orthographe, le jargon et les abréviations Internet conduisent au mieux à une mauvaise catégorisation, ou au pire à la non-prise en compte de données précieuses. La capacité de transformer à la vitesse de l'éclair ces montagnes de données textuelles en ensembles cohérents de concepts connexes et d'informations exploitables est un avantage commercial certain.
Pour automatiser l'interprétation des connaissances, et passer du niveau implicite au niveau explicite, il faut une intelligence sémantique solide, qui combine le langage naturel et les technologies d'apprentissage machine. Une fois les connaissances explicites accessibles à tous, des connexions plus étroites entre l'entreprise et ses consommateurs, patients, partenaires ou salariés se créent, capturant et contextualisant les données issues de leurs expériences et de leurs attentes. C'est parce que le NLP traduit d'énormes flux d'informations en informations et tendances claires et précises que les expériences individuelles deviennent des connaissances collectives et réutilisables. Ces informations et ces tendances peuvent alors être exploitées, non seulement pour améliorer l'excellence opérationnelle, mais aussi pour identifier des opportunités d'innovation. L'innovation, à son tour, améliore la satisfaction et la fidélité des clients, d'où de meilleures performances commerciales.
Traditionnellement, le NLP était utilisé pour analyser des rapports, répondre aux commentaires des clients et améliorer les résultats de recherche. Aujourd'hui, des applications de pointe facilitent la maintenance prédictive des équipements et améliorent l'efficacité des opérations. Par exemple, la capacité à identifier automatiquement des réclamations similaires de la part de plusieurs clients permet de déceler plus rapidement des défauts de qualité, quel que soit le secteur. Grâce au NLP, nous pouvons intégrer des connaissances et un savoir-faire illimités à des expériences de jumeaux virtuels, des expériences en 3D précises qui permettent aux concepteurs et aux ingénieurs de créer et tester de nouveaux produits et processus sans les casser. Les possibilités sont vraiment infinies.
À l'ère du Big Data, toutes les informations dont nous avons besoin ne sont pas tout à fait à portée de main. Mais en aidant l'IA à comprendre le langage humain, nous ouvrons la voie à ce que les entreprises soient encore plus intelligentes, innovantes et orientées client.
Morgan Zimmermann, Directeur général, Dassault Systèmes NETVIBES