Qu’est-ce que le traitement du langage naturel ?
Publié: 2024-06-25Qu'est-ce que le processus de langage naturel (PNL) ?
Le traitement du langage naturel (NLP) est un domaine de l'intelligence artificielle et de la linguistique informatique qui se concentre sur l'interaction entre les ordinateurs et les langages humains (naturels). La PNL implique le développement d'algorithmes et de modèles permettant aux ordinateurs de comprendre, d'interpréter et de générer le langage humain de manière significative et utile.
La PNL peut être largement divisée en deux catégories principales :
- Compréhension du langage naturel (NLU)
- Génération de langage naturel (NLG)
Ces processus distinguent les langages naturels et humains des langages informatiques ou de programmation en se concentrant sur les nuances, le contexte et la variabilité de la communication humaine.
Compréhension du langage naturel (NLU)
La compréhension du langage naturel est la manière dont l’IA donne un sens au texte ou à la parole. Le mot « comprendre » est un peu abusif, car les ordinateurs ne comprennent rien par nature ; ils peuvent plutôt traiter les entrées de manière à produire des résultats qui ont du sens pour les humains.
La langue est notoirement difficile à décrire de manière approfondie. Même si vous parvenez à documenter tous les mots et règles de la version standard d'une langue donnée, il existe des complications telles que les dialectes, l'argot, le sarcasme, le contexte et la façon dont ces éléments changent au fil du temps.
Une approche de codage basée sur la logique s’effondre rapidement face à cette complexité. Au fil des décennies, les informaticiens ont développé des méthodes statistiques permettant à l’IA de comprendre le texte dans le but de comprendre de plus en plus précisément ce que disent les gens.
Génération de langage naturel (NLG)
Récemment, la capacité des ordinateurs à créer du langage suscite de plus en plus d’attention. En fait, la partie texte de l’IA générative est une forme de génération de langage naturel.
Le NLG d'aujourd'hui est essentiellement un jeu de devinettes très sophistiqué. Plutôt que de comprendre intrinsèquement les règles de grammaire, les modèles d’IA génératifs crachent le texte mot par mot via des modèles probabilistes qui prennent en compte le contexte de leur réponse. Étant donné que les grands modèles de langage (LLM) actuels ont été formés sur une grande quantité de texte, leur résultat apparaît généralement comme un bon discours humain, même si parfois le contenu est erroné. (Nous en reparlerons plus tard.)
Comment fonctionne le traitement du langage naturel ?
Le traitement du langage naturel (NLP) implique plusieurs étapes pour analyser et comprendre le langage humain. Voici un aperçu des principales étapes :
Analyse lexicale
Tout d’abord, l’entrée est décomposée en morceaux plus petits appelésjetons. Les jetons peuvent être des mots individuels, des parties de mots ou des phrases courtes.
Par exemple, « cuit » peut devenir deux jetons, « cuisinier » et « ed », pour capturer séparément le sens et le temps du verbe, tandis que « hot dog » peut être un jeton car les deux mots ensemble ont une signification distincte.
Analyse syntaxique
Cette étape se concentre sur la structure des jetons, en les insérant dans un cadre grammatical.
Par exemple, dans la phrase « Pat a cuisiné un hot-dog pour tout le monde », le modèle identifie « cuit » comme le verbe au passé, « hot-dog » comme sujet direct et « tout le monde » comme sujet indirect.
Analyse sémantique
La sémantique consiste à comprendre le sens des mots. Ce processus aide le modèle à reconnaître l'intention du locuteur, en particulier lorsqu'un mot ou une phrase peut être interprété différemment.
Dans l'exemple de phrase, étant donné que le sujet indirect indique plusieurs personnes, il est peu probable que Pat ait cuisiné un seul hot-dog. Le modèle comprendrait donc la signification de « un hot-dog par personne ».
Reconnaissance d'entité nommée (NER)
Les noms ont des propriétés spéciales au sein des langues. Qu'ils soient implicitement ou explicitement formés, les modèles d'IA créent de longues listes dans de nombreuses catégories, allant des noms de chaînes de restauration rapide aux mois de l'année.
NER les identifie à partir de jetons uniques ou multiples pour améliorer sa compréhension du contexte. Dans le cas de « Pat », un élément de données remarquable est que son sexe implicite est ambigu.
Un autre aspect du NER est qu’il aide les moteurs de traduction à éviter d’être trop pressés. Les dates et les noms de pays doivent être traduits, mais les noms de personnes et d’entreprises ne doivent généralement pas l’être. (Pat, le nom, ne doit pas être traduit littéralement par tapoter tendrement avec la main ouverte.)
Analyse pragmatique
Cette phase consiste à déterminer s'il faut suivre le sens littéral des mots ou s'il existe des facteurs tels que des expressions idiomatiques, du sarcasme ou d'autres implications pratiques.
Dans la phrase d’exemple, « tout le monde » signifie littéralement chaque personne dans le monde. Cependant, étant donné le contexte dans lequel une seule personne cuisine, il est extrêmement improbable que Pat grille et distribue huit milliards de francs. Au lieu de cela, l’IA interprétera le mot comme « toutes les personnes appartenant à un certain ensemble ».
Intégration du discours
Cette étape rend compte de la façon dont le sens se transmet tout au long d'une conversation ou d'un document entier. Si la phrase suivante est « Elle a ensuite fait une sieste », le modèle pense que « elle » fait référence à Pat et dissipe ainsi l'ambiguïté de genre au cas où elle reviendrait.
Applications du traitement du langage naturel
Voici quelques applications clés de la PNL :
Traitement de texte
Chaque fois qu’un ordinateur interprète le texte saisi, la PNL est à l’œuvre. Quelques applications spécifiques incluent :
- Aide à l'écriture : des outils tels que Grammarly utilisent la PNL pour fournir des commentaires en temps réel sur votre écriture, y compris la vérification orthographique, les corrections grammaticales et les ajustements de ton. Découvrez-en davantage sur la façon dont Grammarly utilise la PNL dans la section suivante.
- Analyse des sentiments : la PNL permet aux ordinateurs d'évaluer le ton émotionnel derrière le texte. Ceci est utile aux entreprises pour comprendre les sentiments des clients à l'égard des produits, des émissions ou des services, qui peuvent influencer les ventes et l'engagement.
- Moteurs de recherche : en analysant le sens de votre requête, ils peuvent présenter des résultats même s'ils ne contiennent pas exactement ce que vous avez tapé. Cela s'applique aux recherches sur le Web comme Google et à d'autres types tels que les réseaux sociaux et les sites commerciaux.
- Saisie semi-automatique : en comparant ce que vous avez déjà tapé à une grande base de données de ce que d'autres personnes (et vous-même) avez tapé dans le passé, la PNL peut présenter une ou plusieurs suppositions sur ce qui devrait suivre.
- Classification : Une autre utilisation courante de la PNL consiste à catégoriser différentes entrées. Par exemple, la PNL peut déterminer quels aspects des produits et services d’une entreprise sont abordés dans les avis.
Génération de texte
Une fois qu’un modèle PNL comprend le texte qui lui est donné, il peut réagir. Souvent, le résultat est également du texte.
- Réécriture : des outils tels que Grammarly analysent le texte pour suggérer des améliorations en matière de clarté, de ton et de style. Grammarly utilise également la PNL pour ajuster la complexité du texte en fonction du public cible, repérer les lacunes du contexte, identifier les domaines à améliorer, etc.
- En résumé : l'une des capacités les plus convaincantes de la génération IA d'aujourd'hui est de réduire les grands textes à leur essence, qu'il s'agisse de la transcription d'une réunion ou d'un sujet qu'elle connaît grâce à sa formation. Cela tire parti de sa capacité à conserver de nombreuses informations dans sa mémoire à court terme afin de pouvoir examiner un contexte plus large et trouver des modèles.
- Articles de presse : l’IA est parfois utilisée pour prendre des informations de base et créer un article entier. Par exemple, à partir de diverses statistiques sur un match de baseball, il peut écrire un récit qui retrace le déroulement du jeu et les performances de différents joueurs.
- Ingénierie d'invite : dans une méta-utilisation de l'IA, la PNL peut générer une invite instruisant une autre IA. Par exemple, si vous disposez d'un compte ChatGPT payant et que vous lui demandez de créer une image, il complète votre texte avec des informations et des instructions supplémentaires qu'il transmet au modèle de génération d'images DALL-E.
Traitement de la parole
La conversion de la langue parlée en texte présente des défis tels que les accents, le bruit de fond et les variations phonétiques. La PNL améliore considérablement ce processus en utilisant des informations contextuelles et sémantiques pour rendre les transcriptions plus précises.
- Transcription en direct : sur des plateformes comme Zoom ou Google Meet, la PNL permet aux transcriptions en temps réel d'ajuster le texte passé en fonction du nouveau contexte du discours en cours.Cela aide également à segmenter le discours en mots distincts.
- Systèmes de réponse vocale interactive (IVR) : les systèmes téléphoniques généralement utilisés par les opérations de service client des grandes entreprises utilisent la PNL pour comprendre pourquoi vous demandez de l'aide.
La traduction de la langue
La PNL est cruciale pour traduire des textes entre langues, tant pour les utilisateurs occasionnels que pour les traducteurs professionnels. Voici quelques points clés :
- Utilisation quotidienne : la PNL aide les gens à naviguer, discuter, étudier et voyager dans différentes langues en fournissant des traductions précises.
- Usage professionnel : les traducteurs utilisent souvent la traduction automatique pour les premières ébauches, les affinant grâce à leur expertise linguistique.Des plateformes spécialisées proposent des mémoires de traduction pour maintenir une terminologie cohérente dans des domaines spécifiques comme la médecine ou le droit.
- Améliorer la précision de la traduction : fournir davantage de contexte, comme des phrases complètes ou des paragraphes, peut aider les modèles PNL à produire des traductions plus précises que des phrases courtes ou des mots simples.
Une brève histoire de la PNL
L’histoire de la PNL peut être divisée en trois époques principales : l’approche basée sur des règles, l’ère des méthodes statistiques et la révolution du deep learning. Chaque époque a apporté des changements transformateurs dans le domaine.
Approche basée sur des règles (années 1950)
Les premiers programmes de PNL, lancés dans les années 1950, étaient basés sur des règles codées en dur. Ces programmes ont bien fonctionné pour une grammaire simple, mais ont rapidement révélé les défis liés à la construction de règles complètes pour une langue entière. La complexité du ton et du contexte du langage humain a rendu cette approche laborieuse et insuffisante.
Méthodes statistiques (années 1980)
Dans les années 1980, les informaticiens ont commencé à développer des modèles utilisant des méthodes statistiques pour trouver des modèles dans de grands corpus de textes. Cette approche exploitait les probabilités plutôt que les règles pour évaluer les intrants et générer les extrants, et elle s’est avérée plus précise, plus flexible et plus pratique. Pendant trois décennies, les progrès de la PNL ont été largement motivés par des améliorations progressives de la puissance de traitement et de la taille des ensembles de données de formation.
Apprentissage profond (milieu des années 2010 à aujourd'hui)
Depuis le milieu des années 2010, le deep learning a révolutionné la PNL. Les techniques modernes d'apprentissage profond permettent aux ordinateurs de comprendre, de générer et de traduire le langage humain avec une précision remarquable, dépassant souvent les performances humaines dans des tâches spécifiques.
Deux avancées majeures ont conduit à ces progrès :
- Vastes données de formation : les chercheurs ont exploité les nombreuses données générées par Internet.Par exemple, des modèles comme GPT-4 sont formés sur un texte équivalent à plus d'un million de livres. De même, Google Translate s’appuie sur un corpus massif de contenus de traduction parallèle.
- Réseaux de neurones avancés : de nouvelles approches ont amélioré les réseaux de neurones, leur permettant d'évaluer de manière holistique des éléments d'entrée plus importants.Initialement, les réseaux de neurones récurrents et les technologies associées pouvaient gérer des phrases ou des paragraphes courts. L'architecture de transformateur actuelle, utilisant une technique appelée attention, peut traiter plusieurs paragraphes, voire des pages entières. Ce contexte élargi améliore la probabilité de saisir correctement le sens, tout comme la compréhension humaine.
Comment Grammarly utilise le traitement du langage naturel
Grammarly utilise un mélange de systèmes basés sur des règles et de modèles d'apprentissage automatique pour aider les rédacteurs. Les méthodes basées sur des règles se concentrent sur des erreurs plus objectives, telles que l'orthographe et la grammaire. Pour les questions de discrétion telles que le ton et le style, il utilise des modèles d'apprentissage automatique. Ces deux types fonctionnent souvent ensemble, avec un système appelé Gandalf (comme dans « Vous ne pouvez pas passer ») déterminant les suggestions à présenter aux utilisateurs. Alice Kaiser-Schatzlein, linguiste analytique chez Grammarly, explique : « L'évaluation basée sur des règles relève principalement du domaine de l'exactitude, alors que les modèles ont tendance à être utilisés pour les types de changements les plus subjectifs. »
Les commentaires des utilisateurs, tant globaux qu'individuels, constituent une source de données cruciale pour améliorer les modèles de Grammarly. Gunnar Lund, un autre linguiste analytique, explique : « Nous personnalisons les suggestions en fonction de ce que les gens ont accepté ou rejeté dans le passé. » Ces commentaires sont anonymisés et utilisés de manière globale pour affiner et développer de nouvelles fonctionnalités, garantissant que l'outil s'adapte à différents styles d'écriture tout en préservant la confidentialité.
La force de Grammarly réside dans la fourniture d'une assistance immédiate et de haute qualité sur différentes plateformes. Comme le note Lund, l'interface du produit est un élément important pour rendre la puissance de l'IA accessible : « Grammarly offre une assistance immédiate… fournissant la PNL dans une interface utilisateur rapide et facile à utiliser. » Cette accessibilité et cette réactivité profitent à tous ceux qui écrivent en anglais, en particulier aux anglophones non natifs.
L'étape suivante consiste à passer à la personnalisation, au-delà de laquelle les suggestions qu'un utilisateur accepte et rejette. Comme le dit Kaiser-Schatzlein : « Nous voulons que notre produit produise une écriture beaucoup plus sensible au contexte et qui reflète les goûts personnels et les expressions de l'écrivain… nous essayons de faire en sorte que la langue vous ressemble davantage. »
Note de l'éditeur : Grammarly prend votre vie privée très au sérieux. Il met en œuvre des mesures strictes telles que le cryptage et des configurations réseau sécurisées pour protéger les données des utilisateurs. Pour plus d’informations, veuillez consulter notre Politique de confidentialité.
Cas d'utilisation de l'industrie
La PNL révolutionne les industries en permettant aux machines de comprendre et de générer le langage humain. Il améliore l'efficacité, la précision et l'expérience utilisateur dans les domaines de la santé, des services juridiques, de la vente au détail, de l'assurance et du service client. Voici quelques cas d’utilisation clés dans ces secteurs.
Soins de santé
Les logiciels de transcription peuvent grandement améliorer l'efficacité du temps limité d'un clinicien avec chaque patient. Plutôt que de passer une grande partie de la rencontre à rédiger des notes, ils peuvent s’appuyer sur une application pour transcrire une conversation naturelle avec un patient. Une autre couche de PNL peut résumer la conversation et structurer les informations pertinentes telles que les symptômes, le diagnostic et le plan de traitement.
Légal
Les outils PNL peuvent rechercher dans les bases de données juridiques la jurisprudence, les lois et les précédents juridiques pertinents, ce qui permet de gagner du temps et d'améliorer la précision de la recherche juridique. De la même manière, ils peuvent améliorer le processus de découverte, en trouvant des modèles et des détails dans des milliers de documents que les humains pourraient manquer.
Vente au détail
Les vendeurs utilisent la PNL pour analyser les sentiments, en examinant les avis et les commentaires des clients sur leur site et sur Internet afin d'identifier les tendances. Certains détaillants ont également commencé à exposer cette analyse aux acheteurs, résumant les réactions des consommateurs à divers attributs de nombreux produits.
Assurance
Les réclamations impliquent souvent une documentation approfondie. La PNL peut extraire des informations pertinentes à partir de rapports de police, de notes médicales à vie et de nombreuses autres sources pour aider les machines et/ou les humains à prendre des décisions plus rapidement et avec plus de précision.
Service client
Fournir un support client coûte cher, et les entreprises ont déployé des chatbots, des arborescences téléphoniques à réponse vocale et d'autres outils NLP depuis des décennies pour réduire le volume d'entrées que le personnel doit gérer directement. L’IA générative, qui peut s’appuyer à la fois sur les LLM et sur des ajustements spécifiques à l’entreprise, les a rendus beaucoup plus utiles. Les robots basés sur la PNL d'aujourd'hui peuvent souvent comprendre les nuances des questions des clients, donner des réponses plus spécifiques et même s'exprimer sur un ton personnalisé en fonction de la marque qu'ils représentent.
Avantages du traitement du langage naturel
La PNL a un large éventail d’applications qui améliorent considérablement notre vie quotidienne et nos interactions avec la technologie, notamment :
- Recherche dans les données : presque tous les moteurs de recherche, de Google au catalogue de votre bibliothèque locale, utilisent la PNL pour trouver le contenu qui répond à votre intention. Sans cela, les résultats se limiteraient à correspondre exactement à ce que vous avez tapé.
- Accessibilité : la PNL est à la base de la façon dont les ordinateurs peuvent lire des choses à haute voix pour les personnes malvoyantes ou convertir la parole pour les malentendants.
- Traduction au quotidien : des services de traduction instantanés, gratuits et de haute qualité ont rendu l'information mondiale plus accessible. Il ne s'agit pas seulement de texte à texte : les technologies de traduction visuelle et audio vous permettent de comprendre ce que vous voyez et entendez, même si vous ne savez pas écrire la langue.
- Communication améliorée : Grammarly est un excellent exemple de la façon dont la PNL peut améliorer la clarté de l’écriture. En fournissant des suggestions contextuellement pertinentes, Grammarly aide les écrivains à choisir des mots qui transmettent mieux le sens qu'ils veulent donner. De plus, si un écrivain rencontre des difficultés à écrire, les capacités d'IA de Grammarly peuvent l'aider à démarrer en lui proposant des invites ou des idées pour commencer son écriture.
Les défis du traitement du langage naturel
Bien que la PNL offre de nombreux avantages, elle présente également plusieurs défis importants qui doivent être relevés, notamment :
- Biais et équité : les modèles d'IA ne savent pas intrinsèquement ce qui est bien ou mal, et leurs données d'entraînement contiennent souvent des biais historiques (et actuels) qui influencent leurs résultats.
- Confidentialité et sécurité : les chatbots et autres générations d’IA sont connus pour divulguer des informations personnelles. La PNL permet aux ordinateurs de traiter et de compiler très facilement des données sensibles. Les risques de vol et même de distribution involontaire sont élevés.
- Loin d’être parfait : la PNL se trompe souvent, surtout avec la parole. La plupart des systèmes de PNL ne vous indiquent pas à quel point ils sont sûrs de leurs suppositions. Par conséquent, dans les cas où l'exactitude est importante, assurez-vous de faire examiner par une personne bien informée toutes les traductions, transcriptions, etc.
- Langues à longue traîne : la part du lion des recherches en PNL a été effectuée sur l'anglais, et une grande partie du reste a été réalisée dans le contexte de la traduction plutôt que de l'analyse au sein de la langue. Il existe plusieurs obstacles à l'amélioration de la PNL non anglaise, notamment la recherche de suffisamment de données de formation.
- Deepfakes et autres utilisations abusives : alors que les humains falsifient des documents depuis le début de l'écriture, les progrès de la PNL facilitent grandement la création de faux contenus et évitent leur détection. En particulier, les contrefaçons peuvent être hautement personnalisées en fonction du contexte et du style d'écriture d'un individu.
L'avenir du traitement du langage naturel
Prédire l’avenir de l’IA est une tâche notoirement difficile, mais voici quelques pistes à surveiller :
- Personnalisation : les modèles regrouperont des informations sur vous pour mieux comprendre votre contexte, vos préférences et vos besoins. Un aspect délicat de cette démarche sera le respect des lois sur la confidentialité et des préférences individuelles. Pour garantir la sécurité de vos données, utilisez uniquement des outils engagés en faveur d’une innovation responsable et du développement de l’IA.
- Multilingue : au-delà de la traduction, de nouvelles techniques aideront les modèles d’IA à fonctionner dans plusieurs langues avec des compétences plus ou moins égales.
- Multimodalité : les dernières innovations en matière d'IA peuvent simultanément recevoir des entrées sous plusieurs formes : texte, vidéo, audio et image. Cela signifie que vous pouvez parler d'une image ou d'une vidéo et que le modèle comprendra ce que vous dites dans le contexte médiatique.
- Traitement Edge plus rapide : le « Edge », dans ce cas, fait référence aux appareils plutôt qu'au cloud. De nouvelles puces et logiciels permettront aux téléphones et aux ordinateurs de traiter le langage sans envoyer de données à un serveur. Ce traitement local est à la fois plus rapide et plus sécurisé. Grammarly fait partie de cette nouvelle voie passionnante, notre équipe travaillant déjà sur le traitement de l'IA au niveau des appareils sur Gemini Nano de Google.
Conclusion
En résumé, la PNL est un domaine vital et en évolution dans l’IA et la linguistique informatique qui permet aux ordinateurs de comprendre et de générer le langage humain. La PNL a transformé les applications de traitement de texte, de reconnaissance vocale, de traduction et d'analyse des sentiments en abordant des complexités telles que le contexte et la variabilité. Malgré des défis tels que les préjugés, la confidentialité et l'exactitude, l'avenir de la PNL promet des progrès en matière de personnalisation, de capacités multilingues et de traitement multimodal, renforçant ainsi son impact sur la technologie et diverses industries.