Che cos'è l'elaborazione del linguaggio naturale?
Pubblicato: 2024-06-25Cos’è il processo del linguaggio naturale (PNL)?
L'elaborazione del linguaggio naturale (NLP) è un campo dell'intelligenza artificiale e della linguistica computazionale che si concentra sull'interazione tra computer e linguaggi umani (naturali). La PNL prevede lo sviluppo di algoritmi e modelli che consentono ai computer di comprendere, interpretare e generare il linguaggio umano in modo significativo e utile.
La PNL può essere sostanzialmente divisa in due categorie principali:
- Comprensione del linguaggio naturale (NLU)
- Generazione del linguaggio naturale (NLG)
Questi processi distinguono i linguaggi naturali e umani dai linguaggi informatici o di programmazione concentrandosi sulle sfumature, sul contesto e sulla variabilità della comunicazione umana.
Comprensione del linguaggio naturale (NLU)
La comprensione del linguaggio naturale è il modo in cui l’intelligenza artificiale dà senso al testo o al parlato. La parola “comprendere” è un po' impropria perché i computer non capiscono nulla; piuttosto, possono elaborare gli input in un modo che porti a output che abbiano senso per gli esseri umani.
Il linguaggio è notoriamente difficile da descrivere a fondo. Anche se riesci a documentare tutte le parole e le regole della versione standard di una determinata lingua, ci sono complicazioni come dialetti, slang, sarcasmo, contesto e come queste cose cambiano nel tempo.
Un approccio di codifica basato sulla logica fallisce rapidamente di fronte a questa complessità. Nel corso dei decenni, gli informatici hanno sviluppato metodi statistici per consentire all’intelligenza artificiale di comprendere il testo nel tentativo sempre più accurato di comprendere ciò che le persone dicono.
Generazione del linguaggio naturale (NLG)
Recentemente, la capacità dei computer di creare linguaggio sta ricevendo molta più attenzione. In effetti, la parte testuale dell’intelligenza artificiale generativa è una forma di generazione del linguaggio naturale.
L'NLG di oggi è essenzialmente un gioco d'ipotesi molto sofisticato. Invece di comprendere intrinsecamente le regole grammaticali, i modelli di intelligenza artificiale generativa riproducono il testo una parola alla volta attraverso modelli probabilistici che considerano il contesto della loro risposta. Poiché i grandi modelli linguistici (LLM) di oggi sono stati addestrati su così tanto testo, il loro risultato generalmente si presenta come un buon discorso umano, anche se a volte il contenuto è inadeguato. (Ne parleremo più avanti.)
Come funziona l'elaborazione del linguaggio naturale?
L'elaborazione del linguaggio naturale (PNL) prevede diversi passaggi per analizzare e comprendere il linguaggio umano. Ecco la ripartizione delle fasi principali:
Analisi lessicale
Innanzitutto, l'input viene suddiviso in parti più piccole chiamatetoken. I token possono essere singole parole, parti di parole o brevi frasi.
Ad esempio, “cooked” potrebbe diventare due token, “cook” e “ed”, per catturare separatamente il significato e il tempo del verbo, mentre “hot dog” potrebbe essere un token perché le due parole insieme hanno un significato distinto.
Analisi sintattica
Questo passaggio si concentra sulla struttura dei token, inserendoli in un quadro grammaticale.
Ad esempio, nella frase “Pat ha cucinato un hot dog per tutti”, il modello identifica “cooked” come verbo al passato, “hot dog” come soggetto diretto e “everyone” come soggetto indiretto.
Analisi semantica
La semantica implica la comprensione del significato delle parole. Questo processo aiuta il modello a riconoscere l'intento di chi parla, soprattutto quando una parola o una frase può essere interpretata in modo diverso.
Nella frase di esempio, poiché il soggetto indiretto indica più persone, è improbabile che Pat abbia cucinato un singolo hot dog, quindi il modello capirebbe il significato di "un hot dog per persona".
Riconoscimento di entità denominate (NER)
I nomi hanno proprietà speciali all'interno delle lingue. Che siano formati in modo implicito o esplicito, i modelli di intelligenza artificiale costruiscono lunghi elenchi all’interno di molte categorie, che vanno dai nomi delle catene di fast food ai mesi dell’anno.
Il NER li identifica da token singoli o multipli per migliorare la comprensione del contesto. Nel caso di “Pat”, un dato degno di nota è che il suo genere implicito è ambiguo.
Un altro aspetto del NER è che aiuta i motori di traduzione a evitare di essere troppo ansiosi. Le date e i nomi dei paesi dovrebbero essere tradotti, ma i nomi delle persone e delle aziende di solito non dovrebbero esserlo. (Pat, il nome, non dovrebbe essere tradotto letteralmente come picchiettio tenero con la mano aperta.)
Analisi pragmatica
In questa fase si valuta se seguire il significato letterale delle parole o se ci sono fattori come modi di dire, sarcasmo o altre implicazioni pratiche.
Nella frase di esempio, “tutti” significa letteralmente ogni persona nel mondo. Tuttavia, considerato il contesto in cui una persona cucina, è estremamente improbabile che Pat stia grigliando e distribuendo otto miliardi di franchi. Invece, l’intelligenza artificiale interpreterà la parola come “tutte le persone all’interno di un certo insieme”.
Integrazione del discorso
Questa fase spiega come il significato si trasmette attraverso un'intera conversazione o documento. Se la frase successiva è "Allora ha fatto un pisolino", il modello immagina che "lei" si riferisca a Pat e quindi chiarisce l'ambiguità di genere nel caso in cui dovesse ripresentarsi.
Applicazioni dell'elaborazione del linguaggio naturale
Ecco alcune applicazioni chiave della PNL:
Elaborazione del testo
Ogni volta che un computer interpreta il testo immesso, la PNL è al lavoro. Alcune applicazioni specifiche includono:
- Assistenza alla scrittura: strumenti come Grammarly utilizzano la PNL per fornire feedback in tempo reale sulla tua scrittura, inclusi controllo ortografico, correzioni grammaticali e regolazioni del tono. Scopri di più su come Grammarly utilizza la PNL nella sezione successiva.
- Analisi del sentiment: la PNL consente ai computer di valutare il tono emotivo dietro il testo. Ciò è utile alle aziende per comprendere i sentimenti dei clienti nei confronti di prodotti, spettacoli o servizi, che possono influenzare le vendite e il coinvolgimento.
- Motori di ricerca: analizzando il significato della tua query, possono presentare risultati anche se non contengono esattamente ciò che hai digitato. Questo vale per le ricerche web come Google e altri tipi come social media e siti di shopping.
- Completamento automatico: confrontando ciò che hai già digitato con un ampio database di ciò che altre persone (e tu) hanno digitato in passato, la PNL può presentare una o più ipotesi su ciò che dovrebbe accadere dopo.
- Classificazione: un altro uso comune della PNL è la categorizzazione di input diversi. Ad esempio, la PNL può determinare quali aspetti dei prodotti e dei servizi di un'azienda vengono discussi nelle recensioni.
Generazione del testo
Una volta che un modello PNL comprende il testo che gli è stato fornito, può reagire. Spesso l'output è anche testo.
- Riscrittura: strumenti come Grammarly analizzano il testo per suggerire miglioramenti in termini di chiarezza, tono e stile. Grammarly utilizza anche la PNL per adattare la complessità del testo al pubblico di destinazione, individuare lacune nel contesto, identificare aree di miglioramento e altro ancora.
- Riassumendo: una delle capacità più interessanti dell'intelligenza artificiale di oggi è quella di ridurre all'essenza i testi di grandi dimensioni, che si tratti della trascrizione di una riunione o di un argomento che conosce dalla sua formazione. Ciò sfrutta la sua capacità di conservare molte informazioni nella sua memoria a breve termine in modo che possa guardare un contesto più ampio e trovare schemi.
- Articoli di notizie: l'intelligenza artificiale viene talvolta utilizzata per acquisire informazioni di base e creare un intero articolo. Ad esempio, date varie statistiche su una partita di baseball, può scrivere una narrazione che ripercorre il corso della partita e le prestazioni dei vari giocatori.
- Ingegneria dei prompt: in un metauso dell'intelligenza artificiale, la PNL può generare un prompt che istruisce un'altra intelligenza artificiale. Ad esempio, se hai un account ChatGPT a pagamento e gli chiedi di creare un'immagine, arricchisce il tuo testo con informazioni e istruzioni aggiuntive che passa al modello di generazione di immagini DALL-E.
Elaborazione del parlato
La conversione della lingua parlata in testo introduce sfide come accenti, rumore di fondo e variazioni fonetiche. La PNL migliora significativamente questo processo utilizzando informazioni contestuali e semantiche per rendere le trascrizioni più accurate.
- Trascrizione in tempo reale: in piattaforme come Zoom o Google Meet, la PNL consente trascrizioni in tempo reale per adattare il testo passato in base al nuovo contesto del discorso in corso.Aiuta anche a segmentare il discorso in parole distinte.
- Sistemi di risposta vocale interattiva (IVR): i sistemi telefonici tipicamente utilizzati dalle operazioni di servizio clienti delle grandi aziende utilizzano la PNL per capire per cosa stai chiedendo aiuto.
Traduzione linguistica
La PNL è fondamentale per la traduzione di testi tra lingue, al servizio sia degli utenti occasionali che dei traduttori professionisti. Ecco alcuni punti chiave:
- Uso quotidiano: la PNL aiuta le persone a navigare, chattare, studiare e viaggiare utilizzando lingue diverse fornendo traduzioni accurate.
- Uso professionale: i traduttori utilizzano spesso la traduzione automatica per le bozze iniziali, perfezionandole con la loro esperienza linguistica.Piattaforme specializzate offrono memorie di traduzione per mantenere una terminologia coerente per campi specifici come la medicina o il diritto.
- Migliorare l'accuratezza della traduzione: fornire più contesto, come frasi intere o paragrafi, può aiutare i modelli PNL a produrre traduzioni più accurate rispetto a frasi brevi o singole parole.
Breve storia della PNL
La storia della PNL può essere divisa in tre epoche principali: l’approccio basato su regole, l’era dei metodi statistici e la rivoluzione del deep learning. Ogni epoca ha portato cambiamenti trasformativi nel campo.
Approccio basato su regole (anni '50)
I primi programmi di PNL, a partire dagli anni ’50, erano basati su regole codificate. Questi programmi funzionavano bene per la grammatica semplice, ma presto rivelarono le sfide legate alla creazione di regole complete per un'intera lingua. La complessità del tono e del contesto nel linguaggio umano ha reso questo approccio laborioso e insufficiente.
Metodi statistici (anni '80)
Negli anni '80, gli informatici iniziarono a sviluppare modelli che utilizzavano metodi statistici per trovare modelli in corpora di testo di grandi dimensioni. Questo approccio ha sfruttato la probabilità piuttosto che le regole per valutare gli input e generare output e si è rivelato più accurato, flessibile e pratico. Per tre decenni, i progressi nella PNL sono stati in gran parte guidati da miglioramenti incrementali nella potenza di elaborazione e nella dimensione dei set di dati di addestramento.
Apprendimento profondo (dalla metà degli anni 2010 a oggi)
Dalla metà degli anni 2010, il deep learning ha rivoluzionato la PNL. Le moderne tecniche di deep learning consentono ai computer di comprendere, generare e tradurre il linguaggio umano con notevole precisione, spesso superando le prestazioni umane in compiti specifici.
Due importanti progressi hanno guidato questo progresso:
- Vasti dati di formazione: i ricercatori hanno sfruttato i vasti dati generati da Internet.Ad esempio, modelli come GPT-4 vengono addestrati su testo equivalente a più di un milione di libri. Allo stesso modo, Google Translate si basa su un enorme corpus di contenuti di traduzione parallela.
- Reti neurali avanzate: nuovi approcci hanno migliorato le reti neurali, consentendo loro di valutare in modo olistico porzioni più grandi di input.Inizialmente, le reti neurali ricorrenti e le tecnologie correlate potevano gestire frasi o brevi paragrafi. L'architettura trasformatrice odierna, utilizzando una tecnica chiamata attenzione, può elaborare più paragrafi o addirittura intere pagine. Questo contesto ampliato migliora la probabilità di cogliere correttamente il significato, proprio come la comprensione umana.
Come Grammarly utilizza l'elaborazione del linguaggio naturale
Grammarly utilizza un mix di sistemi basati su regole e modelli di apprendimento automatico per assistere gli scrittori. I metodi basati su regole si concentrano su errori più oggettivi, come l'ortografia e la grammatica. Per questioni di discrezione come tono e stile, utilizza modelli di apprendimento automatico. Questi due tipi spesso lavorano insieme, con un sistema chiamato Gandalf (come in "Non puoi passare") che determina quali suggerimenti presentare agli utenti. Alice Kaiser-Schatzlein, linguista analitica presso Grammarly, spiega: "La valutazione basata su regole rientra principalmente nel regno della correttezza, mentre i modelli tendono ad essere utilizzati per i tipi di cambiamenti più soggettivi".
Il feedback degli utenti, sia aggregato che individuale, costituisce una fonte di dati cruciale per migliorare i modelli di Grammarly. Gunnar Lund, un altro linguista analitico, spiega: “Personalizziamo i suggerimenti in base a ciò che le persone hanno accettato o rifiutato in passato”. Questo feedback viene deidentificato e utilizzato in modo olistico per perfezionare e sviluppare nuove funzionalità, garantendo che lo strumento si adatti a vari stili di scrittura mantenendo la privacy.
La forza di Grammarly sta nel fornire assistenza immediata e di alta qualità su diverse piattaforme. Come osserva Lund, l'interfaccia del prodotto è una parte importante per rendere accessibile la potenza dell'intelligenza artificiale: "Grammarly offre assistenza immediata... offrendo la PNL in un'interfaccia utente rapida e facile da usare." Questa accessibilità e reattività avvantaggiano tutti coloro che scrivono in inglese, in particolare i non madrelingua inglesi.
Il passo successivo è la personalizzazione, oltre i suggerimenti che un utente accetta e rifiuta. Come afferma Kaiser-Schatzlein, "Vogliamo che il nostro prodotto produca una scrittura che sia molto più consapevole del contesto e rifletta il gusto personale e le espressioni dello scrittore... stiamo lavorando per cercare di rendere la lingua più simile a te."
Nota dell'editore: Grammarly prende molto sul serio la tua privacy. Implementa misure rigorose come la crittografia e configurazioni di rete sicure per proteggere i dati degli utenti. Per ulteriori informazioni, consultare la nostra Informativa sulla privacy.
Casi d'uso nel settore
La PNL sta rivoluzionando le industrie consentendo alle macchine di comprendere e generare il linguaggio umano. Migliora l'efficienza, la precisione e l'esperienza dell'utente nel settore sanitario, dei servizi legali, della vendita al dettaglio, delle assicurazioni e del servizio clienti. Ecco alcuni casi d’uso chiave in questi settori.
Assistenza sanitaria
Il software di trascrizione può migliorare notevolmente l'efficienza e l'efficacia del tempo limitato trascorso da un medico con ciascun paziente. Invece di trascorrere gran parte dell’incontro digitando appunti, possono fare affidamento su un’app per trascrivere una conversazione naturale con un paziente. Un altro livello di PNL può riassumere la conversazione e strutturare informazioni pertinenti come sintomi, diagnosi e piano di trattamento.
Legale
Gli strumenti di PNL possono cercare nei database legali giurisprudenza, statuti e precedenti legali pertinenti, risparmiando tempo e migliorando la precisione nella ricerca legale. Allo stesso modo, possono migliorare il processo di scoperta, trovando modelli e dettagli in migliaia di documenti che gli esseri umani potrebbero non vedere.
Vedere al dettaglio
I venditori utilizzano la PNL per l'analisi del sentiment, esaminando le recensioni e i feedback dei clienti sul loro sito e su Internet per identificare le tendenze. Alcuni rivenditori hanno anche iniziato a esporre questa analisi agli acquirenti, riassumendo le reazioni dei consumatori ai vari attributi di molti prodotti.
Assicurazione
Le richieste spesso comportano un'ampia documentazione. La PNL può estrarre informazioni rilevanti dai rapporti della polizia, da una vita di cartelle cliniche e da molte altre fonti per aiutare le macchine e/o gli esseri umani a giudicare più velocemente e con maggiore precisione.
Assistenza clienti
Fornire assistenza ai clienti è costoso e le aziende hanno implementato per decenni chatbot, alberi telefonici a risposta vocale e altri strumenti di PNL per ridurre il volume di input che il personale deve gestire direttamente. L’intelligenza artificiale generativa, che può attingere sia ai LLM che alla messa a punto specifica dell’azienda, li ha resi molto più utili. Gli odierni bot basati sulla PNL sono spesso in grado di comprendere le sfumature delle domande dei clienti, fornire risposte più specifiche e persino esprimersi con un tono personalizzato in base al marchio che rappresentano.
Vantaggi dell'elaborazione del linguaggio naturale
La PNL ha una vasta gamma di applicazioni che migliorano significativamente la nostra vita quotidiana e le interazioni con la tecnologia, tra cui:
- Ricerca tra i dati: quasi tutti i motori di ricerca, da Google al catalogo della tua biblioteca locale, utilizzano la PNL per trovare contenuti che soddisfino le tue intenzioni. Senza di esso, i risultati si limiterebbero a corrispondere esattamente a ciò che hai digitato.
- Accessibilità: la PNL è il fondamento su cui i computer possono leggere le cose ad alta voce per le persone con problemi di vista o convertire la parola parlata per le persone con problemi di udito.
- Traduzione quotidiana: servizi di traduzione istantanei, gratuiti e di alta qualità hanno reso le informazioni a livello mondiale più accessibili. Non si tratta solo di testo in testo: le tecnologie di traduzione visiva e audio ti consentono di capire ciò che vedi e senti, anche se non sai come scrivere la lingua.
- Comunicazione migliorata: Grammarly è un eccellente esempio di come la PNL può migliorare la chiarezza nella scrittura. Fornendo suggerimenti contestualmente rilevanti, Grammarly aiuta gli scrittori a scegliere le parole che trasmettono meglio il significato previsto. Inoltre, se uno scrittore sta vivendo il blocco dello scrittore, le funzionalità di intelligenza artificiale di Grammarly possono aiutarlo a iniziare offrendo suggerimenti o idee per iniziare a scrivere.
Sfide dell'elaborazione del linguaggio naturale
Sebbene la PNL offra molti vantaggi, presenta anche diverse sfide significative che devono essere affrontate, tra cui:
- Pregiudizi ed equità: i modelli di intelligenza artificiale non sanno intrinsecamente cosa è giusto o sbagliato e i loro dati di addestramento spesso contengono pregiudizi storici (e attuali) che influenzano il loro risultato.
- Privacy e sicurezza: è noto che i chatbot e altre IA di generazione trapelano informazioni personali. La PNL rende molto semplice per i computer elaborare e compilare dati sensibili. I rischi di furto e perfino di distribuzione involontaria sono elevati.
- Lungi dall'essere perfetto: la PNL spesso sbaglia, soprattutto con la parola parlata. La maggior parte dei sistemi PNL non ti dice quanto sono sicuri delle loro ipotesi, quindi nei casi in cui la precisione è importante, assicurati di avere una persona ben informata che revisioni eventuali traduzioni, trascrizioni, ecc.
- Lingue a coda lunga: la maggior parte della ricerca sulla PNL è stata fatta sull’inglese, e gran parte del resto è stato nel contesto della traduzione piuttosto che nell’analisi all’interno della lingua. Esistono diversi ostacoli al miglioramento della PNL non inglese, in particolare la ricerca di dati di formazione sufficienti.
- Deepfake e altri usi impropri: mentre gli esseri umani hanno falsificato i documenti sin dall’inizio della loro scrittura, i progressi nella PNL rendono molto più semplice creare contenuti falsi ed evitare il rilevamento. In particolare, i falsi possono essere altamente personalizzati in base al contesto e allo stile di scrittura di un individuo.
Il futuro dell'elaborazione del linguaggio naturale
Prevedere il futuro dell’intelligenza artificiale è un compito notoriamente difficile, ma ecco alcune indicazioni a cui prestare attenzione:
- Personalizzazione: i modelli aggregheranno le informazioni su di te per comprendere meglio il contesto, le preferenze e le esigenze. Un aspetto delicato di questa spinta sarà il rispetto delle leggi sulla privacy e delle preferenze individuali. Per garantire che i tuoi dati rimangano al sicuro, utilizza solo strumenti impegnati nell'innovazione responsabile e nello sviluppo dell'intelligenza artificiale.
- Multilingue: andando oltre la traduzione, nuove tecniche aiuteranno i modelli di intelligenza artificiale a funzionare in più lingue con una competenza più o meno uguale.
- Multimodalità: le ultime innovazioni dell’intelligenza artificiale possono ricevere simultaneamente input in più forme tra testo, video, audio e immagini. Ciò significa che puoi parlare di un'immagine o di un video e il modello capirà cosa stai dicendo nel contesto mediatico.
- Elaborazione edge più rapida: il termine “edge”, in questo caso, si riferisce ai dispositivi anziché al cloud. Nuovi chip e software consentiranno a telefoni e computer di elaborare il linguaggio senza inviare dati avanti e indietro a un server. Questa elaborazione locale è più veloce e più sicura. Grammarly fa parte di questo nuovo entusiasmante percorso, con il nostro team che sta già lavorando sull'elaborazione dell'intelligenza artificiale a livello di dispositivo su Gemini Nano di Google.
Conclusione
In sintesi, la PNL è un campo vitale e in progresso nell’intelligenza artificiale e nella linguistica computazionale che consente ai computer di comprendere e generare il linguaggio umano. La PNL ha trasformato le applicazioni nell'elaborazione del testo, nel riconoscimento vocale, nella traduzione e nell'analisi dei sentimenti affrontando complessità come il contesto e la variabilità. Nonostante sfide quali pregiudizi, privacy e accuratezza, il futuro della PNL promette progressi nella personalizzazione, nelle capacità multilingue e nell’elaborazione multimodale, aumentando il suo impatto sulla tecnologia e su vari settori.