O que é processamento de linguagem natural?
Publicados: 2024-06-25O que é processo de linguagem natural (PNL)?
O processamento de linguagem natural (PNL) é um campo da inteligência artificial e da linguística computacional que se concentra na interação entre computadores e linguagens humanas (naturais). A PNL envolve o desenvolvimento de algoritmos e modelos que permitem aos computadores compreender, interpretar e gerar a linguagem humana de uma forma significativa e útil.
A PNL pode ser amplamente dividida em duas categorias principais:
- Compreensão da linguagem natural (NLU)
- Geração de linguagem natural (NLG)
Esses processos distinguem as linguagens naturais e humanas das linguagens de computador ou de programação, concentrando-se nas nuances, no contexto e na variabilidade da comunicação humana.
Compreensão da linguagem natural (NLU)
A compreensão da linguagem natural é como a IA dá sentido ao texto ou à fala. A palavra “compreender” é um pouco imprópria porque os computadores não entendem nada inerentemente; em vez disso, eles podem processar entradas de uma forma que leve a resultados que façam sentido para os humanos.
A linguagem é notoriamente difícil de descrever completamente. Mesmo que você consiga documentar todas as palavras e regras da versão padrão de qualquer idioma, existem complicações como dialetos, gírias, sarcasmo, contexto e como essas coisas mudam com o tempo.
Uma abordagem de codificação baseada em lógica desmorona rapidamente diante dessa complexidade. Ao longo das décadas, os cientistas da computação desenvolveram métodos estatísticos para a IA compreender o texto na busca cada vez mais precisa de compreender o que as pessoas estão dizendo.
Geração de linguagem natural (NLG)
Recentemente, a capacidade dos computadores de criar linguagem está recebendo muito mais atenção. Na verdade, a parte textual da IA generativa é uma forma de geração de linguagem natural.
O NLG de hoje é essencialmente um jogo de adivinhação muito sofisticado. Em vez de compreender inerentemente as regras gramaticais, os modelos generativos de IA emitem texto, uma palavra por vez, por meio de modelos probabilísticos que consideram o contexto de sua resposta. Como os grandes modelos de linguagem (LLMs) atuais foram treinados em uma grande quantidade de texto, seu resultado geralmente é percebido como uma boa fala humana, mesmo que às vezes o conteúdo esteja incorreto. (Mais sobre isso mais tarde.)
Como funciona o processamento de linguagem natural?
O processamento de linguagem natural (PNL) envolve várias etapas para analisar e compreender a linguagem humana. Aqui está uma análise das principais etapas:
Análise lexical
Primeiro, a entrada é dividida em pedaços menores chamadostokens. Os tokens podem ser palavras individuais, partes de palavras ou frases curtas.
Por exemplo, “cozido” pode tornar-se dois símbolos, “cozinhar” e “ed”, para capturar o significado e o tempo verbal do verbo separadamente, enquanto “cachorro-quente” pode ser um símbolo porque as duas palavras juntas têm um significado distinto.
Análise sintática
Esta etapa concentra-se na estrutura dos tokens, enquadrando-os em uma estrutura gramatical.
Por exemplo, na frase “Pat cozinhou um cachorro-quente para todos”, o modelo identifica “cozido” como o verbo no pretérito, “cachorro-quente” como sujeito direto e “todos” como sujeito indireto.
Análise semântica
A semântica envolve a compreensão do significado das palavras. Este processo ajuda o modelo a reconhecer a intenção do falante, especialmente quando uma palavra ou frase pode ser interpretada de forma diferente.
Na frase de exemplo, como o sujeito indireto indica várias pessoas, é improvável que Pat tenha cozinhado um único cachorro-quente, então o modelo entenderia o significado como “um cachorro-quente por pessoa”.
Reconhecimento de Entidade Nomeada (NER)
Os nomes têm propriedades especiais dentro dos idiomas. Quer sejam treinados implícita ou explicitamente, os modelos de IA criam longas listas dentro de muitas categorias, que vão desde nomes de cadeias de fast-food até meses do ano.
O NER identifica-os a partir de tokens únicos ou múltiplos para melhorar a sua compreensão do contexto. No caso de “Pat”, um dado digno de nota é que seu gênero implícito é ambíguo.
Outro aspecto do NER é que ele ajuda os mecanismos de tradução a evitar serem excessivamente ansiosos. Datas e nomes de países deveriam ser traduzidos, mas nomes de pessoas e empresas geralmente não deveriam ser. (Pat, o nome, não deve ser traduzido literalmente como bater suavemente com a mão aberta.)
Análise pragmática
Esta fase considera se deve seguir o significado literal das palavras ou se existem fatores como expressões idiomáticas, sarcasmo ou outras implicações práticas.
Na frase de exemplo, “todos” significa literalmente todas as pessoas no mundo. No entanto, dado o contexto de uma pessoa cozinhando, é extremamente improvável que Pat esteja grelhando e distribuindo oito bilhões de francos. Em vez disso, a IA interpretará a palavra como “todas as pessoas dentro de um determinado conjunto”.
Integração do discurso
Este estágio explica como o significado é transmitido ao longo de toda uma conversa ou documento. Se a próxima frase for “Ela então tirou uma soneca”, o modelo calcula que “ela” se refere a Pat e, assim, esclarece a ambiguidade de gênero caso ela surja novamente.
Aplicações de processamento de linguagem natural
Aqui estão algumas aplicações principais da PNL:
Processamento de texto
Sempre que um computador interpreta um texto de entrada, a PNL está em ação. Algumas aplicações específicas incluem:
- Assistência de redação: ferramentas como Grammarly usam PNL para fornecer feedback em tempo real sobre sua escrita, incluindo verificação ortográfica, correções gramaticais e ajustes de tom. Veja mais sobre como Grammarly usa PNL na próxima seção.
- Análise de sentimento: a PNL permite que os computadores avaliem o tom emocional por trás do texto. Isso é útil para as empresas compreenderem os sentimentos dos clientes em relação a produtos, shows ou serviços, o que pode influenciar as vendas e o engajamento.
- Motores de busca: Ao analisar o significado da sua consulta, eles podem apresentar resultados mesmo que não contenham exatamente o que você digitou. Isso se aplica a pesquisas na web como o Google e outros tipos, como mídias sociais e sites de compras.
- Preenchimento automático: ao comparar o que você já digitou com um grande banco de dados do que outras pessoas (e você) digitaram no passado, a PNL pode apresentar uma ou várias suposições sobre o que deve vir a seguir.
- Classificação: Outro uso comum da PNL é categorizar diferentes entradas. Por exemplo, a PNL pode determinar quais aspectos dos produtos e serviços de uma empresa estão sendo discutidos nas revisões.
Geração de texto
Depois que um modelo de PNL entende o texto que lhe foi fornecido, ele pode reagir. Freqüentemente, a saída também é texto.
- Reescrita: ferramentas como a análise gramatical do texto para sugerir melhorias de clareza, tom e estilo. Grammarly também usa PNL para ajustar a complexidade do texto para o público-alvo, identificar lacunas de contexto, identificar áreas de melhoria e muito mais.
- Resumindo: uma das capacidades mais atraentes da geração atual de IA é reduzir textos grandes à sua essência, seja a transcrição de uma reunião ou um tópico que conhece desde seu treinamento. Isto aproveita a sua capacidade de reter muitas informações na sua memória de curto prazo para que possa olhar para um contexto mais amplo e encontrar padrões.
- Artigos de notícias: às vezes, a IA é usada para obter informações básicas e criar um artigo inteiro. Por exemplo, dadas diversas estatísticas sobre um jogo de beisebol, ele pode escrever uma narrativa que percorre o decorrer do jogo e o desempenho de vários jogadores.
- Engenharia de prompt: Em um meta-uso da IA, a PNL pode gerar um prompt instruindo outra IA. Por exemplo, se você tem uma conta ChatGPT paga e pede para fazer uma foto, ele aumenta seu texto com informações e instruções extras que passa para o modelo de geração de imagens DALL-E.
Processamento de fala
A conversão da linguagem falada em texto apresenta desafios como sotaques, ruído de fundo e variações fonéticas. A PNL melhora significativamente esse processo usando informações contextuais e semânticas para tornar as transcrições mais precisas.
- Transcrição ao vivo: em plataformas como Zoom ou Google Meet, a PNL permite transcrições em tempo real para ajustar o texto anterior com base no novo contexto da fala em andamento.Também ajuda a segmentar a fala em palavras distintas.
- Sistemas interativos de resposta de voz (IVR): Os sistemas telefônicos normalmente usados pelas operações de atendimento ao cliente de grandes empresas usam PNL para entender o que você está pedindo ajuda.
Tradução de idiomas
A PNL é crucial para traduzir textos entre idiomas, atendendo tanto usuários casuais quanto tradutores profissionais. Aqui estão alguns pontos-chave:
- Uso diário: a PNL ajuda as pessoas a navegar, conversar, estudar e viajar em diferentes idiomas, fornecendo traduções precisas.
- Uso profissional: Os tradutores costumam usar tradução automática para rascunhos iniciais, refinando-os com seu conhecimento linguístico.Plataformas especializadas oferecem memórias de tradução para manter uma terminologia consistente em áreas específicas, como medicina ou direito.
- Melhorar a precisão da tradução: Fornecer mais contexto, como frases completas ou parágrafos, pode ajudar os modelos de PNL a produzir traduções mais precisas do que frases curtas ou palavras isoladas.
Uma breve história da PNL
A história da PNL pode ser dividida em três eras principais: a abordagem baseada em regras, a era dos métodos estatísticos e a revolução do aprendizado profundo. Cada época trouxe mudanças transformadoras para o campo.
Abordagem baseada em regras (década de 1950)
Os primeiros programas de PNL, iniciados na década de 1950, baseavam-se em regras codificadas. Esses programas funcionaram bem para gramática simples, mas logo revelaram os desafios de construir regras abrangentes para uma língua inteira. A complexidade do tom e do contexto da linguagem humana tornou esta abordagem trabalhosa e insuficiente.
Métodos estatísticos (década de 1980)
Na década de 1980, os cientistas da computação começaram a desenvolver modelos que usavam métodos estatísticos para encontrar padrões em grandes corpora de texto. Esta abordagem aproveitou a probabilidade em vez de regras para avaliar os insumos e gerar resultados, e provou ser mais precisa, flexível e prática. Durante três décadas, os avanços na PNL foram em grande parte impulsionados por melhorias incrementais no poder de processamento e no tamanho dos conjuntos de dados de treinamento.
Aprendizado profundo (meados de 2010 até o presente)
Desde meados da década de 2010, o aprendizado profundo revolucionou a PNL. As técnicas modernas de aprendizagem profunda permitem que os computadores compreendam, gerem e traduzam a linguagem humana com notável precisão – muitas vezes superando o desempenho humano em tarefas específicas.
Dois grandes avanços impulsionaram esse progresso:
- Vastos dados de treinamento: Os pesquisadores aproveitaram os extensos dados gerados pela Internet.Por exemplo, modelos como o GPT-4 são treinados em texto equivalente a mais de um milhão de livros. Da mesma forma, o Google Translate depende de um enorme corpus de conteúdo de tradução paralela.
- Redes neurais avançadas: Novas abordagens aprimoraram as redes neurais, permitindo-lhes avaliar holisticamente peças maiores de entrada.Inicialmente, redes neurais recorrentes e tecnologias relacionadas poderiam lidar com frases ou parágrafos curtos. A arquitetura transformadora atual, utilizando uma técnica chamada atenção, pode processar vários parágrafos ou até páginas inteiras. Este contexto expandido melhora a probabilidade de compreender corretamente o significado, bem como a compreensão humana.
Como Grammarly usa processamento de linguagem natural
Grammarly usa uma combinação de sistemas baseados em regras e modelos de aprendizado de máquina para auxiliar os escritores. Os métodos baseados em regras concentram-se em erros mais objetivos, como ortografia e gramática. Para tarefas de discrição, como tom e estilo, ele usa modelos de aprendizado de máquina. Esses dois tipos geralmente trabalham juntos, com um sistema chamado Gandalf (como em “Você não pode passar”) determinando quais sugestões apresentar aos usuários. Alice Kaiser-Schatzlein, linguista analítica da Grammarly, explica: “A avaliação baseada em regras está principalmente no domínio da correção, enquanto os modelos tendem a ser usados para os tipos de mudanças mais subjetivos”.
O feedback dos usuários, tanto agregado quanto individual, constitui uma fonte de dados crucial para melhorar os modelos do Grammarly. Gunnar Lund, outro linguista analítico, explica: “Personalizamos sugestões de acordo com o que as pessoas aceitaram ou rejeitaram no passado”. Esse feedback é desidentificado e usado de forma holística para refinar e desenvolver novos recursos, garantindo que a ferramenta se adapte a vários estilos de escrita, mantendo a privacidade.
A força do Grammarly reside em fornecer assistência imediata e de alta qualidade em diferentes plataformas. Como observa Lund, a interface do produto é uma parte importante para tornar o poder da IA acessível: “Grammarly tem assistência imediata… entregando PNL em uma interface de usuário rápida e fácil de usar”. Essa acessibilidade e capacidade de resposta beneficiam todos que escrevem em inglês, especialmente os falantes não nativos de inglês.
O próximo passo é a personalização, além da qual as sugestões que o usuário aceita e rejeita. Como diz Kaiser-Schatzlein: “Queremos que nosso produto produza uma escrita que seja muito mais contextualmente consciente e reflita o gosto pessoal e as expressões do escritor... estamos trabalhando para tentar fazer com que a linguagem soe mais como você”.
Nota do editor: Grammarly leva sua privacidade muito a sério. Ele implementa medidas rigorosas como criptografia e configurações de rede seguras para proteger os dados do usuário. Para mais informações, consulte nossa Política de Privacidade.
Casos de uso da indústria
A PNL está revolucionando as indústrias ao permitir que as máquinas entendam e gerem a linguagem humana. Ele aumenta a eficiência, a precisão e a experiência do usuário em saúde, serviços jurídicos, varejo, seguros e atendimento ao cliente. Aqui estão alguns casos de uso importantes nesses setores.
Assistência médica
O software de transcrição pode melhorar muito a eficiência e a eficácia do tempo limitado de um médico com cada paciente. Em vez de passar grande parte do encontro digitando notas, eles podem contar com um aplicativo para transcrever uma conversa natural com um paciente. Outra camada da PNL pode resumir a conversa e estruturar informações pertinentes, como sintomas, diagnóstico e plano de tratamento.
Jurídico
As ferramentas de PNL podem pesquisar bancos de dados jurídicos em busca de jurisprudência, estatutos e precedentes jurídicos relevantes, economizando tempo e melhorando a precisão na pesquisa jurídica. Da mesma forma, podem melhorar o processo de descoberta, encontrando padrões e detalhes em milhares de documentos que os humanos podem perder.
Varejo
Os vendedores usam a PNL para análise de sentimentos, analisando as avaliações e comentários dos clientes em seus sites e na Internet para identificar tendências. Alguns retalhistas também começaram a expor esta análise aos compradores, resumindo as reacções dos consumidores a vários atributos de muitos produtos.
Seguro
As reclamações geralmente envolvem documentação extensa. A PNL pode extrair informações relevantes de relatórios policiais, anotações médicas de uma vida inteira e muitas outras fontes para ajudar máquinas e/ou humanos a julgar com mais rapidez e precisão.
Atendimento ao Cliente
Fornecer suporte ao cliente é caro, e as empresas implantaram chatbots, árvores telefônicas de resposta de voz e outras ferramentas de PNL por décadas para reduzir o volume de informações que a equipe precisa lidar diretamente. A IA generativa, que pode recorrer tanto a LLMs como a ajustes específicos da empresa, tornou-os muito mais úteis. Os bots atuais baseados em PNL muitas vezes conseguem entender nuances nas perguntas dos clientes, dar respostas mais específicas e até mesmo se expressar em um tom personalizado para a marca que representam.
Benefícios do processamento de linguagem natural
A PNL possui uma ampla gama de aplicações que melhoram significativamente nossa vida diária e nossas interações com a tecnologia, incluindo:
- Pesquisando dados: Quase todos os mecanismos de pesquisa, do Google ao catálogo da sua biblioteca local, usam PNL para encontrar conteúdo que atenda à sua intenção. Sem ele, os resultados seriam limitados a corresponder exatamente ao que você digitou.
- Acessibilidade: A PNL é a base de como os computadores podem ler coisas em voz alta para pessoas com deficiência visual ou converter a palavra falada para pessoas com deficiência auditiva.
- Tradução diária: serviços de tradução instantâneos, gratuitos e de alta qualidade tornaram as informações do mundo mais acessíveis. Não se trata apenas de texto para texto: as tecnologias de tradução visual e de áudio permitem que você entenda o que vê e ouve, mesmo que não saiba escrever o idioma.
- Comunicação melhorada: Grammarly é um excelente exemplo de como a PNL pode aumentar a clareza na escrita. Ao fornecer sugestões contextualmente relevantes, Grammarly ajuda os escritores a escolher palavras que transmitam melhor o significado pretendido. Além disso, se um escritor estiver enfrentando bloqueio de escritor, os recursos de IA do Grammarly podem ajudá-lo a começar, oferecendo instruções ou ideias para começar a escrever.
Desafios do processamento de linguagem natural
Embora a PNL ofereça muitos benefícios, ela também apresenta vários desafios significativos que precisam ser enfrentados, incluindo:
- Viés e justiça: os modelos de IA não sabem inerentemente o que é certo ou errado, e seus dados de treinamento geralmente contêm preconceitos históricos (e atuais) que influenciam seus resultados.
- Privacidade e segurança: Sabe-se que chatbots e outras gerações de IA vazam informações pessoais. A PNL torna muito fácil para os computadores processar e compilar dados confidenciais. Existem altos riscos de roubo e até distribuição não intencional.
- Longe de ser perfeito: a PNL muitas vezes erra, especialmente com a palavra falada. A maioria dos sistemas de PNL não informa o quão confiantes estão em suas suposições; portanto, para casos em que a precisão é importante, certifique-se de ter uma revisão humana bem informada de quaisquer traduções, transcrições, etc.
- Línguas de cauda longa: A maior parte da pesquisa em PNL foi feita em inglês, e muito do restante foi no contexto da tradução, em vez de análise dentro do idioma. Existem várias barreiras para melhorar a PNL em idiomas diferentes do inglês, especialmente para encontrar dados de treinamento suficientes.
- Deepfakes e outros usos indevidos: embora os humanos tenham falsificado documentos desde o início da escrita, os avanços na PNL tornam muito mais fácil a criação de conteúdo falso e evitam a detecção. Em particular, as falsificações podem ser altamente personalizadas de acordo com o contexto e estilo de escrita de um indivíduo.
Futuro do processamento de linguagem natural
Prever o futuro da IA é uma tarefa notoriamente difícil, mas aqui estão algumas orientações a serem observadas:
- Personalização: os modelos agregarão informações sobre você para entender melhor seu contexto, preferências e necessidades. Um aspecto complicado deste esforço será respeitar as leis de privacidade e as preferências individuais. Para garantir que seus dados permaneçam seguros, use apenas ferramentas comprometidas com a inovação responsável e o desenvolvimento de IA.
- Multilíngue: Indo além da tradução, novas técnicas ajudarão os modelos de IA a funcionar em vários idiomas com proficiência mais ou menos igual.
- Multimodalidade: as mais recentes inovações de IA podem receber informações simultaneamente em vários formatos, como texto, vídeo, áudio e imagem. Isso significa que você pode falar sobre uma imagem ou vídeo e o modelo entenderá o que você está dizendo no contexto da mídia.
- Processamento de borda mais rápido: A “borda”, neste caso, refere-se a dispositivos e não à nuvem. Novos chips e software permitirão que telefones e computadores processem linguagem sem enviar e receber dados para um servidor. Este processamento local é mais rápido e seguro. Grammarly faz parte desse novo caminho emocionante, com nossa equipe já trabalhando no processamento de IA em nível de dispositivo no Gemini Nano do Google.
Conclusão
Em resumo, a PNL é um campo vital e avançado em IA e linguística computacional que capacita os computadores a compreender e gerar a linguagem humana. A PNL transformou aplicações em processamento de texto, reconhecimento de fala, tradução e análise de sentimento, abordando complexidades como contexto e variabilidade. Apesar de desafios como preconceito, privacidade e precisão, o futuro da PNL promete avanços na personalização, capacidades multilíngues e processamento multimodal, aumentando o seu impacto na tecnologia e em vários setores.