¿Qué es el procesamiento del lenguaje natural?
Publicado: 2024-06-25¿Qué es el proceso del lenguaje natural (PNL)?
El procesamiento del lenguaje natural (PNL) es un campo de la inteligencia artificial y la lingüística computacional que se centra en la interacción entre las computadoras y los lenguajes humanos (naturales). La PNL implica el desarrollo de algoritmos y modelos que permiten a las computadoras comprender, interpretar y generar el lenguaje humano de una manera significativa y útil.
La PNL se puede dividir en términos generales en dos categorías principales:
- Comprensión del lenguaje natural (NLU)
- Generación de lenguaje natural (NLG)
Estos procesos distinguen los lenguajes naturales y humanos de los lenguajes informáticos o de programación al centrarse en los matices, el contexto y la variabilidad de la comunicación humana.
Comprensión del lenguaje natural (NLU)
La comprensión del lenguaje natural es la forma en que la IA da sentido al texto o al habla. La palabra "comprender" es un nombre poco apropiado porque las computadoras no entienden nada inherentemente; más bien, pueden procesar entradas de una manera que conduzca a resultados que tengan sentido para los humanos.
El lenguaje es notoriamente difícil de describir en profundidad. Incluso si logras documentar todas las palabras y reglas de la versión estándar de cualquier idioma determinado, existen complicaciones como dialectos, jerga, sarcasmo, contexto y cómo estas cosas cambian con el tiempo.
Un enfoque de codificación basado en la lógica se desmorona rápidamente ante esta complejidad. A lo largo de décadas, los científicos informáticos han desarrollado métodos estadísticos para que la IA comprenda textos en la búsqueda cada vez más precisa de comprender lo que dice la gente.
Generación de lenguaje natural (NLG)
Recientemente, la capacidad de las computadoras para crear lenguaje está recibiendo mucha más atención. De hecho, la parte textual de la IA generativa es una forma de generación de lenguaje natural.
El NLG actual es esencialmente un juego de adivinanzas muy sofisticado. En lugar de comprender inherentemente las reglas gramaticales, los modelos de IA generativa escupen texto palabra por palabra a través de modelos probabilísticos que consideran el contexto de su respuesta. Debido a que los grandes modelos de lenguaje (LLM) actuales se han entrenado con tanto texto, su resultado generalmente parece un buen habla humana, incluso si a veces el contenido no es correcto. (Más sobre eso más adelante).
¿Cómo funciona el procesamiento del lenguaje natural?
El procesamiento del lenguaje natural (PNL) implica varios pasos para analizar y comprender el lenguaje humano. Aquí hay un desglose de las etapas principales:
Análisis léxico
Primero, la entrada se divide en partes más pequeñas llamadastokens. Los tokens pueden ser palabras individuales, partes de palabras o frases cortas.
Por ejemplo, "cocinado" podría convertirse en dos tokens, "cook" y "ed", para capturar el significado y el tiempo del verbo por separado, mientras que "hot dog" podría ser un token porque las dos palabras juntas tienen un significado distinto.
Análisis sintáctico
Este paso se centra en la estructura de los tokens, encajándolos en un marco gramatical.
Por ejemplo, en la oración "Pat cocinó un hot dog para todos", el modelo identifica "cocinado" como el verbo en tiempo pasado, "hot dog" como el sujeto directo y "todos" como el sujeto indirecto.
Análisis semántico
La semántica implica comprender el significado de las palabras. Este proceso ayuda al modelo a reconocer la intención del hablante, especialmente cuando una palabra o frase se puede interpretar de manera diferente.
En la oración de ejemplo, debido a que el sujeto indirecto indica varias personas, es poco probable que Pat haya cocinado un solo hot dog, por lo que el modelo entendería que el significado es "un hot dog por persona".
Reconocimiento de entidad nombrada (NER)
Los nombres tienen propiedades especiales dentro de los idiomas. Ya sea que estén entrenados implícita o explícitamente, los modelos de IA crean largas listas dentro de muchas categorías, que van desde nombres de cadenas de comida rápida hasta meses del año.
NER los identifica a partir de tokens únicos o múltiples para mejorar su comprensión del contexto. En el caso de “Pat”, un dato digno de mención es que su género implícito es ambiguo.
Otro aspecto de NER es que ayuda a los motores de traducción a evitar estar demasiado ansiosos. Las fechas y los nombres de los países deberían traducirse, pero los nombres de personas y empresas normalmente no deberían traducirse. (Pat, el nombre, no debe traducirse literalmente como golpear tiernamente con la mano abierta).
Análisis pragmático
Esta fase considera si se debe seguir el significado literal de las palabras o si hay factores como modismos, sarcasmo u otras implicaciones prácticas.
En la oración de ejemplo, "todos" significa literalmente todas las personas del mundo. Sin embargo, dado el contexto de una sola persona cocinando, es extremadamente improbable que Pat esté asando y distribuyendo ocho mil millones de francos. En cambio, la IA interpretará la palabra como "todas las personas dentro de un determinado conjunto".
Integración del discurso
Esta etapa explica cómo el significado se transmite a lo largo de toda una conversación o documento. Si la siguiente oración es "Ella luego tomó una siesta", el modelo supone que "ella" se refiere a Pat y así aclara la ambigüedad de género en caso de que vuelva a surgir.
Aplicaciones del procesamiento del lenguaje natural
Estas son algunas aplicaciones clave de la PNL:
Procesamiento de texto
Cada vez que una computadora interpreta un texto ingresado, la PNL está en funcionamiento. Algunas aplicaciones específicas incluyen:
- Asistencia de escritura: herramientas como Grammarly utilizan PNL para brindar comentarios en tiempo real sobre su escritura, incluido el corrector ortográfico, las correcciones gramaticales y los ajustes de tono. Vea más sobre cómo Grammarly usa la PNL en la siguiente sección.
- Análisis de sentimientos: la PNL permite a las computadoras evaluar el tono emocional detrás del texto. Esto es útil para que las empresas comprendan los sentimientos de los clientes hacia productos, espectáculos o servicios, que pueden influir en las ventas y el compromiso.
- Motores de búsqueda: al analizar el significado detrás de su consulta, pueden presentar resultados incluso si no contienen exactamente lo que escribió. Esto se aplica a búsquedas web como Google y otros tipos, como redes sociales y sitios de compras.
- Autocompletar: al comparar lo que ya ha escrito con una gran base de datos de lo que otras personas (y usted) han escrito en el pasado, la PNL puede presentar una o varias conjeturas de lo que debería venir a continuación.
- Clasificación: Otro uso común de la PNL es categorizar diferentes entradas. Por ejemplo, la PNL puede determinar qué aspectos de los productos y servicios de una empresa se analizan en las revisiones.
Generación de texto
Una vez que un modelo de PNL comprende el texto que se le ha dado, puede reaccionar. A menudo, el resultado también es texto.
- Reescritura: herramientas como Grammarly analizan el texto para sugerir mejoras de claridad, tono y estilo. Grammarly también utiliza PNL para ajustar la complejidad del texto para el público objetivo, detectar lagunas de contexto, identificar áreas de mejora y más.
- En resumen: una de las capacidades más convincentes de la generación actual de IA es reducir los textos grandes a su esencia, ya sea la transcripción de una reunión o un tema que conoce gracias a su formación. Esto aprovecha su capacidad para retener mucha información en su memoria a corto plazo para poder observar un contexto más amplio y encontrar patrones.
- Artículos de noticias: a veces se utiliza la IA para tomar información básica y crear un artículo completo. Por ejemplo, dadas varias estadísticas sobre un juego de béisbol, puede escribir una narrativa que recorra el transcurso del juego y el desempeño de varios jugadores.
- Ingeniería de avisos: en un metauso de la IA, la PNL puede generar un aviso que instruya a otra IA. Por ejemplo, si tiene una cuenta ChatGPT paga y le pide que haga una imagen, aumenta su texto con información adicional e instrucciones que pasa al modelo de generación de imágenes DALL-E.
Procesamiento del habla
Convertir el lenguaje hablado en texto presenta desafíos como acentos, ruido de fondo y variaciones fonéticas. La PNL mejora significativamente este proceso mediante el uso de información contextual y semántica para hacer que las transcripciones sean más precisas.
- Transcripción en vivo: en plataformas como Zoom o Google Meet, la PNL permite transcripciones en tiempo real para ajustar el texto anterior en función del nuevo contexto del habla en curso.También ayuda a segmentar el habla en palabras distintas.
- Sistemas de respuesta de voz interactiva (IVR): los sistemas telefónicos que suelen utilizar las operaciones de servicio al cliente de las grandes empresas utilizan PNL para comprender con qué está pidiendo ayuda.
Traducción de idiomas
La PNL es crucial para traducir textos entre idiomas y sirve tanto a usuarios ocasionales como a traductores profesionales. Aquí hay algunos puntos clave:
- Uso diario: la PNL ayuda a las personas a navegar, chatear, estudiar y viajar utilizando diferentes idiomas al proporcionar traducciones precisas.
- Uso profesional: los traductores suelen utilizar la traducción automática para los borradores iniciales, perfeccionándolos con su experiencia lingüística.Las plataformas especializadas ofrecen memorias de traducción para mantener una terminología coherente para campos específicos como la medicina o el derecho.
- Mejorar la precisión de la traducción: proporcionar más contexto, como oraciones o párrafos completos, puede ayudar a los modelos de PNL a producir traducciones más precisas que frases cortas o palabras individuales.
Una breve historia de la PNL
La historia de la PNL se puede dividir en tres eras principales: el enfoque basado en reglas, la era de los métodos estadísticos y la revolución del aprendizaje profundo. Cada era trajo cambios transformadores al campo.
Enfoque basado en reglas (década de 1950)
Los primeros programas de PNL, que comenzaron en la década de 1950, se basaban en reglas codificadas. Estos programas funcionaron bien con gramática simple, pero pronto revelaron los desafíos de crear reglas integrales para un idioma completo. La complejidad del tono y el contexto del lenguaje humano hizo que este enfoque fuera laborioso e insuficiente.
Métodos estadísticos (década de 1980)
En la década de 1980, los informáticos comenzaron a desarrollar modelos que utilizaban métodos estadísticos para encontrar patrones en grandes corpus de texto. Este enfoque aprovechó la probabilidad en lugar de las reglas para evaluar los insumos y generar productos, y demostró ser más preciso, flexible y práctico. Durante tres décadas, los avances en PNL fueron impulsados en gran medida por mejoras incrementales en la potencia de procesamiento y el tamaño de los conjuntos de datos de entrenamiento.
Aprendizaje profundo (mediados de la década de 2010 hasta el presente)
Desde mediados de la década de 2010, el aprendizaje profundo ha revolucionado la PNL. Las técnicas modernas de aprendizaje profundo permiten que las computadoras comprendan, generen y traduzcan el lenguaje humano con una precisión notable, superando a menudo el desempeño humano en tareas específicas.
Dos avances importantes han impulsado este progreso:
- Amplios datos de formación: los investigadores han aprovechado la gran cantidad de datos generados por Internet.Por ejemplo, modelos como GPT-4 se entrenan con texto equivalente a más de un millón de libros. De manera similar, Google Translate se basa en un corpus masivo de contenido de traducción paralelo.
- Redes neuronales avanzadas: los nuevos enfoques han mejorado las redes neuronales, lo que les permite evaluar entradas más grandes de manera integral.Inicialmente, las redes neuronales recurrentes y las tecnologías relacionadas podían manejar oraciones o párrafos cortos. La arquitectura transformadora actual, que utiliza una técnica llamada atención, puede procesar varios párrafos o incluso páginas enteras. Este contexto ampliado mejora la probabilidad de captar correctamente el significado, al igual que la comprensión humana.
Cómo utiliza Grammarly el procesamiento del lenguaje natural
Grammarly utiliza una combinación de sistemas basados en reglas y modelos de aprendizaje automático para ayudar a los escritores. Los métodos basados en reglas se centran en errores más objetivos, como la ortografía y la gramática. Para cuestiones de discreción, como tono y estilo, utiliza modelos de aprendizaje automático. Estos dos tipos a menudo trabajan juntos, con un sistema llamado Gandalf (como en "No puedes pasar") que determina qué sugerencias presentar a los usuarios. Alice Kaiser-Schatzlein, lingüista analítica de Grammarly, explica: "La evaluación basada en reglas se realiza principalmente en el ámbito de la corrección, mientras que los modelos tienden a usarse para tipos de cambios más subjetivos".
Los comentarios de los usuarios, tanto agregados como individuales, constituyen una fuente de datos crucial para mejorar los modelos de Grammarly. Gunnar Lund, otro lingüista analítico, explica: "Personalizamos sugerencias según lo que la gente ha aceptado o rechazado en el pasado". Estos comentarios no se identifican y se utilizan de manera integral para refinar y desarrollar nuevas funciones, lo que garantiza que la herramienta se adapte a varios estilos de escritura manteniendo la privacidad.
La fortaleza de Grammarly radica en brindar asistencia inmediata y de alta calidad a través de diferentes plataformas. Como señala Lund, la interfaz del producto es una parte importante para hacer accesible el poder de la IA: "Grammarly tiene asistencia inmediata... brindando PNL en una interfaz de usuario rápida y fácil de usar". Esta accesibilidad y capacidad de respuesta benefician a todos los que escriben en inglés, especialmente a los hablantes no nativos de inglés.
El siguiente paso es la personalización, más allá de las sugerencias que el usuario acepta y rechaza. Como dice Kaiser-Schatzlein: "Queremos que nuestro producto produzca una escritura que sea mucho más consciente del contexto y refleje el gusto y las expresiones personales del escritor... estamos trabajando para intentar que el lenguaje suene más como usted".
Nota del editor: Grammarly se toma muy en serio su privacidad. Implementa medidas estrictas como cifrado y configuraciones de red seguras para proteger los datos del usuario. Para obtener más información, consulte nuestra Política de privacidad.
Casos de uso de la industria
La PNL está revolucionando las industrias al permitir que las máquinas comprendan y generen el lenguaje humano. Mejora la eficiencia, la precisión y la experiencia del usuario en atención médica, servicios legales, comercio minorista, seguros y servicio al cliente. A continuación se presentan algunos casos de uso clave en estos sectores.
Cuidado de la salud
El software de transcripción puede mejorar en gran medida la eficiencia y eficacia del tiempo limitado que un médico dedica a cada paciente. En lugar de pasar gran parte del encuentro escribiendo notas, pueden confiar en una aplicación para transcribir una conversación natural con un paciente. Otra capa de PNL puede resumir la conversación y estructurar la información pertinente, como síntomas, diagnóstico y plan de tratamiento.
Legal
Las herramientas de PNL pueden buscar en bases de datos jurídicas jurisprudencia, estatutos y precedentes legales relevantes, lo que ahorra tiempo y mejora la precisión de la investigación jurídica. De manera similar, pueden mejorar el proceso de descubrimiento, encontrando patrones y detalles en miles de documentos que los humanos podrían pasar por alto.
Minorista
Los vendedores utilizan la PNL para el análisis de sentimientos, analizando las opiniones y comentarios de los clientes en su sitio y en Internet para identificar tendencias. Algunos minoristas también han comenzado a exponer este análisis a los compradores, resumiendo las reacciones de los consumidores ante diversos atributos de muchos productos.
Seguro
Las reclamaciones suelen implicar documentación extensa. La PNL puede extraer información relevante de informes policiales, notas médicas de toda una vida y muchas otras fuentes para ayudar a las máquinas y/o a los humanos a tomar decisiones con mayor rapidez y precisión.
Servicio al Cliente
Brindar atención al cliente es costoso y las empresas han implementado chatbots, cadenas telefónicas de respuesta de voz y otras herramientas de PNL durante décadas para reducir el volumen de información que el personal tiene que manejar directamente. La IA generativa, que puede aprovechar tanto los LLM como los ajustes específicos de la empresa, los ha hecho mucho más útiles. Los robots actuales basados en PNL a menudo pueden comprender los matices de las preguntas de los clientes, dar respuestas más específicas e incluso expresarse en un tono personalizado según la marca que representan.
Beneficios del procesamiento del lenguaje natural
La PNL tiene una amplia gama de aplicaciones que mejoran significativamente nuestra vida diaria y nuestras interacciones con la tecnología, que incluyen:
- Búsqueda a través de datos: casi todos los motores de búsqueda, desde Google hasta el catálogo de su biblioteca local, utilizan PNL para encontrar contenido que cumpla con su intención. Sin él, los resultados se limitarían a coincidir exactamente con lo que usted escribió.
- Accesibilidad: la PNL es la base de cómo las computadoras pueden leer cosas en voz alta para personas con problemas de visión o convertir la palabra hablada para personas con problemas de audición.
- Traducción diaria: los servicios de traducción instantáneos, gratuitos y de alta calidad han hecho que la información mundial sea más accesible. Tampoco se trata sólo de texto a texto: las tecnologías de traducción visual y de audio le permiten comprender lo que ve y oye, incluso si no sabe escribir el idioma.
- Comunicación mejorada: Grammarly es un excelente ejemplo de cómo la PNL puede mejorar la claridad en la escritura. Al proporcionar sugerencias contextualmente relevantes, Grammarly ayuda a los escritores a elegir palabras que transmitan mejor el significado deseado. Además, si un escritor experimenta un bloqueo, las capacidades de inteligencia artificial de Grammarly pueden ayudarlo a comenzar ofreciéndole indicaciones o ideas para comenzar a escribir.
Desafíos del procesamiento del lenguaje natural
Si bien la PNL ofrece muchos beneficios, también presenta varios desafíos importantes que deben abordarse, entre ellos:
- Sesgo y equidad: los modelos de IA no saben inherentemente lo que está bien o mal, y sus datos de entrenamiento a menudo contienen sesgos históricos (y actuales) que influyen en su producción.
- Privacidad y seguridad: Se sabe que los chatbots y otras generaciones de IA filtran información personal. La PNL facilita que las computadoras procesen y recopilen datos confidenciales. Existen altos riesgos de robo e incluso de distribución involuntaria.
- Lejos de ser perfecto: la PNL a menudo se equivoca, especialmente con la palabra hablada. La mayoría de los sistemas de PNL no le dicen qué tan seguros están de sus conjeturas, por lo que, en los casos en los que la precisión es importante, asegúrese de que un ser humano bien informado revise las traducciones, transcripciones, etc.
- Lenguajes de cola larga: la mayor parte de la investigación de PNL se ha realizado en inglés, y gran parte del resto se ha realizado en el contexto de la traducción en lugar de analizar el idioma. Existen varias barreras para mejorar la PNL en idiomas distintos del inglés, especialmente encontrar suficientes datos de capacitación.
- Deepfakes y otros usos indebidos: si bien los humanos han falsificado documentos desde el comienzo de la escritura, los avances en PNL hacen que sea mucho más fácil crear contenido falso y evitar la detección. En particular, las falsificaciones pueden personalizarse en gran medida según el contexto y el estilo de escritura de un individuo.
El futuro del procesamiento del lenguaje natural
Predecir el futuro de la IA es una tarea notoriamente difícil, pero aquí hay algunas direcciones a tener en cuenta:
- Personalización: los modelos agregarán información sobre usted para comprender mejor su contexto, preferencias y necesidades. Un aspecto complicado de este impulso será el respeto de las leyes de privacidad y las preferencias individuales. Para garantizar que sus datos permanezcan seguros, utilice únicamente herramientas comprometidas con la innovación responsable y el desarrollo de la IA.
- Multilingüe: más allá de la traducción, las nuevas técnicas ayudarán a que los modelos de IA funcionen en varios idiomas con un dominio más o menos igual.
- Multimodalidad: las últimas innovaciones en inteligencia artificial pueden recibir simultáneamente información en múltiples formas, a través de texto, video, audio e imagen. Esto significa que puedes hablar sobre una imagen o un video y el modelo entenderá lo que estás diciendo en el contexto de los medios.
- Procesamiento de borde más rápido: el "borde", en este caso, se refiere a dispositivos en lugar de a la nube. Los nuevos chips y software permitirán que los teléfonos y las computadoras procesen el lenguaje sin enviar datos de un lado a otro a un servidor. Este procesamiento local es más rápido y más seguro. Grammarly es parte de este nuevo y emocionante camino, y nuestro equipo ya está trabajando en el procesamiento de IA a nivel de dispositivo en Gemini Nano de Google.
Conclusión
En resumen, la PNL es un campo vital y en progreso en la inteligencia artificial y la lingüística computacional que permite a las computadoras comprender y generar el lenguaje humano. La PNL ha transformado las aplicaciones en el procesamiento de textos, el reconocimiento de voz, la traducción y el análisis de sentimientos al abordar complejidades como el contexto y la variabilidad. A pesar de desafíos como el sesgo, la privacidad y la precisión, el futuro de la PNL promete avances en la personalización, las capacidades multilingües y el procesamiento multimodal, lo que aumentará su impacto en la tecnología y diversas industrias.