Investigaciones | 27 MAR 06

Las computadoras podrían comprender nuestro lenguaje.

Ayudar a las computadoras a acceder al lenguaje de los seres humanos es la tarea del Grupo de Procesamiento de Lenguaje Natural (GPLN) de la Universidad de Córdoba (UNC).

Lenguaje humano para principiantes
Por Leonardo Moledo

El doctor Gabriel Infante López, del Famaf.Entre el inquieto y cambiante lenguaje natural, utilizado a diario por los seres humanos, y las máquinas parece haber una brecha insalvable. Sin embargo, no es tan así. En diferentes lugares del mundo se trabaja activamente para inducir a las computadoras a descifrar los secretos de la sintaxis y la semántica y desentrañar los significados de las complejas oraciones humanas.

Uno de esos lugares es la Universidad Nacional de Córdoba, más precisamente la Facultad de Astronomía, Matemática y Física (Famaf), y aún más precisamente el Grupo de Procesamiento de Lenguaje Natural donde Gabriel Infante López –doctor en Informática, profesor de la Universidad Nacional de Córdoba y uno de los directores del grupo– busca la forma en que las computadoras realicen un análisis sintáctico riguroso y se aproximen a la comprensión del lenguaje humano.

–¿Sabe que no podía encontrar su foto y que casi no puedo hacer este reportaje?

–Bueno, lo podía hacer sin foto.

–No, sin foto, no. Pero al final apareció. Así que cuénteme sobre su tema de investigación.

–Yo trabajo en análisis sintáctico de texto, que significa tratar de que las computadoras entiendan el lenguaje que utilizan las personas. Se intenta disminuir la brecha entre el humano y la computadora, para que por ejemplo las máquinas puedan leer diarios automáticamente y hacer resúmenes.

–¿Pero cómo hace para traducir el lenguaje natural que tiene problemas semánticos...?

–Yo trabajo particularmente en la parte de sintaxis, tratando de descubrir el árbol sintáctico que describe una oración dada. Las técnicas que yo intento desarrollar son las llamadas de “Machine Learning”...

–O sea, de máquinas que van aprendiendo...

–Sí, aprendizaje para tratar de determinar, dada una oración, cuál es la estructura que esa oración tiene, cuál es el sujeto, cuál el predicado, cómo se relacionan...

–En oraciones muy simples, hay máquinas que ya más o menos lo hacen.

–Sí, aunque tampoco es un tema cerrado. Para el inglés, que es el idioma en el que la tecnología ha evolucionado más, ya se alcanzó un porcentaje de correctitud del 92 por ciento más o menos. Pero para España no hay nada.

–¿Qué es el “porcentaje de correctitud del 92 por ciento”?

–Funciona así: viene un lingüista y hace una anotación sintáctica de una oración. Después uno agarra esa misma oración y se la da a una computadora para que haga el análisis sintáctico. Y la máquina se equivoca sólo el 6 por ciento de las veces (siempre en inglés, la tecnología más evolucionada).

–Bueno, es en la que más se trabaja.

–Sí, porque hay más plata. Para este tipo de investigaciones hace falta mucha plata, porque en general son técnicas supervisadas: hay material anotado por humanos de oraciones sintácticamente correctas, hay lingüistas que deben sentarse y describir la estructura sintáctica de conjuntos de oraciones.

–¿Y hasta dónde se ha llegado en esto? Porque usted proponía que lean el diario y hagan un resumen...

–Y hay muchas herramientas que utilizan este tipo de metodología. Por ejemplo, una nueva metodología es la pregunta-respuesta, que es la idea que está detrás de los buscadores de Internet. Que uno no escriba palabras clave sino una oración, una pregunta y que la computadora devuelva la respuesta y no una página que potencialmente tenga la respuesta.

–Pero para eso tiene que entender la oración...

–Exactamente. Y por eso allí aparece el análisis sintáctico, que es algo así como el primer paso para tratar de entender la semántica y el significado de la oración.

–Ahora, de todas maneras, ¿no hay en el lenguaje natural algo que es intraducible a código computaciona

 

Comentarios

Para ver los comentarios de sus colegas o para expresar su opinión debe ingresar con su cuenta de IntraMed.

CONTENIDOS RELACIONADOS
AAIP RNBD
Términos y condiciones de uso | Política de privacidad | Todos los derechos reservados | Copyright 1997-2024