Algoritmos para recuperar y descifrar idiomas perdidos.

Por: Redacción

Lectura de 2 minutos

Reading Time: 2 minutes

¿Será posible recuperarlos con el uso de algoritmos?

Todos los idiomas o lenguajes se adaptan al paso del tiempo, pero muchos se han perdido al paso de las civilizaciones. Pero científicos del MIT utilizan algoritmos para intentar recuperarlos.

Algunos de los que se están intentando recuperar coexistieron con el griego y el hebreo, o son incluso más antiguos. 

Las tecnologías actuales parecieran no ser suficientes para descifrarlos. Los traductores automáticos como el de Google, son eficientes para traducir palabras entre dos idiomas que siguen utilizándose.

Por ello, un equipo de investigadores del MIT ha trabajado en un sistema de inteligencia artificial capaz de descifrar lenguajes que ya no se usan, sin necesidad de conocimientos sobre su relación con otros idiomas.

Más allá de la curiosidad.

La profesora Regina Barzilay, líder del equipo, comenta que no es una mera curiosidad académica: cuando se pierde un idioma, se pierde también todo el conjunto de conocimientos sobre las personas que lo hablaron. 

La mayoría de los que han existido ya no se hablan; otros, considerados muertos, están perdidos o no descifrados. No se sabe lo suficiente sobre su gramática, vocabulario o sintaxis para poder comprender los textos. 

Los algoritmos que han diseñado en Laboratorio de Ciencias de la Computación e Inteligencia Artificial del MIT (CSAIL), han sido capaces de descifrar automáticamente un lenguaje perdido utilizando solo unos pocos miles de palabras.

El equipo aplicó su algoritmo al castellano comparándolo con el vasco y con otros candidatos de las familias romance, germánica, turca y urálica.

Los avances de las investigaciones.

Los programadores utilizaron nociones básicas de lingüística clásica y su evolución para entrenar a los algoritmos, así como variaciones de pronunciación.

Una palabra con una p en el idioma principal puede evolucionar a una b en el idioma descendente, pero el cambio a una k es menos probable por lo diferente que suenan ambas letras, explica la profesora Barzilay

Así desarrollaron un sistema capaz de analizar las transformaciones a partir de pocos datos de entrenamiento, lo cual es un aspecto clave porque existen muy pocos datos de los idiomas muertos.

El año pasado, este equipo de científicos consiguió descifrar los idiomas muertos del ugarítico y el lineal B. ¡Este último empezó a utilizarse en torno al 1400 antes de Cristo!

office 2019 home business kaufen

Te Puede Interesar: