En lingüística, uno de los retos más antiguos ha sido y es reconstruir las palabras de los protolenguajes, es decir, las lenguas originarias de un mismo grupo, a partir de las cuales evolucionaron los idiomas modernos. Una vía es la información sobre los sonidos y las palabras que aparecen en los idiomas actuales. Científicos de centros canadienses y estadounidenses han desarrollado un sistema estadístico automático para reconstruir esos protolenguajes capturando los cambios de sonido en los fonemas (las unidades básicas fonológicas), con sensibilidad al contexto en el que se producen, con un transductor probabilístico. El sistema ha servido además para contrastar la hipótesis de «carga funcional».
Un nuevo método estadístico que reconstruye el origen de lenguas modernas a partir de cambios en fonemas se ensaya para las lenguas austronesias y la hipótesis de carga funcional.
Los autores han reproducido un conjunto de lenguas originarias a partir de una base de datos con más de 142.000 formas de palabras, procedentes de 637 lenguas austronesias –del sudeste de Asia, el Pacífico y parte de Asia continental–. “Identificar las formas de esos idiomas originales permite evaluar la naturaleza de los cambios en el lenguaje y comprender sus inferencias sobre la historia humana”, afirman.
Con este modelo han analizado una antigua hipótesis propuesta por el lingüista Charles Hockett y denominada “carga funcional” (functional load), vigente desde 1955. Esta teoría sostiene que los sonidos más importantes para distinguir las palabras tienen una menor probabilidad de sufrir cambios con el paso del tiempo. “Hemos visto claramente que la mayoría de puntos en los que hay gran probabilidad de fusión entre fonemas, tienen una baja carga funcional, es decir, no son sonidos imprescindibles para el desarrollo de la lengua, lo que prueba la certeza de la hipótesis de la carga funcional”.
A favor de este nuevo modelo de análisis, los investigadores aseguran que el 85% de las reconstrucciones obtenidas son idénticas a las que los lingüistas venían realizando de forma manual en el pasado. “Es poco probable que el sistema automatizado reemplace a las reconstrucciones lingüísticas manuales, sin embargo, sí podría ser de utilidad para grandes reconstrucciones [y] representa un paso adelante en la aplicación de métodos computacionales para la lingüística”, concluyen.
La investigación se publica esta semana en la revista PNAS:
Alexandre Bouchard-Côté, David Hall, Thomas L. Griffiths, Dan Klein. “Automated reconstruction of ancient languages using probabilistic models of sound change”. PNAS. www.pnas.org/cgi/doi/10.1073/pnas.1204678110