Investigadores de la UNAM realizaron un estudio en el que muestran, por primera vez, la forma en que ha evolucionado la frecuencia del uso de las palabras a lo largo de los tres últimos siglos. Los hallazgos fueron publicados en PLOS ONE, revista científica electrónica de reconocimiento internacional.
Con el uso de herramientas de la física, matemáticas, estadística y de cómputo, Germinal Cocho, Jorge Flores y Carlos Pineda, del Instituto de Física (IF), en colaboración con Carlos Gershenson, del Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas (IIMAS), y Sergio Sánchez, de la Facultad de Ciencias (FC), llevaron a cabo la indagación para seis idiomas distintos: inglés, alemán, español, francés, italiano y ruso.
Carlos Pineda explicó que el propósito del proyecto es el estudio de las variaciones en el lenguaje; para ello, aprovecharon el proceso de escaneo masivo de libros de todo el mundo desde 1508 hasta 2012 (emprendido por Google).
“No sólo tenemos un ‘corte’ en el tiempo de cómo es el lenguaje de hoy, sino cómo se ha modificado. Estudiamos aspectos básicos, pues somos físicos y no lingüistas; vemos cuáles fueron las 100 mil palabras más usadas cada año, a fin de determinar los cambios”.
Lo interesante es que, a pesar de las grandes revoluciones culturales y de que Alemania, por ejemplo, es muy diferente a Latinoamérica, todas las palabras, en los distintos idiomas, “parecen seguir un patrón similar: a mayor uso de una, ésta tiene menor variable de rango, mientras que a menor empleo, su cambio en el rango es mayor. Ese esquema fue nuestro principal hallazgo. Además, logramos modelarlo a partir de un caminante aleatorio”.
Entre los 20 sustantivos más empleados en el año 1700 para el español destacan Dios, rey, cardenal y fe, mismos que en el 2000 fueron sustituidos por vocablos como parte, Estado, años, vida y nacional, entre otras.
El modelo de los universitarios les permitió determinar tres regímenes diferentes: cabeza, es decir, palabras estructurales más comunes; cuerpo, que comprende los vocablos de uso general, aquellos que se requieren para establecer una comunicación entre dos personas o para contar con un conocimiento básico del lenguaje, tal y como lo determinaron los lingüistas y, finalmente, la cola, que comprende términos más especializados.
La idea utilizada para modelar los cambios del rango de las palabras en el tiempo es una caminata aleatoria, en la que se escoge al azar el tamaño del siguiente paso, pero con cierta desviación estándar que indica qué tanto puede variar el paso.
En este caso la desviación estándar (el tamaño del paso) es proporcional al rango. Es decir, mientras más alto el rango (menos uso de una palabra), potencialmente se moverá a más lugares (de manera aleatoria) cada año. Las palabras más usadas (intervalos menores) tienen pasos tan pequeños que en la práctica se mueven poco o nada, tal como sucede en los datos estudiados por los científicos universitarios.
Por ejemplo, el artículo en inglés the, es de bajo rango, pues su uso es frecuente y así se ha mantenido en todos los momentos de la historia; no hay cambios significativos.
“Lo que hicimos fue tomar una ‘rebanada’ en el tiempo para determinar cuántas palabras diferentes estaban en el puesto 1713, por ejemplo; quizá en esa posición podría haber una o dos palabras, o bien, hasta 100. Mientras más pequeño sea el rango inicial, las variaciones son menores, pero entre más alto sea, incrementan porque las palabras cambian con mayor facilidad”, detalló.
“Los lingüistas han estimado que existe un cuerpo de palabras común en todos los idiomas, un conjunto de uso frecuente que posibilita una comunicación básica que va desde las mil 500 a las tres mil palabras. Éste es el primer modelo que lo confirma”, planteó Pineda.
Otra de las aportaciones es la posibilidad de hacer algunas predicciones estadísticas que podrían proporcionar información a los lingüistas.
Por último, el científico Germinal Cocho consideró que en física o en astronomía la Ley de gravitación universal de Newton, que describe la interacción gravitatoria entre distintos cuerpos con masa, “vale para las manzanas y planetas. Sin embargo, en fenómenos biosociales como el lenguaje no existe un factor único, son múltiples detalles que tienen muchos aspectos en común”.
No Comment