Casi la mitad de la población mundial habla una de las lenguas indoeuropeas o que pertenecen a esta familia, que incluye idiomas tan diversos como el inglés, el español, el ruso, el kurdo o el persa.
Desde que se descubrió, hace más de dos siglos, que estas lenguas pertenecen a una única familia, los filólogos han procurado reconstruir la primera lengua indoeuropea (el llamado protoindoeuropeo) y establecer un árbol filogenético, cuyas ramas representan la evolución y separación de las lenguas a lo largo del tiempo. La filogenética, desarrollada originalmente para describir la relación entre especies biológicas, es también el modelo más apropiado para describir la relación y el grado de parentesco entre lenguas.
A pesar de numerosos estudios, todavía no existe un consenso sobre el origen del indoeuropeo: ¿dónde se hablaba en tiempos prehistóricos la lengua indoeuropea original? ¿Hace cuánto tiempo surgió este grupo de lenguas? ¿Cómo se propagaron por Eurasia?
Origen en Anatolia o en la estepa póntica
Existen dos hipótesis principales, aparentemente contradictorias. Por un lado, la "hipótesis anatolia" sitúa el origen de los indoeuropeos en Anatolia (en la actual Turquía), en la época neolítica. Según esta teoría, desarrollada por el arqueólogo inglés Colin Renfrew, la propagación de las lenguas indoeuropeas hacia Europa comenzó hace unos 9.000 años, junto con el avance de la agricultura.
Por otro lado, la "hipótesis de la estepa" ubica el punto de partida de las lenguas indoeuropeas más al norte, en la estepa póntica. Según esta teoría, el protoindoeuropeo surgió al norte del mar Negro hace unos 5.000 o 6 000 años; se asocia con la cultura kurgana, conocida por sus túmulos funerarios característicos y la cría de caballos.
Comparación de ADN
Para decidir cuál de estas dos hipótesis es la correcta, se han llevado a cabo estudios genéticos en los que se compara el ADN encontrado en yacimientos prehistóricos con el ADN de la población de hoy en día. Sin embargo, los resultados de este tipo de investigación solo proporcionan indicios indirectos sobre la procedencia de las lenguas indoeuropeas, dado que la lengua no se hereda a través de los genes, a diferencia, por ejemplo, del grupo sanguíneo.
Para superar este problema, un nuevo estudio, publicado en la revista Science, ha abordado la cuestión desde una perspectiva diferente, utilizando datos lingüísticos directos para evaluar las predicciones cronológicas de ambas hipótesis.
En este proyecto, en el que hemos estado involucrados más de 80 lingüistas bajo la dirección de Paul Heggarty y Cormac Anderson del Instituto Max Planck de Antropología Evolucionaria en Leipzig (Alemania), se ha aplicado una nueva metodología que permite obtener resultados más exactos.
Un muestreo más completo
En estudios filogenéticos anteriores, los conjuntos de datos utilizados tenían un muestreo de lenguas más limitado. Además, algunos análisis presuponían que las lenguas modernas se derivan directamente de lenguas antiguas escritas, aunque realmente provienen de variantes orales algo diferentes que se hablaban durante la misma época. Por ejemplo, el antecedente de la lengua española no es el latín clásico que encontramos en las obras de Virgilio, sino el latín popular o vulgar. Estas carencias han distorsionado los cálculos de la antigüedad de los subgrupos de la familia de lenguas indoeuropeas, como por ejemplo las lenguas germánicas, eslavas o romances.
El nuevo estudio aborda estos problemas, eliminando las inconsistencias y utilizando un conjunto de datos más extenso (161 lenguas), ofreciendo, por tanto, un muestreo más completo y equilibrado. A estos datos se aplicó un análisis filogenético bayesiano, método estadístico que permite establecer las relaciones de parentesco más probables entre las lenguas y las ramas del árbol genealógico.
Así se mostró, por ejemplo, que no se debería hablar de una familia italo-celta, ya que las lenguas itálicas y celtas se separaron varios siglos antes de la separación de las lenguas germánicas y celtas, que se produjo hace unos 5.000 años.
8.000 años de antigüedad de las lenguas indoeuropeas
En cuanto a la cuestión sobre el origen de las lenguas indoeuropeas, los cálculos basados en los nuevos datos indican que la primera se hablaba hace aproximadamente 8.000 años.
Los resultados de esta investigación no concuerdan completamente ni con la hipótesis de la estepa ni con la hipótesis anatolia, sino que sugieren que la cuna inicial de las lenguas indoeuropeas se encuentra en el sur del Cáucaso, desde donde experimentaron una expansión hacia Grecia y Albania en el oeste, la India en el este y la estepa póntica en el norte.
En un segundo paso, unos tres milenios más tarde, hubo una segunda ola de expansión desde la estepa póntica hacia Europa, dando origen a la gran mayoría de las lenguas que se hablan en Europa hoy en día. Esta hipótesis híbrida, que casa las dos teorías establecidas hasta ahora, también coincide con los resultados de los últimos estudios llevados a cabo en el campo de la genética antropológica.
Además de acercarnos a la solución del enigma centenario del origen de nuestras lenguas, esta investigación ilustra cómo disciplinas tan dispares como la genética y la lingüística se pueden complementar para proporcionar respuestas más fiables a cuestiones de la prehistoria humana. Es de esperar que la misma metodología sirva también, en futuras investigaciones, para ampliar y profundizar nuestro conocimiento de cómo se propagaron las lenguas y las poblaciones en otros continentes.
Kim Schulte, Profesor Titular (lingüística, traducción), Universitat Jaume I.
Este artículo fue publicado originalmente en The Conversation. Lea el original.