¿Encontrado el origen del lenguaje humano? (parte 2)
En la primera parte de este artículo les presenté un paper que pretende demostrar, por medio de análisis estadísticos análogos a los que se usan en la genética de poblaciones, que el lenguaje humano se originó en el sudoeste de África y se expandió desde allí al resto del mundo dejando como rastro de esa expansión un efecto fundador serial, manifestado como una progresiva pérdida de diversidad fonémica desde el origen hacia los extremos. Es decir, muestra que la cantidad de fonemas de las distintas lenguas tiende a disminuir a medida que nos alejamos de África, siendo mínima en las Américas (especialmente en América del Sur) y en algunas islas como Hawaii: precisamente los últimos lugares donde llegó la colonización humana.
Ante una afirmación tan contundente como la del descubrimiento del origen de las lenguas inmediatamente me asaltaron dudas. No estoy capacitado para criticar la técnica estadística empleada, pero hasta donde puedo entenderlas, las correlaciones encontradas no son tan significativas, y las desviaciones permitidas son inmensas. De todas formas, me voy a concentrar en otros aspectos.
En primer lugar, y como todos bien sabemos, correlación no implica causación. Quizá la correlación encontrada es producto de una multitud de factores que incluyen, pero no agotan, el supuesto de la hipótesis. Una falla importante del modelo, si se trata de mostrar causación, es que prescinde totalmente del análisis diacrónico, es decir, la historia, con una sola excepción: el autor mencionó (y descartó correctamente, según parece) la posibilidad de que una ola migratoria humana hubiera repoblado vastas zonas del hemisferio norte luego del último máximo glacial, complicando y distorsionando las observaciones. Fuera de eso, sin embargo, el modelo no toma en cuenta las grandes migraciones y despoblaciones humanas, los episodios de conquista o limpieza étnica, el contacto entre culturas y lenguas, etc.
No parece que haya forma de hacerlo, tampoco. El registro escrito alcanza a pocos miles de años, y la ambición de reconstruir lenguas del pasado con un mínimo de confianza y rigor nos ha llevado, con dificultad, apenas poco más atrás. Investigar la forma de uso real de esas lenguas, la cantidad de personas que la hablaban, sus variaciones fonéticas y dialectales, etc., es considerado prácticamente imposible, al igual que la pretensión de reconstruir la lengua originaria del hombre (todavía hoy el santo grial de ciertas ramas de la pseudolingüística y de la lingüística especulativa).
A nivel lingüístico el modelo es simple quizá en demasía. El material de referencia utilizado, que es el World Atlas of Language Structures (WALS), no diferencia entre poblaciones monolingües y plurilingües, por no hablar de las poblaciones que viven en zonas de continuos dialectales y de las poblaciones “introducidas”, como los hablantes de español en América Central y del Sur, que en la escala de decenas de miles de años asumida por el modelo aparecen en su lugar actual en un abrir y cerrar de ojos (de cero hablantes a 400 millones en apenas 500 años).
Simplificando aún más, ya que diferentes fuentes dan diferentes cifras de consonantes, vocales y tonos, el WALS utiliza rangos numéricos (del tipo “pequeño, moderadamente pequeño, promedio, moderadamente grande, grande”) para cuantificar la diversidad fonémica, con lo cual se recorta considerablemente una información ya difìcil de evaluar. La población que habla cada lengua se considera concentrada en el punto donde se tomó la muestra.
Es importante entender que las lenguas no se comportan como especies animales. Una lengua no evoluciona por selección natural, o al menos eso parece; los cambios lingüísticos parecen responder a una combinación de mutación y deriva al azar con ciertas restricciones que responden a factores físicos y psicológicos, pero que no comprendemos bien. El cambio lingüístico es mucho más rápido que el cambio genético y aunque los cambios se “fijan” con facilidad, casi ninguna lengua se estabiliza en una forma (no hay ningún equivalente a los “fósiles vivientes” como cucarachas, tiburones y tortugas; a lo más, hay unas pocas lenguas marcadamente conservadoras como el islandés).
El paper no exagera la analogía de la difusión lingüística con la expansión de caracteres genéticos. Sin embargo, asume implícitamente que los inventarios de fonemas se comportan como genomas en ciertos aspectos. Pero un genoma está formado de unidades fisicoquímicas discretas de un repertorio muy limitado (cuatro nucleótidos), mientras que un inventario fonémico consta de decenas de unidades (10 como mínimo, más de 100 en algunas lenguas), cada una de las cuales puede ser analizada como combinación de varias características (por ejemplo, la vocal española o puede caracterizarse como vocal posterior media redondeada, mientras que la i es una vocal anterior alta no redondeada). Esta complicación añadida, más la velocidad y facilidad con que se producen cambios, hace que un estudio de diversidad fonémica que no tenga en cuenta siquiera aproximadamente las tendencias históricas (lingüística diacrónica) resulte una simplificación excesiva. Las formas en que un trozo de ADN puede cambiar son limitadas; las formas en que cambia un repertorio de fonemas son multitud.
Para contrarrestar estas críticas, en el estudio se citan fuentes que afirman que “las palabras comunes y algunos fonemas” pueden persistir “durante decenas de milenios”, y que el nivel de diversidad fonémica dentro de una familia lingüística es muy estable. Esto es altamente sospechoso, ya que para períodos anteriores a la invención de la escritura (hace seis mil años) sólo podemos reconstruir sistemas fonémicos aproximadamente, y los registros históricos con que contamos no son tan completos. El misterio se aclara al constatar que una de las fuentes citadas es un paper en el cual se extrapolan ciertas tendencias históricas de los últimos siglos miles de años hacia el pasado, y el otro es uno donde se concluye que el uso del tono lingüístico es estable porque está en cierta medida determinado genéticamente, correlacionándose con los genes involucrados en el desarrollo cerebral ASPM y Microcephalin.
En este trabajo y otros de Atkinson hay múltiples referencias a líneas de investigación que se basan todas en aplicar análisis estadísticos filogenéticos a la lingüística, con el objetivo final de reconstruir relaciones entre lenguas utilizando características comunes, igual que se hace con los genes. Los resultados son impresionantes, pero los métodos utilizados no son necesariamente los adecuados y son proclives a errores impredecibles (por ejemplo, la atracción de ramas largas). Se pueden llegar a ver correlaciones donde no las hay, o interpretar una cosa por otra (por ejemplo, relación genética entre lenguas que no tienen un ancestro común pero se han influenciado entre sí durante mucho tiempo). Los estudios citados suelen ser bastante recientes y quizá no han recibido suficiente atención. Espero con ansiedad que alguien confirme o refute estos hallazgos, que por ahora no parecen ser concluyentes.
Atkinson, Q. (2011). Phonemic Diversity Supports a Serial Founder Effect Model of Language Expansion from Africa Science, 332 (6027), 346-349 DOI: 10.1126/science.1199295
Mh.. El sólo hecho de que el autor no sea un lingüista y esté hablando de lingüística es altamente sospechoso. El estadista puede realizar análisis estadísticos impecables pero los resultados son tan buenos como el modelo utilizado. En este caso parece no ser particularmente bueno… y yo tampoco esperaría que lo fuera viniendo de alguien que no es experto en el tema. Me pregunto si Arkinson no podría haber conseguido un lingüista de colaborador.
El punto radica justamente en que la lingüística ha abandonado la intención de llegar tan lejos atrás en el tiempo. Pero eso es porque (en opinión de la mayoría) intentarlo es inútil por falta de datos y precisión. Atkinson está en los límites extremos de lo que se llama lingüística; no está reconstruyendo una lengua original ni asumiendo nada sobre ella, excepto que su origen es único (monogenismo), lo cual no es implausible. No sé si algún lingüista habrá levantado ese guante, pero ojalá lo haga.
No creo que «ser experto» en el tema sea condición para publicar un paper en «ese tema».
El tema es si el trabajo está bien hecho o no.
Porque la ciencia no puede basarse en expertos como ya sabemos (falacia de autoridad).
En todo caso, los expertos nos dan más «confianza», y esta confianza uno la utiliza para «ahorrarse tiempo» con las indagatorias, porque lamentablemente la vida es corta y no hay tiempo para dudar de todo.
Pero pienso que lo «ideal» sería justamente dudar de todo, de cada palabra emitida hasta por los más ásperos expertos.
Es que justamente ahí está la cuestión. Hay muchos errores que un experto en el tema va a poder resolver que alguien no familiarizado con el tema no va siquiera a tener en cuenta. Y, en realidad, hablar de expertos no es una falacia de autoridad ya que se trata de una autoridad válida. Obviamente sería inválido decir que algo es correcto porque el experto lo dice, pero como tanto en la ciencia como en la vida cotidiana uno no puede saber todo de todo es necesario confiar en la gente. Es un punto muy simple e intuitivo, a quién le vas a creer más para hablarte de lingüística, ¿a un lingüista o a un estadista? Sin saber nada de lingüística ni a vos ni a mí nos es posible realmente saber si el trabajo está bien hecho, por lo que la cuestión del expertizaje (¿es eso una palabra?) comienza a ser relevante.
El problema de «dudar de todo» además de que no hay tiempo en la vida para hacerlo, es que no todos tenemos el conocimiento para hacerlo. Yo no puedo dudar de los consensos que hay en física cuántica porque no tengo el conocimiento necesario para evaluar sus afirmaciones.
Entonces, para resumir, si viene alguien a decirme que encontró el lugar donde se originó el primer lenguaje, más le vale ser un experto en la materia sino quiere que desconfíe de lo que me está diciendo.
Pingback: ¿Encontrado el origen del lenguaje humano? (parte 1) « Círculo Escéptico Argentino