30Sep/111

Siameses, mongólicos y esquimales

Chang y Eng Bunker, hermanos siameses

Los hermanos siameses Chang y Eng Bunker.

Hace bastante que no escribo sobre lingüística y quería hacer un ejercicio de divulgación y de escepticismo, en el cual tengo que incluirme. Resulta que, viendo el primer episodio de la excelente serie de documentales Inside the Human Body, de la BBC, surgió de manera prominente el tema de los hermanos siameses. Estos pares de hermanos (o hermanas: las mujeres son un 75% de los casos) son gemelos monocigóticos que se han separado parcialmente en el útero. Aunque técnicamente se denominan gemelos conjugados, se mantiene la designación tradicional de siameses, que proviene de Siam, el nombre de Tailandia hasta 1932. Los siameses en cuestión eran un par de gemelos, Chang y Eng Bunker (1811–1874), unidos por el esternón y con hígados fusionados, y que se hicieron famosos como parte del circo de P. T. Barnum.

Al escuchar la expresión, a mí me pareció que se trataba de un término obsoleto y peyorativo, similar al uso de la palabra mongolismo para designar al síndrome de Down. Resultó que estaba equivocado, aunque no soy el único: aunque los diccionarios no hacen mención de ningún tono despectivo, al menos una agencia de noticias (Canadian Press) decidió hace unos años aconsejar a sus periodistas el uso de términos como “gemelos unidos” o descripciones específicas (“bebés que nacieron unidos por la cadera”). Por otra parte, los gramáticos han adoptado la expresión gemelos siameses para designar pares de palabras o expresiones que forman frases hechas y que se colocan siempre en el mismo orden, como vivito y coleando, arco y flecha, cara o cruz, aquí y ahora, etc. Parece que a casi nadie le parece ofensivo, aunque quizá sea porque se trata de un país remoto y que ni siquiera existe más con ese nombre.

Tipos de asiáticos, según The New Student's Reference Work (Chicago, 1914)

Tipos de asiáticos, según The New Student's Reference Work (Chicago, 1914).

Es distinto el caso de mongolismo y mongólico: aunque también se trata de un remoto país asiático, ni Mongolia ni los mongoles han dejado de existir, pero sobre todo, está claro que ni los mongoles ni ningún otro grupo étnico similar a ellos tienen nada que ver con el síndrome de Down (fuera de que, por supuesto, los mongoles tienen tanta probabilidad de padecer síndrome de Down como cualquier otro pueblo del mundo). Ocurre que quien describió el síndrome, el médico británico John Langdon Down, lo llamó mongolismo (o idiotismo mongoloide) porque observó que los niños con Down tenían rasgos faciales similares a los individuos de la “raza mongola”, en particular la llamada brida mongólica (epicanthus medialis), que es el repliegue del párpado típico (pero no exclusivo) de muchas etnias asiáticas.

Esta clasificación racial fue creada por Johann Friedrich Blumenbach (1752–1840), quien suponía que las diferencias entre razas dependían de la geografía, la nutrición y las costumbres. Blumenbach no era racista y criticaba a los que proponían teorías pseudocientíficas sobre la inferioridad o superioridad de una raza sobre otra, pero adhería a la “teoría de la degeneración”, según la cual Adán y Eva habían sido caucásicos (blancos) y sus descendientes habían cambiado de complexión a causa de factores ambientales. Down consideraba que el síndrome que había descubierto representaba una forma de degeneración, quizá el mismo tipo que el propuesto por Blumenbach, del tipo caucásico al tipo mongólico. Sea como fuere, hoy sabemos que la teoría de la degeneración es falsa y (desde 1959) que el síndrome de Down se origina en un trastorno cromosómico, por lo cual es ofensivo el uso del término mongolismo, que ha sido eliminado paulatinamente de las publicaciones médicas desde entonces.

Esquimal (inuit) con raquetas para nieve

Esquimal (inuit) con raquetas para nieve.

Con los esquimales me pasó algo parecido a con los siameses: por algo que había leído me sonaba peyorativo. Resulta que mucha gente cree que esquimal proviene de un término usado por las tribus algonquinas para referirse a ciertos vecinos suyos y que significa “los que comen carne cruda”. Esta adopción de exónimos despectivos no es poco común: en Argentina todavía hay quienes llaman a los wichi con el nombre mataco, que es de origen quechua y significa “armadillo”, y en ruso los alemanes se llaman nemetskii, que significa “sordomudos”. Pero como en el caso de los siameses, me equivoqué, y no estoy solo: en Canadá y en Groenlandia, a causa de esta supuesta etimología, se conoce a los esquimales con el término que usan para referirse a sí mismos, inuit, a pesar de que en rigor hay otra etnia esquimal, los yupik, además de los inuit, y varios otros nombres regionales (como kalaallit para los groenlandeses). El Concejo Circumpolar Inuit, una ONG que los representa, utiliza tanto inuit como esquimal, ya que, por ejemplo, los yupik de Alaska y de Rusia no aceptan ser llamados inuit. Y el caso es que, a fin de cuentas, no hay mucha evidencia de que esquimal sea un peyorativo: la mayoría de los lingüistas lo dudan, y la teoría preferida es que proviene en realidad de una palabra del lenguaje algonquino montagnais o innu-aimun que se refiere… al encordado de las raquetas para nieve.

Así de curioso es el mundo de las palabras: pensar que gracias a un par de gemelos unidos por el tórax que murieron hace un siglo y medio uno termina aprendiendo un poco de historia del racismo y se libra de dos mitos lingüísticos al precio de uno…

8Ago/111

La pseudolingüística y la búsqueda de parientes perdidos

Mayas y egipcios

¿Egipcio = maya?

Mucha pseudociencia “funciona” a base de encontrar patrones y relaciones ocultas (cuando no ocultadas por alguna oscura conspiración) donde no las hay. Entre ellas está la pseudohistoria, que nos ha dado historias de la Atlántida o de contactos entre antiguos mayas y egipcios, con algún ocasional extraterrestre como añadido de color. Una de las herramientas comunes de la pseudohistoria es la pseudolingüística.

Una forma de pseudolingüística funciona así: se propone que existió un contacto entre dos pueblos que creíamos totalmente separados por la geografía. Esto sirve para “probar”, por ejemplo, la existencia de un continente —hoy desaparecido— que habría comunicado esas dos civilizaciones. Como “evidencia”, se sacan a relucir coincidencias entre los idiomas. Digamos que tenemos dos civilizaciones antiguas, los gatotecas en América y los perrombungas en África. En lengua gatoteca “casa” se dice guchu y en perrombunga se dice kochu. En gatoteca hay una palabra para “ciervo” o “venado” que se pronuncia itsela, y en perrombunga “antílope” se dice etzera. En gatoteca tuichuk significa “sirviente” y en perrombunga “esclavo” se dice wichuduk. En gatoteca “ladrillo de construcción” es sheptu y en perrombumga “guijarro, piedrita” es shapsu. Y así sucesivamente.

Como habrá notado el lector, lo que constituye una coincidencia fonética no está bien definido. Hay palabras que “suenan parecido” pero no hay una regla fija para determinarlo. Y quizá guchu no sea realmente “casa” en gatoteca, sino específicamente “choza de hojas de palma”, y quizá kochu en perrombunga no sea “casa” sino “rey” y sólo por extensión se utilice en el sentido de “gran residencia, palacio”. Quizá en gatoteca itsera signifique “cuerno” en lugar de “ciervo”. Quizá wichuduk en perrombunga no signifique “esclavo” sino que sea el plural de widuk, que significa “miembro de un pueblo conquistado”. Relajar los criterios aumenta la probabilidad de encontrarse con una coincidencia.

La pseudolingüística de Charles William Johnson

Un ejemplo de falta de rigor comparativo lo encontramos en la obra de Charles William Johnson, un académico que logró convencerse de que los mayas y los egipcios estuvieron en contacto, basándose en coincidencias lingüísticas entre las lenguas mesoamericanas y el egipcio antiguo. En uno de sus textos presenta una lista de correspondencias de sonido y significado entre el náhuatl y el egipcio. Para Johnson basta que coincida alguna consonante y quizá alguna vocal (si acaso) para considerar que dos palabras están relacionadas. No hay criterio uniforme: hual se corresponde con uar y huapalli se corresponde con aba; para malakotl encuentra mar, m'katau, m'rkata-t y otras palabras que sólo vagamente tienen un significado parecido. Como muchas veces no queda satisfecho, decide que la l en náhuatl es una conjunción o una “pausa en la búsqueda de palabras” y la elimina cuando le parece conveniente para que la palabra náhuatl se parezca más a la egipcia.

A pesar de haber estudiado idiomas y haber trabajado en México, Johnson parece ignorar que tl en náhuatl no representa un sonido t seguido de un sonido l, sino que es un digrafo con el cual se transcribe el sonido /tɬ/ (la africada lateral alveolar sorda), con lo cual no se puede quitar la l y dejar la t (sería como tomar la ch española y quitarle la h). Peor aún, inventa que la tl final que observa en muchas palabas puede significar “la cosa para…”, cuando es bien sabido que -tl no es más que un sufijo denominado absolutivo, que se coloca a los sustantivos cuando están en singular y sin marcas posesivas. El náhuatl es una lengua viva con un millón y medio de hablantes, por lo cual no hay excusa para esa clase de errores.

Johnson plantea que ignorar estas “coincidencias” es contradecir las leyes de la probabilidad. En un ensayo (en inglés) titulado How likely are chance resemblances between languages?, Mark Rosenfelder demuestra con todo detalle probabilístico cómo es posible, utilizando criterios laxos como el de Johnson, inferir relaciones entre cualquier par de lenguas que uno desee. Incluso con criterios relativamente conservadores a nivel fonético se puede “probar” una relación genética entre el quechua y el hebreo o el chino y el inglés, si por “probar” se entiende “encontrar doscientos o trescientos pares de palabras de uno y otro idioma que tienen un significado relacionado y que suenan parecido”.

El método comparativo

La búsqueda indiscriminada de parecidos entre palabras de idiomas distintos se denomina comparación léxica masiva. Cuando se hace con un mínimo de criterio puede servir como puntapié inicial para una investigación más rigurosa, pero de todas formas la mayoría de los lingüistas no la considera muy fiable.

El método reconocido para discernir parentescos entre lenguas se llama método comparativo y funciona a base de buscar reglas sistemáticas de cambio fonético entre las lenguas en estudio y su antecesora o lengua madre según la hipótesis. Si la lengua madre es conocida por registros históricos el trabajo se simplifica considerablemente, como es lógico (tal es el caso del latín y las lenguas romances que descienden de él). Si no se conoce, se la denomina protolengua y puede ser, en principio, reconstruida en forma aproximada (eso es lo que se hizo con el protogermánico, del cual descienden el inglés y el alemán).

Que los cambios sean sistemáticos significa que las palabras que se supone son coincidentes (cognados) deben diferir entre sí en forma regular. Por ejemplo, podemos suponer que el gatoteca y el perrombunga están relacionadas si encontramos una serie de pares de palabras como ésta:

gatoteca significado perrombunga significado
guchu “casa” kochu “residencia”
gulalam “esposa” koraraa “esposa”
guyep “temor” koyef “susto, mal momento”
ginim “oro” kwenii “oro”
gilaap “abultado” keraaf “abundante”
gaptu “rueda” kwattu “redondo”

Como se ve, las palabras (además de tener significados iguales o razonablemente parecidos) varían en forma sistemática en su consonante inicial: g en gatoteca, k en perrombunga. El lector atento habrá notado otros patrones: las vocales altas en la primera sílaba en gatoteca (u, i) se corresponden con vocales medias en perrombunga (o, e); la l en gatoteca se refleja como r en perrombunga; la p final del gatoteca se corresponde con una f final en perrombunga; la m final en gatoteca se pierde en perrombunga con alargamiento compensatorio de la vocal precedente. (Hay otra más, que les dejo como tarea.) Estas regularidades, obviamente, deben ser confirmadas de la misma manera, y no con unos pocos ejemplos sino con decenas o centenares de palabras. Si se mantienen, y si los dos idiomas se hablan en lugares distintos y no nos consta que los hablantes de uno hayan colonizado a los del otro, es dable suponer que son lenguas emparentadas, que descienden de una misma lengua madre.

Mediante comparaciones sistemáticas e inferencias como éstas se han logrado hazañas como la reconstrucción, con bastante confianza, del protoindoeuropeo, lengua madre de la mayor familia lingüística del mundo, del que no tenemos ningún registro histórico ya que debió haberse hablado, según se calcula, hace unos ocho mil años.

En la vida real, por supuesto, el asunto se complica por una multitud de factores. Pero como primera aproximación, siempre se debe desconfiar de supuestas relaciones entre idiomas que se basen en comparaciones no sistemáticas. Aquí, como en todas las ciencias, es muy fácil engañarse y terminar encontrando, no la cruda verdad, sino lo que uno deseaba.

25May/114

Demoliendo los universales lingüísticos

4 Comentarios    

Publicado por:PabloDF.

Archivado en: Ciencia, Lingüística

ResearchBlogging.orgLas lenguas humanas no sólo consisten en sonidos agrupados, sino que tienen estructura: palabras formadas por raíces, prefijos, sufijos; frases formadas por grupos de palabras; oraciones formadas por frases encadenadas unas a otras. Las estructuras que rigen estos agrupamientos no aparecen al azar. Un paper de Michael Dunn examinó un subgrupo de estas estructuras, correspondientes al orden en que se organizan los componentes de la gramática, y llegó a conclusiones que derriban dos teorías rivales sobre el tema.

En castellano, como todos sabemos, las oraciones suelen tener una estructura Sujeto–Verbo–Objeto (SVO para abreviar). Hay variaciones, por supuesto, pero ése es el “orden dominante”. De la misma manera, el orden dominante entre un sustantivo y un adjetivo es Sust.–Adj. y no al revés. Además usamos preposiciones, es decir, palabras como a, por, para, desde, hacia, que como su mismo nombre lo dice van antes de aquello a lo que gobiernan.

En inglés el orden dominante en las frases nominales es Adjetivo–Sustantivo. Por lo demás el inglés es bastante similar al castellano: SVO, con preposiciones. En japonés, por otro lado, el orden dominante es SOV y las palabras equivalentes a nuestras preposiciones se colocan después y no antes de lo que modifican: postposiciones. En árabe, por contraste, el orden es VSO y los adjetivos siguen a los sustantivos (como en castellano). En castellano las frases genitivas, como los adjetivos, siguen al sustantivo (“el auto de mi padre”, “el objetivo de estas medidas”), mientras que en japonés ambos lo preceden.

Ejemplo de árbol sintáctico en japonés

Ejemplo de árbol sintáctico en japonés (simplificado), como el que describe la frase “Tomodachi no okaasan ga oishii kukkii wo tabesaseta” (“La madre de mi amigo me dio de comer galletitas deliciosas.”) Obsérvese el orden Sujeto-Objeto-Verbo, el uso de postposiciones para marcar sujeto y objeto, y la tendencia de poner los modificadores antes que los núcleos, la cual que hace que el árbol se ramifique hacia la izquierda (la frase literalmente se leería “amigo POSESIVO madre SUJETO deliciosas galletitas OBJETO hizo comer”). El español funciona casi exactamente al revés (con ramificación a la derecha).

Hace algunas décadas el lingüista Joseph Greenberg (1915–2001) recolectó datos de diversas lenguas y observó que casi todas mostraban ciertas correlaciones entre sus características estructurales. Por ejemplo, la mayoría de las lenguas con orden SOV usan postposiciones; en las lenguas VSO se usan preposiciones y el adjetivo sigue al sustantivo; en las lenguas que usan preposiciones las frases posesivas generalmente siguen al sustantivo. Estas correlaciones se consideraron tan robustas que hasta hoy se las conoce como universales lingüísticos (junto con otras características no condicionadas, como la distinción entre sustantivos y verbos).

Greenberg no propuso una explicación para estas correlaciones, limitándose a catalogarlas y establecerlas como hallazgo empírico. Su enfoque se suele caracterizar como funcionalista e implica que estas estructuras lingüísticas existen por variadas razones relacionadas con el uso práctico de la lengua por parte de sus hablantes como forma de interacción social, y con ciertas restricciones que ese uso impone al desarrollo de una lengua.

Noam Chomsky y Joseph Greenberg

Noam Chomsky y Joseph Greenberg

En el extremo opuesto se sitúa Noam Chomsky (1928–), cuya hipótesis formalista o de gramática generativa implica que existe una “gramática universal” con la que todos nacemos, y de la cual se puede generar la gramática de cualquier lengua (Steven Pinker se refirió a esto como “el instinto del lenguaje”). Para Chomsky existe una gramática innata constituida por una serie de módulos, que agrupan características que aparecen siempre juntas (similares a los universales de Greenberg), y un conjunto de parámetros que el cerebro del niño, a medida que se ve inmerso en la lengua de quienes lo rodean, va estableciendo inconscientemente para amoldar su gramática interna al formato particular de la gramática de su lengua materna. Por ejemplo, hay un parámetro que alterna entre head-first y head-last, relacionado con el orden del núcleo de una frase y sus modificadores (por ejemplo, el sustantivo y el adjetivo, o el verbo y sus argumentos —el sujeto y el objeto). Según Chomsky, el cerebro del niño que aprende a hablar activa los parámetros de su gramática de forma que coincidan con los de quienes le hablan; este proceso sencillo explica la rapidez de la adquisición del lenguaje, que sería imposible (según Chomsky) si la mente del infante fuera una tabula rasa y tuviera que comenzar desde cero. También implica que no se pueden separar ciertas características de otras: como interruptores maestros, cada parámetro “enciende” o “apaga” muchas cosas a la vez.

Dunn retomó el trabajo de Greenberg utilizando métodos de la genética de poblaciones para analizar, además de las correlaciones estructurales descubiertas por Greenberg, los parentescos entre las lenguas. Y descubrió que los “universales” de Greenberg no eran tan universales. Las correlaciones se mantuvieron bastante cuando se compararon lenguas emparentadas entre sí, pero se derrumbaron cuando se examinaron lenguas pertenecientes a familias distintas.

Al obviar las relaciones genéticas entre lenguas, Greenberg cometió el gravísimo error estadístico de no contar con las correlaciones entre entidades no independientes. Si todas las lenguas que tienen una característica X también tienen la característica Y, el dato es valioso, pero si además varias de esas lenguas están relacionadas entre sí, es muy posible que esa coincidencia estructural no se deba a la naturaleza intrínseca del lenguaje o a un criterio universal, sino a ese parentesco. Es como si tomáramos diez hijos varones de una persona morena y diez hijas mujeres de una persona de piel muy blanca y concluyéramos que el sexo masculino se correlaciona con la tez oscura y el femenino con la tez clara. Greenberg no era un idiota, desde luego, y no cometió una falla tan extrema, lo cual explica que sus “universales” hayan durado tanto como parte de la ortodoxia lingüística, hasta llegar a ser vistos casi como algo de sentido común.

Una explicación posible es que es difícil encontrar muchas lenguas bien estudiadas (una muestra útil para la comparación detallada que se requiere) y que a la vez no estén relacionadas genéticamente. El estudio de Dunn seleccionó lenguas de cuatro familias, que comprenden más de un tercio de las aproximadamente siete mil lenguas que se hablan hoy. Se eligieron ocho características de orden y se compararon modelos evolutivos con y sin correlación, es decir: para cada par de características se calculó la probabilidad de que las observaciones fueran el resultado de una evolución independiente de esas dos características, y la probabilidad de que, por el contrario, hubieran evolucionado en forma conjunta, teniendo en cuenta cuándo las lenguas comparadas eran de hecho parientes.

Se descubrió que en cada familia lingüística hay pares de características que han evolucionado juntas, pero que esos pares no son los mismos que en las otras familias, es decir, lo que Greenberg tomó como correlaciones universales son correlaciones intrafamiliares, muy probablemente producidas por una ascendencia común y no por tendencias intrínsecas al desarrollo del lenguaje. Esta dispersión también invalida la gramática modular de Chomsky: no parece haber “interruptores maestros”; muchas de las características que Chomsky considera acopladas entre sí —que según él deben estar presentes o ausentes en bloque en cada lengua— en realidad aparecen en forma independiente.

El trabajo de Dunn parece robusto y sus conclusiones no son en absoluto descabelladas. Se le puede reprochar (como ha hecho Mark Liberman en Language Log) que se hayan tomado ocho características de a pares y no en todas las combinaciones posibles, lo cual quizá tenga que ver con el ingente volumen de datos que habría debido procesarse en ese caso. Liberman también opina que existe la posibilidad de que se estén tomando como básicas características que son en realidad derivadas de varios elementos subyacentes (algo similar a considerar características fenotípicas de un organismo, como la altura o el color del pelo, en vez de estudiar los múltiples genes que influyen de forma compleja en la determinación de esas características). Como en otras ocasiones, habrá que esperar que los defensores de las teorías afectadas examinen y critiquen este estudio.

ResearchBlogging.org Dunn, M., Greenhill, S., Levinson, S., & Gray, R. (2011). Evolved structure of language shows lineage-specific trends in word-order universals Nature, 473 (7345), 79-82 DOI: 10.1038/nature09923

6May/114

¿Encontrado el origen del lenguaje humano? (parte 2)

4 Comentarios    

Publicado por:PabloDF.

Archivado en: Ciencia, Evolución, Lingüística

ResearchBlogging.orgEn la primera parte de este artículo les presenté un paper que pretende demostrar, por medio de análisis estadísticos análogos a los que se usan en la genética de poblaciones, que el lenguaje humano se originó en el sudoeste de África y se expandió desde allí al resto del mundo dejando como rastro de esa expansión un efecto fundador serial, manifestado como una progresiva pérdida de diversidad fonémica desde el origen hacia los extremos. Es decir, muestra que la cantidad de fonemas de las distintas lenguas tiende a disminuir a medida que nos alejamos de África, siendo mínima en las Américas (especialmente en América del Sur) y en algunas islas como Hawaii: precisamente los últimos lugares donde llegó la colonización humana.

Diversidad fonémica promedio

Diversidad fonémica promedio (color más claro = mayor diversidad).

Ante una afirmación tan contundente como la del descubrimiento del origen de las lenguas inmediatamente me asaltaron dudas. No estoy capacitado para criticar la técnica estadística empleada, pero hasta donde puedo entenderlas, las correlaciones encontradas no son tan significativas, y las desviaciones permitidas son inmensas. De todas formas, me voy a concentrar en otros aspectos.

En primer lugar, y como todos bien sabemos, correlación no implica causación. Quizá la correlación encontrada es producto de una multitud de factores que incluyen, pero no agotan, el supuesto de la hipótesis. Una falla importante del modelo, si se trata de mostrar causación, es que prescinde totalmente del análisis diacrónico, es decir, la historia, con una sola excepción: el autor mencionó (y descartó correctamente, según parece) la posibilidad de que una ola migratoria humana hubiera repoblado vastas zonas del hemisferio norte luego del último máximo glacial, complicando y distorsionando las observaciones. Fuera de eso, sin embargo, el modelo no toma en cuenta las grandes migraciones y despoblaciones humanas, los episodios de conquista o limpieza étnica, el contacto entre culturas y lenguas, etc.

No parece que haya forma de hacerlo, tampoco. El registro escrito alcanza a pocos miles de años, y la ambición de reconstruir lenguas del pasado con un mínimo de confianza y rigor nos ha llevado, con dificultad, apenas poco más atrás. Investigar la forma de uso real de esas lenguas, la cantidad de personas que la hablaban, sus variaciones fonéticas y dialectales, etc., es considerado prácticamente imposible, al igual que la pretensión de reconstruir la lengua originaria del hombre (todavía hoy el santo grial de ciertas ramas de la pseudolingüística y de la lingüística especulativa).

A nivel lingüístico el modelo es simple quizá en demasía. El material de referencia utilizado, que es el World Atlas of Language Structures (WALS), no diferencia entre poblaciones monolingües y plurilingües, por no hablar de las poblaciones que viven en zonas de continuos dialectales y de las poblaciones “introducidas”, como los hablantes de español en América Central y del Sur, que en la escala de decenas de miles de años asumida por el modelo aparecen en su lugar actual en un abrir y cerrar de ojos (de cero hablantes a 400 millones en apenas 500 años).

Simplificando aún más, ya que diferentes fuentes dan diferentes cifras de consonantes, vocales y tonos, el WALS utiliza rangos numéricos (del tipo “pequeño, moderadamente pequeño, promedio, moderadamente grande, grande”) para cuantificar la diversidad fonémica, con lo cual se recorta considerablemente una información ya difìcil de evaluar. La población que habla cada lengua se considera concentrada en el punto donde se tomó la muestra.

Es importante entender que las lenguas no se comportan como especies animales. Una lengua no evoluciona por selección natural, o al menos eso parece; los cambios lingüísticos parecen responder a una combinación de mutación y deriva al azar con ciertas restricciones que responden a factores físicos y psicológicos, pero que no comprendemos bien. El cambio lingüístico es mucho más rápido que el cambio genético y aunque los cambios se “fijan” con facilidad, casi ninguna lengua se estabiliza en una forma (no hay ningún equivalente a los “fósiles vivientes” como cucarachas, tiburones y tortugas; a lo más, hay unas pocas lenguas marcadamente conservadoras como el islandés).

El número 100 en algunas lenguas indoeuropeas

El número 100 en algunas lenguas indoeuropeas. La posición y longitud de las flechas no es significativa. El asterisco * indica una forma reconstruida (es decir, inferida pero sin registro histórico).

El paper no exagera la analogía de la difusión lingüística con la expansión de caracteres genéticos. Sin embargo, asume implícitamente que los inventarios de fonemas se comportan como genomas en ciertos aspectos. Pero un genoma está formado de unidades fisicoquímicas discretas de un repertorio muy limitado (cuatro nucleótidos), mientras que un inventario fonémico consta de decenas de unidades (10 como mínimo, más de 100 en algunas lenguas), cada una de las cuales puede ser analizada como combinación de varias características (por ejemplo, la vocal española o puede caracterizarse como vocal posterior media redondeada, mientras que la i es una vocal anterior alta no redondeada). Esta complicación añadida, más la velocidad y facilidad con que se producen cambios, hace que un estudio de diversidad fonémica que no tenga en cuenta siquiera aproximadamente las tendencias históricas (lingüística diacrónica) resulte una simplificación excesiva. Las formas en que un trozo de ADN puede cambiar son limitadas; las formas en que cambia un repertorio de fonemas son multitud.

Para contrarrestar estas críticas, en el estudio se citan fuentes que afirman que “las palabras comunes y algunos fonemas” pueden persistir “durante decenas de milenios”, y que el nivel de diversidad fonémica dentro de una familia lingüística es muy estable. Esto es altamente sospechoso, ya que para períodos anteriores a la invención de la escritura (hace seis mil años) sólo podemos reconstruir sistemas fonémicos aproximadamente, y los registros históricos con que contamos no son tan completos. El misterio se aclara al constatar que una de las fuentes citadas es un paper en el cual se extrapolan ciertas tendencias históricas de los últimos siglos miles de años hacia el pasado, y el otro es uno donde se concluye que el uso del tono lingüístico es estable porque está en cierta medida determinado genéticamente, correlacionándose con los genes involucrados en el desarrollo cerebral ASPM y Microcephalin.

En este trabajo y otros de Atkinson hay múltiples referencias a líneas de investigación que se basan todas en aplicar análisis estadísticos filogenéticos a la lingüística, con el objetivo final de reconstruir relaciones entre lenguas utilizando características comunes, igual que se hace con los genes. Los resultados son impresionantes, pero los métodos utilizados no son necesariamente los adecuados y son proclives a errores impredecibles (por ejemplo, la atracción de ramas largas). Se pueden llegar a ver correlaciones donde no las hay, o interpretar una cosa por otra (por ejemplo, relación genética entre lenguas que no tienen un ancestro común pero se han influenciado entre sí durante mucho tiempo). Los estudios citados suelen ser bastante recientes y quizá no han recibido suficiente atención. Espero con ansiedad que alguien confirme o refute estos hallazgos, que por ahora no parecen ser concluyentes.

Atkinson, Q. (2011). Phonemic Diversity Supports a Serial Founder Effect Model of Language Expansion from Africa Science, 332 (6027), 346-349 DOI: 10.1126/science.1199295

4May/1114

¿Encontrado el origen del lenguaje humano? (parte 1)

14 Comentarios    

Publicado por:PabloDF.

Etiquetado con: , , ,

ResearchBlogging.org El 15 de abril fue publicado en Science un paper titulado “La diversidad fonémica apoya un modelo de efecto fundador en serie de la expansión del lenguaje desde África”.* Su abstracto puede traducirse así:

La diversidad genética y fenotípica humana decrece con la distancia desde África, tal como lo predice un efecto fundador en serie en el que sucesivos cuellos de botella demográficos durante la expansión del rango habitado reducen progresivamente la diversidad, lo cual apoya la teoría del origen africano de los humanos modernos. Aquí demuestro que el número de fonemas usados en una muestra mundial de 504 idiomas también es clinal y concuerda con un modelo de efecto fundador serial de expansión con origen inferido en África. Este resultado, que no se explica por la historia demográfica más reciente, la diversidad lingüística local o la no-independencia estadística dentro de las familias lingüísticas, apunta a la existencia de mecanismos paralelos para la diversidad genetica y la diversidad lingüística y apoya la teoría de un origen africano de las lenguas humanas modernas.

Diversidad fonémica promedio

Diversidad fonémica promedio (más claro = mayor).

Para entender de qué estamos hablando tenemos que comenzar explicando ciertos términos clave. Un fonema no es sencillo de definir, pero (para nuestros fines y por ahora) podemos decir que es un sonido de los que forman el repertorio de un idioma y que los hablantes diferencian de otros sonidos. El autor del paper consideró los tonos, además de las vocales y consonantes, como fonemas. La diversidad fonémica es una medida del tamaño del repertorio de fonemas.

Efecto fundador” es un término de la genética de poblaciones. Cuando una especie coloniza una zona geográfica, suele ocurrir que sólo unos pocos individuos abandonan su hogar original. Estos pocos fundan una nueva población y se reproducen entre sí. Como es lógico, su diversidad genética es menor que la de la población original. Cuando esto se produce repetidas veces (repetidas olas de colonización de territorios nuevos), la diversidad genética disminuye con la distancia al origen de la expansión. Esto es un efecto fundador serial.

Efecto fundador

Efecto fundador: la diversidad de la población más reciente es mucho menor a la de la original.

El paper propone que algo similar al efecto fundador sucedió con la expansión del lenguaje, y que el origen del mismo fue una franja del suroeste de África, apoyándose en datos estadísticos sobre muchas lenguas actuales que muestran una progresiva disminución de la diversidad fonémica a medida que nos alejamos de África. Se sabe (por estudios independientes) que la diversidad fonémica tiende a ser menor en poblaciones más pequeñas, y esto se tiene en cuenta. También se tiene en cuenta que la diversidad fonémica no es una variable independiente dentro de cada familia de lenguas.

Luego de los análisis correspondientes, el paper concluye que el lenguaje humano debió originarse en el sudoeste africano y que el mismo se expandió a través de grupos pequeños de hablantes que salían de su área y colonizaban otra, perdiendo diversidad fonémica en el proceso, para luego crecer durante un tiempo y enviar nuevas partidas de colonización pequeñas a zonas aledañas, repitiéndose el proceso de pérdida de fonemas en las lenguas a lo largo del camino que lleva desde África hasta Europa occidental por un lado, y hasta Asia y de allí hasta América (de norte a sur) por el otro. Este efecto fundador serial lingüístico se vería reflejado en el día de hoy en el gradiente de diversidad fonémica decreciente que se encontró al estudiar las lenguas modernas.

No estoy capacitado para juzgar las técnicas estadísticas empleadas para el estudio. Es posible criticarle, a primera vista, que la significación encontrada para la correlación que sirve de base a la hipótesis es bastante baja y que los márgenes de error parecen excesivos. Pero hay dudas más profundas. Las mismas serán tema de la segunda parte de este artículo.

 

* Atkinson, Q. (2011). Phonemic Diversity Supports a Serial Founder Effect Model of Language Expansion from Africa Science, 332 (6027), 346-349 DOI: 10.1126/science.1199295