CienciaLingüística

Demoliendo los universales lingüísticos

ResearchBlogging.orgLas lenguas humanas no sólo consisten en sonidos agrupados, sino que tienen estructura: palabras formadas por raíces, prefijos, sufijos; frases formadas por grupos de palabras; oraciones formadas por frases encadenadas unas a otras. Las estructuras que rigen estos agrupamientos no aparecen al azar. Un paper de Michael Dunn examinó un subgrupo de estas estructuras, correspondientes al orden en que se organizan los componentes de la gramática, y llegó a conclusiones que derriban dos teorías rivales sobre el tema.

En castellano, como todos sabemos, las oraciones suelen tener una estructura Sujeto–Verbo–Objeto (SVO para abreviar). Hay variaciones, por supuesto, pero ése es el “orden dominante”. De la misma manera, el orden dominante entre un sustantivo y un adjetivo es Sust.–Adj. y no al revés. Además usamos preposiciones, es decir, palabras como a, por, para, desde, hacia, que como su mismo nombre lo dice van antes de aquello a lo que gobiernan.

En inglés el orden dominante en las frases nominales es Adjetivo–Sustantivo. Por lo demás el inglés es bastante similar al castellano: SVO, con preposiciones. En japonés, por otro lado, el orden dominante es SOV y las palabras equivalentes a nuestras preposiciones se colocan después y no antes de lo que modifican: postposiciones. En árabe, por contraste, el orden es VSO y los adjetivos siguen a los sustantivos (como en castellano). En castellano las frases genitivas, como los adjetivos, siguen al sustantivo (“el auto de mi padre”, “el objetivo de estas medidas”), mientras que en japonés ambos lo preceden.

Ejemplo de árbol sintáctico en japonés
Ejemplo de árbol sintáctico en japonés (simplificado), como el que describe la frase “Tomodachi no okaasan ga oishii kukkii wo tabesaseta” (“La madre de mi amigo me dio de comer galletitas deliciosas.”) Obsérvese el orden Sujeto-Objeto-Verbo, el uso de postposiciones para marcar sujeto y objeto, y la tendencia de poner los modificadores antes que los núcleos, la cual que hace que el árbol se ramifique hacia la izquierda (la frase literalmente se leería “amigo POSESIVO madre SUJETO deliciosas galletitas OBJETO hizo comer”). El español funciona casi exactamente al revés (con ramificación a la derecha).

Hace algunas décadas el lingüista Joseph Greenberg (1915–2001) recolectó datos de diversas lenguas y observó que casi todas mostraban ciertas correlaciones entre sus características estructurales. Por ejemplo, la mayoría de las lenguas con orden SOV usan postposiciones; en las lenguas VSO se usan preposiciones y el adjetivo sigue al sustantivo; en las lenguas que usan preposiciones las frases posesivas generalmente siguen al sustantivo. Estas correlaciones se consideraron tan robustas que hasta hoy se las conoce como universales lingüísticos (junto con otras características no condicionadas, como la distinción entre sustantivos y verbos).

Greenberg no propuso una explicación para estas correlaciones, limitándose a catalogarlas y establecerlas como hallazgo empírico. Su enfoque se suele caracterizar como funcionalista e implica que estas estructuras lingüísticas existen por variadas razones relacionadas con el uso práctico de la lengua por parte de sus hablantes como forma de interacción social, y con ciertas restricciones que ese uso impone al desarrollo de una lengua.

Noam Chomsky y Joseph Greenberg
Noam Chomsky y Joseph Greenberg

En el extremo opuesto se sitúa Noam Chomsky (1928–), cuya hipótesis formalista o de gramática generativa implica que existe una “gramática universal” con la que todos nacemos, y de la cual se puede generar la gramática de cualquier lengua (Steven Pinker se refirió a esto como “el instinto del lenguaje”). Para Chomsky existe una gramática innata constituida por una serie de módulos, que agrupan características que aparecen siempre juntas (similares a los universales de Greenberg), y un conjunto de parámetros que el cerebro del niño, a medida que se ve inmerso en la lengua de quienes lo rodean, va estableciendo inconscientemente para amoldar su gramática interna al formato particular de la gramática de su lengua materna. Por ejemplo, hay un parámetro que alterna entre head-first y head-last, relacionado con el orden del núcleo de una frase y sus modificadores (por ejemplo, el sustantivo y el adjetivo, o el verbo y sus argumentos —el sujeto y el objeto). Según Chomsky, el cerebro del niño que aprende a hablar activa los parámetros de su gramática de forma que coincidan con los de quienes le hablan; este proceso sencillo explica la rapidez de la adquisición del lenguaje, que sería imposible (según Chomsky) si la mente del infante fuera una tabula rasa y tuviera que comenzar desde cero. También implica que no se pueden separar ciertas características de otras: como interruptores maestros, cada parámetro “enciende” o “apaga” muchas cosas a la vez.

Dunn retomó el trabajo de Greenberg utilizando métodos de la genética de poblaciones para analizar, además de las correlaciones estructurales descubiertas por Greenberg, los parentescos entre las lenguas. Y descubrió que los “universales” de Greenberg no eran tan universales. Las correlaciones se mantuvieron bastante cuando se compararon lenguas emparentadas entre sí, pero se derrumbaron cuando se examinaron lenguas pertenecientes a familias distintas.

Al obviar las relaciones genéticas entre lenguas, Greenberg cometió el gravísimo error estadístico de no contar con las correlaciones entre entidades no independientes. Si todas las lenguas que tienen una característica X también tienen la característica Y, el dato es valioso, pero si además varias de esas lenguas están relacionadas entre sí, es muy posible que esa coincidencia estructural no se deba a la naturaleza intrínseca del lenguaje o a un criterio universal, sino a ese parentesco. Es como si tomáramos diez hijos varones de una persona morena y diez hijas mujeres de una persona de piel muy blanca y concluyéramos que el sexo masculino se correlaciona con la tez oscura y el femenino con la tez clara. Greenberg no era un idiota, desde luego, y no cometió una falla tan extrema, lo cual explica que sus “universales” hayan durado tanto como parte de la ortodoxia lingüística, hasta llegar a ser vistos casi como algo de sentido común.

Una explicación posible es que es difícil encontrar muchas lenguas bien estudiadas (una muestra útil para la comparación detallada que se requiere) y que a la vez no estén relacionadas genéticamente. El estudio de Dunn seleccionó lenguas de cuatro familias, que comprenden más de un tercio de las aproximadamente siete mil lenguas que se hablan hoy. Se eligieron ocho características de orden y se compararon modelos evolutivos con y sin correlación, es decir: para cada par de características se calculó la probabilidad de que las observaciones fueran el resultado de una evolución independiente de esas dos características, y la probabilidad de que, por el contrario, hubieran evolucionado en forma conjunta, teniendo en cuenta cuándo las lenguas comparadas eran de hecho parientes.

Se descubrió que en cada familia lingüística hay pares de características que han evolucionado juntas, pero que esos pares no son los mismos que en las otras familias, es decir, lo que Greenberg tomó como correlaciones universales son correlaciones intrafamiliares, muy probablemente producidas por una ascendencia común y no por tendencias intrínsecas al desarrollo del lenguaje. Esta dispersión también invalida la gramática modular de Chomsky: no parece haber “interruptores maestros”; muchas de las características que Chomsky considera acopladas entre sí —que según él deben estar presentes o ausentes en bloque en cada lengua— en realidad aparecen en forma independiente.

El trabajo de Dunn parece robusto y sus conclusiones no son en absoluto descabelladas. Se le puede reprochar (como ha hecho Mark Liberman en Language Log) que se hayan tomado ocho características de a pares y no en todas las combinaciones posibles, lo cual quizá tenga que ver con el ingente volumen de datos que habría debido procesarse en ese caso. Liberman también opina que existe la posibilidad de que se estén tomando como básicas características que son en realidad derivadas de varios elementos subyacentes (algo similar a considerar características fenotípicas de un organismo, como la altura o el color del pelo, en vez de estudiar los múltiples genes que influyen de forma compleja en la determinación de esas características). Como en otras ocasiones, habrá que esperar que los defensores de las teorías afectadas examinen y critiquen este estudio.

ResearchBlogging.org Dunn, M., Greenhill, S., Levinson, S., & Gray, R. (2011). Evolved structure of language shows lineage-specific trends in word-order universals Nature, 473 (7345), 79-82 DOI: 10.1038/nature09923

4 comentarios en «Demoliendo los universales lingüísticos»

  • El artículo es falaz, porque, tal vez sugestionado por el paper, no se entrevé realmente qué quiere decir «universal» lingüístico para la teoría generativa (la teoría minimista, actualmente). La noción técnica de «universal lingüístico» es distinta en la escuela generativa ( y yo diría hoy en día, toda la corriente de la lingüística teórica, i.e., la gramatica categorial, la gramatica léxico funcional, la gramatica de Montague). Porque «los universales» de la escuela generativa nunca fueron los de Greenberg. El poder de discernir los universales, en el sentido de la escuela generativa, es una tarea ardua y difícil. Los principios universales de Greenberg son aserciones del tipo : «En las lenguas con preposiciones, el genitivo casi siempre sigue al nombre que lo rige, mientras que en las lenguas con posposiciones, el genitivo casi siempre lo precede»(Principio Universal 2; cf. Greenberg, Joseph(1961):»Some Universals of Grammar with Particular Reference to the Order of Meaningful Elements» en Universal Lenguage, MIT press, Cambridge, Massachusetts, 1963, 78). Tal como señala el propio Chomsky (cf. N.Chomsky(1998): «Minimalist Program and the Philosophy of Mind. An interview». Entrevista con C.J.Cela-Conde and G.Marty, Una Aproximación Minimalista a la Mente y al Lenguaje, Editorial Prensa Ibérica, Barcelona, 1998) tales aserciones son generalizaciones descriptivas (inferencia que está al alcance de cualquier persona que domine un poco la matemática discreta y su papel en la lingüística contemporánea), que se precisa derivar de los principios universales de la facultad de lenguaje o Gramática Universal. Siendo que las propiedades de la facultad del lenguaje -explica la lingüista Esther Torrego en «Temas de Gramática y Cognición»- «rebasan con mucho las de la gramática interna de las lenguas particulares (latín, catalán, etc.), la facultad de lenguaje está vista como Mecanismo de Adquisición de Lenguas, otra manera generalizada de hablar del sistema cognitivo del lenguaje. Fundamentalmente, ni Chomsky es la escuela generativa -no publica papers de linguistica hace bastantes años- ni Chomsky ni la escuela generativa han afirmado, como o bien afirmás vos o bien afirma(equivocadamente) el paper «características (…) acopladas entre sí —que según él deben estar presentes o ausentes en bloque en cada lengua» en forma «independiente» o no. La tesis de Greenberg es algo muy diferente a lo que propone la escuela generativa, vale la pena leerse Aspectos de la Teoría Linguística o El Programa Minimalista. Lo que postula la gramática generativa es una serie de patrones matemáticos, abstractos, que deben ser necesarios para que pueda adquirise el lenguaje, es decir, vos confundís la teoría de la adquisición con la teoría parametrizada, aunque incluso la teoría de parámetros y principios no implica, en modo alguno, la teoría de Greenberg.
    Por otra parte lo que propone el paper no tiene nada de nuevo. Es una confusión general entre linguistas «fuera de serie» creer que la GG afirma cosas por el estilo; una objeción siempre estriba en que las principios encontrados por los lingüistas generativistas se fundan en el hecho de que las familias linguisticas estén emparentadas genealógicamente. Lamentablemente el error se sigue perpetrando, como pasó tambien en el asunto de la lengua Piraha. El lenguaje, todo lenguaje natural, se instancia en términos de leyes matemáticas, del mismo modo que el universo tiene una arquitectura matemática : regularidades recurrentes que no pueden aprenderse porque el número de oraciones aducto es reducido en cantidad, y en calidad, respecto al número de oraciones aducto. Ni tampoco se nos instruye sobre estructura recursiva, infinitud discreta de cardinalidad de enteros no-negativos, ni sobre operaciones asociativas no conmutativas sobre cadenas, o relaciones no lineales entre elementos de la sintaxis del lenguaje. Todos los chicos comienzan a articular el lenguaje natural entre los 18 y 28 meses; esto no se debe a que «todas las madres de la tierra comienzan a enseñar el lenguaje en esa época. De hecho, no hay evidencia de que tenga lugar ninguna enseñanza consciente o sistemática del lenguaje», pese a que el lenguaje es matemáticamente tan complejo como un álgebra abstracta. Es eso lo que descubrió y prosigue investigando la gramática generativa, y en general todas las teorías que postulan una gramática universal (de un tipo diferente como es el caso de la Gramática Categorial, que no implica teoría de adquisición sino de procesamiento por traducción automática). Lo de Greenberg está en otro nivel de teorización. Y son los «parámetros» (o sea la variedad externa, aprendida, del lenguaje) lo que propone la GG. En tanto parámetros, están sujetos a variación, y son ambientales. Aprendidos.
    Girando por otro aspecto del problema, las inferencias estadísticas del paper ignoran que puede demostrarse, via teoremas, que todo lenguaje natural debe contener, necesariamente, una estructura regular matemática de algún tipo que no sea ambiental. De otro modo, no podría aprenderse. Por ejemplo, mucho de lo que el paper toma como «accidente linguistico» por ascendencia común va más allá de lo que puede inferirse por estadística, porque la estadística es no legal, y por ende, no va a descubrir las leyes que lo regulan. Por ejemplo, tanto el latín como el español, y todas las lenguas naturales, tienen concatenaciones (una operación propia del Algebra Concatenatoria, axiomatizada por Ronsenbloom) y que los tenga debe ser algo necesario para que se den un cierto tipo de procesamiento de la información lingüística, estadística que valga. La estadística nunca va a mostrar qué recurso matemático se requiere para expresár qué tipo de información, a eso solo lo proporciona una teoría legalista (cf. Bunge, Mario. «A la Caza de la Realidad». Editorial Gedisa).

    En general, hay errores muy agudos en tu informe, como «Para Chomsky existe una gramática innata constituida por una serie de módulos» > Olvidando el aspecto ya indicado de que «Chomsky» no fue quien postuló solamente la GG, Chomsky no postula «módulos» mentales, sino «un módulo» mental(que no debe confundirse con la concepción fodoriana de «Módulo»), cognitivo, que es la facultad del lenguauje, y su arquitectura, teorizada en términos de un aparato formal que permita generar (derivar a partir de unos axiomas iniciales) sentencias bien formadas de ese lenguaje natural. Y después está la asociación errónea que se hace entre principios y parámetros de la GG.

    Respuesta
    • Estimado Algoritzmi: he tratado de explicar los conceptos de los que habla el paper según mi limitado conocimiento del tema (no soy lingüista ni presumo de serlo). Siempre estoy dispuesto a formarme. Por fuerza no puedo plantear ni refutar teorías en mis propios términos; me limité a traducir a términos más entendibles lo que pude entender. Los errores que pude cometer y que me hiciste ver quedan debidamente anotados. Gracias por tu comentario.

      Respuesta
    • El artículo no me parece falaz en absluto.
      La teoría de parametros sí implica la noción de orden dominante. De hecho, una de las principales operaciones utilizadas en la descripción de los fenómenos syntácticos hecha sobre la base de estructuras arboreas binarias es la de «movimiento», para que haya movimiento un orden básico debe presuponerse y en los casos mas extremos (ver Kayne 1994) el orden básico es la piedra angular de la reestructuración modal o aspectual de una phrase bajo la tutela de «ForceP», IP, u otra estructura de la periferia izquierda.
      Dunn et al. 2011 no aboga contra la idea de modularidad, el problema aquí es la fuente de variación entre lenguas y algunas consequencias de la detección de diversas fuentes, por ejemplo la plausabilidad de la teoría monogenética o en el último de los casos la validez de una tipología estructurada sobre la base teórica de los universales de greenberg.
      Un punto de vista evolutivo donde los factores ambientales no juegan un papel importante, incluso si éste papel es transitorio, no parece ser suficientemente sólida, la experiencia actúa sobre la configuracion cognitiva del individuo y el individuo es quién utiliza el lenguaje. Es entonces en el individuo que los cambios se expresan en términos de evolución y otro tipo de variación lingüística.
      El artículo ha causado fuertes discusiones, su valor al seno de la comunidad científica es de lanzar una duda necesaria a la verificación de los datos y la construcción de postulados sobre los que reposa la idea de tipo y como corolario la noción de universal lingüístico.
      Si el tema les interesa pueden consultar este número de la revista «Linguistic typology» en la que el tema está mejor desarrollado por especialistas en typología.
      http://www.degruyter.com/view/j/lity.2011.15.issue-2/issue-files/lity.2011.15.issue-2.xml

      Respuesta
    • En términos del método estadístico y sus alcances en términos de evolución tal vez les interese este artículo.
      http://rstb.royalsocietypublishing.org/content/363/1512/3955
      En efecto, el método sólo intenta identificar la fuente de la variación y del cambio, no intenta al contrario determinar los contenidos lingüiísticos implícitos en el cambio. Este hecho no niega, sin embargo, la posibilidad de determinar, con una metodología probabilística si los «accidentes lingüísticos» a nivel diacrónico son generados por un mecanismo universal (ver cognitivo innato), o un mechanismo ligado a restricciones ambientales.

      Respuesta

Responder a PabloDF Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

*