Modelo de árbol

format_list_bulleted Contenido keyboard_arrow_down

ImprimirCitar

En lingüística histórica, el modelo de árbol (también modelo de Stammbaum, genético o cladístico) es un modelo de la evolución de las lenguas análogo al concepto de árbol genealógico, en particular al árbol filogenético en la evolución biológica de las especies. Al igual que con las especies, se supone que cada lengua ha evolucionado a partir de un único progenitor o lengua "madre", y que las lenguas que comparten un ancestro común pertenecen a la misma familia lingüística.

El modelo de árbol, popularizado por el lingüista alemán August Schleicher en 1853, siempre ha sido un método común para describir las relaciones genéticas entre las lenguas desde los primeros intentos de hacerlo. Es fundamental en el campo de la lingüística comparada, que implica el uso de evidencia de las lenguas conocidas y las reglas observadas de evolución de las características lingüísticas para identificar y describir las hipotéticas protolenguas ancestrales de cada familia lingüística, como las lenguas protoindoeuropeas y las indoeuropeas. Sin embargo, se trata en gran medida de una búsqueda teórica y cualitativa, y los lingüistas siempre han enfatizado las limitaciones inherentes del modelo de árbol debido al gran papel que desempeña la transmisión horizontal en la evolución de las lenguas, que abarca desde los préstamos lingüísticos hasta las lenguas criollas que tienen múltiples lenguas madre. El modelo de onda fue desarrollado en 1872 por el alumno de Schleicher, Johannes Schmidt, como una alternativa al modelo de árbol que incorpora la transmisión horizontal.

El modelo de árbol también tiene las mismas limitaciones que la taxonomía biológica con respecto al problema de las especies de cuantificar un fenómeno continuo que incluye excepciones como las especies en anillo en biología y los continuos dialectales en el lenguaje. El concepto de vínculo se desarrolló en respuesta a ello y se refiere a un grupo de idiomas que evolucionaron a partir de un continuo dialectal en lugar de a partir de idiomas secundarios lingüísticamente aislados de un solo idioma.

Historia

Antiguo Testamento y San Agustín

Agustín de Hipona supuso que cada uno de los descendientes de Noé fundó una nación y que a cada nación se le dio su propia lengua: asirio por Assur, hebreo por Heber, y así sucesivamente. En total identificó 72 naciones, fundadores tribales y lenguas. La confusión y dispersión se produjo en la época de Peleg, hijo de Heber, hijo de Sem, hijo de Noé. Agustín formuló una hipótesis no muy distinta de las de los lingüistas históricos posteriores, de que la familia de Heber "conservó esa lengua que no sin razón se cree que fue la lengua común de la raza... de ahí en adelante llamada hebreo". Sin embargo, la mayoría de las 72 lenguas datan de muchas generaciones posteriores a Heber. San Agustín resuelve este primer problema suponiendo que Heber, que vivió 430 años, todavía estaba vivo cuando Dios le asignó los 72.

Ursprache, el lenguaje del paraíso

La hipótesis de San Agustín se mantuvo sin mayores dudas durante más de mil años. Luego, en una serie de tratados publicados en 1684, en los que expresaba su escepticismo respecto de diversas creencias, especialmente las bíblicas, Sir Thomas Browne escribió:

"Aunque la tierra fue ampliamente poblada antes del diluvio... sin embargo, si, después de una gran dispersión, y el espacio de dieciséiscientos años, los hombres mantuvieron un lenguaje tan uniforme en todas partes,... bien puede ser dudado."

Para entonces, el descubrimiento del Nuevo Mundo y la exploración del Lejano Oriente habían permitido conocer una cantidad de lenguas nuevas muy superior a las 72 calculadas por San Agustín. Citando las lenguas nativas americanas, Browne sugiere que "la confusión de lenguas se produjo al principio sólo entre los que estaban presentes en Sinaar en la obra de Babel...". Para aquellos "al pie de las colinas, donde descansaba el arca... su lengua primitiva podría con el tiempo extenderse a varias partes de Europa y Asia...." Esto es un indicio de un árbol. En opinión de Browne, la simplificación a partir de una lengua aborigen más extensa que el hebreo podría explicar las diferencias en el lenguaje. Sugiere el chino antiguo, del que los otros descendieron por "confusión, mezcla y corrupción". Más tarde invoca "mezcla y alteración".

Browne informa sobre una serie de actividades reconstructivas llevadas a cabo por los eruditos de la época:

"La aprendida Casaubon concibe que un diálogo podría estar compuesto en Saxon, sólo de palabras como son derivadas del griego... Verstegan no dudó que pudiera contender una carta que podría ser entendida por los ingleses, holandeses y este Frislander... Y si, como lo afirma el sabio Buxhornius, el lenguaje escithiano como lengua materna corre por todas las naciones de Europa, e incluso hasta Persia, la comunidad en muchas palabras, entre tantas naciones, tiene una traducción más razonable y fueron más bien derivados de la lengua común difusa a través de todos ellos, que de cualquier nación particular, que también ha tomado prestado y sostiene pero a la segunda mano."

Así, la confusión en la Torre de Babel fue eliminada como obstáculo al dejarla de lado. Los intentos de encontrar similitudes en todos los idiomas dieron como resultado el descubrimiento gradual de una antigua lengua maestra de la que se derivan todos los demás idiomas. Sin duda, Browne escribió y pensó mucho antes de 1684. En ese mismo siglo revolucionario en Gran Bretaña, James Howell publicó el volumen II de Epistolae Ho-Elianae, cartas casi ficticias a varias personas importantes del reino que contenían información histórica válida. En la Carta LVIII, la metáfora de un árbol de idiomas aparece completamente desarrollada, a falta de ser la opinión de un lingüista profesional:

"Ahora zarparé por los Países Bajos, cuyo idioma es el mismo dialecto con el inglés, y fue así desde el principio, siendo ambos derivados del holandés alto [Howell está equivocado aquí]: El danés también es sólo una rama del mismo árbol... Ahora el Alto Lengua Neerlandesa o Teutonick Tongue, es uno de los principales y más espaciosos Idiomas Maternos de Europa... era el lenguaje de los Goths y Vandals, y continúa aún de la mayor parte de Polonia y Hungría, que tienen un Dialecto de los suyos por su lengua vulgar... Algunos de sus escritores harían que este mundo crease que ella era el lenguaje hablado en el paraíso".

La búsqueda de la "lengua del paraíso" estaba en marcha entre todos los lingüistas de Europa. Quienes escribían en latín la llamaban la lingua prima, la lingua primaeva o la lingua primigenia. En inglés era la lengua adánica; en alemán, la Ursprache o la hebräische Ursprache si se creía que era el hebreo. Esta misteriosa lengua tenía un aura de pureza e incorrupción, y esas cualidades eran las que se utilizaban para seleccionar a los candidatos. Este concepto de Ursprache empezó a utilizarse mucho antes de que los neogramáticos lo adoptaran para sus protolenguas. La brecha entre las familias de lenguas, tan divergentes entre sí, seguía abierta.

Modelo indoeuropeo

El 2 de febrero de 1786, Sir William Jones pronunció su Discurso del Tercer Aniversario ante la Sociedad Asiática como su presidente sobre el tema de los hindúes. En él aplicó la lógica del modelo del árbol a tres idiomas, griego, latín y sánscrito, pero por primera vez en la historia sobre bases puramente lingüísticas, observando "una afinidad más fuerte, tanto en las raíces de los verbos como en las formas gramaticales, de la que podría haberse producido por accidente;....". Continuó postulando que surgieron de "alguna fuente común, que, tal vez, ya no existe." A ellos agregó el gótico, el celta y el persa como "pertenecientes a la misma familia."

Jones no mencionó su "fuente común" ni desarrolló más la idea, pero los lingüistas de la época la retomaron. En la (London) Quarterly Review de finales de 1813-1814, Thomas Young publicó una reseña de Mithridates, oder allgemeine Sprachenkunde ("Mithridates, o una historia general de las lenguas") de Johann Christoph Adelung, cuyo volumen I había salido en 1806, y los volúmenes II y III, 1809-1812, continuados por Johann Severin Vater. La obra de Adelung describía unas 500 "lenguas y dialectos" y planteó la hipótesis de una descendencia universal del idioma del paraíso, ubicado en Cachemira, en el centro del área de distribución total del siglo V. Young comienza señalando la deuda de Adelung con Mithridates, de Differentiis Linguarum de Conrad Gesner de 1555 y otros catálogos posteriores de idiomas y alfabetos.

Cachemira (rojo), la ubicación de Adelung de Edén

Young se propone presentar la clasificación de Adelung. El tipo monosilábico es el más antiguo y primitivo, hablado en Asia, al este del Edén, en dirección a la salida de Adán del Edén. A continuación sigue el grupo de Jones, todavía sin nombre, pero atribuido a Jones: «Otra clase antigua y extensa de lenguas unidas por un mayor número de semejanzas de las que pueden ser totalmente accidentales». Para esta clase ofrece un nombre, «indoeuropeo», el primer uso lingüístico conocido de la palabra, pero no su primer uso conocido. La Compañía Británica de las Indias Orientales utilizaba «comercio indoeuropeo» para referirse al comercio de mercancías entre la India y Europa. Todas las pruebas que cita Young para el grupo ancestral son las palabras más similares: madre, padre, etc.

Las clases adicionales de Adelung eran la tártara (que más tarde se conocería como la disputada familia altaica), la africana y la americana, que dependen de la geografía y de una presunta descendencia del Edén. Young no comparte el entusiasmo de Adelung por el lenguaje del paraíso y lo califica de principalmente especulativo.

La designación de Young, exitosa en inglés, fue sólo una de varios candidatos propuestos entre 1810 y 1867: indo-germanique (Conrad Malte-Brun, 1810), japetisk (Rasmus Christian Rask, 1815), Indo-germanisch (Julius Klaproth, 1823), indisch-teutsch (F. Schmitthenner, 1826), sanskritisch (Wilhelm von Humboldt, 1827), indokeltisch (A. F. Pott, 1840), arioeuropeo (Graziadio Isaia Ascoli, 1854), ario (Max Müller, 1861) ) y aryaque (H. Chavée, 1867). Todos estos hombres eran políglotas y prodigios de las lenguas. (Klaproth, por ejemplo, el autor del exitoso candidato en lengua alemana, Indo-Germanisch, que criticó a Jones por su método acrítico, sabía chino, japonés, tibetano y varios otros idiomas con sus escrituras). El concepto de una Biblia La lengua original apeló a su imaginación. A medida que la esperanza de encontrarla se fue desvaneciendo, recurrieron al concepto cada vez más extendido de un indoeuropeo común hablado por tribus nómadas en las llanuras de Eurasia, y aunque argumentaron que esta lengua se puede deducir por la En realidad, no fue así como lo consiguieron, sino que fue el único caso en el que sus esfuerzos por encontrar la Ursprache tuvieron éxito.

Modelo neogrammariano

El modelo se debe, en su formulación más estricta, a los neogramáticos. El modelo se apoya en concepciones anteriores de William Jones, Franz Bopp y August Schleicher, a las que añade la ausencia de excepciones en las leyes del sonido y la regularidad del proceso. El lingüista que tal vez fue el más responsable de establecer el vínculo con el darwinismo fue August Schleicher.

El hecho de que estuviera comparando su Stammbaum, o árbol genealógico de las lenguas, con la presentación de la evolución que hizo Darwin poco después de esa presentación lo demuestra la carta abierta que escribió en 1863 a Ernst Haeckel, publicada póstumamente. En 1869, Haeckel le había sugerido que leyera El origen de las especies.

Después de leerlo, Schleicher escribió Die Darwinische Theorie und die Sprachwissenschaft, "El darwinismo puesto a prueba por la ciencia del lenguaje". En un escenario que recuerda al que se produjo entre Darwin y Wallace sobre el descubrimiento de la evolución (ambos lo descubrieron de forma independiente), Schleicher respaldó la presentación de Darwin, pero la criticó por no insertar ninguna especie. A continuación, presentó un Stammbaum de los idiomas, que, sin embargo, no era el primero que publicaba.

La evolución de las lenguas no fue la fuente de la teoría de la evolución de Darwin. La había basado en la variación de las especies, como la que había observado en los pinzones de las Islas Galápagos, que parecían ser modificaciones de un ancestro común. La selección de especies domésticas para producir una nueva variedad también jugó un papel en sus conclusiones. La primera edición de El origen de las especies, de 1859, analiza el árbol del lenguaje como si fuera de novo bajo el tema de la clasificación. Darwin critica el método sincrónico ideado por Linneo, sugiriendo que se lo reemplace por un "ordenamiento natural" basado en la evolución. Dice:

"Puede valer la pena ilustrar esta visión de clasificación, tomando el caso de los idiomas. Si poseíamos un pedigrí perfecto de la humanidad, un arreglo genealógico de las razas del hombre permitiría la mejor clasificación de los diversos idiomas que se hablan ahora en todo el mundo; y si todos los idiomas extinguidos, y todos los dialectos intermedios y lentamente cambiantes, tenían que ser incluidos, tal arreglo, creo, sería el único posible. Sin embargo, podría ser que algún lenguaje muy antiguo había alterado poco, y había dado lugar a pocos nuevos idiomas, mientras que otros (debido a la propagación y posterior aislamiento y estados de civilización de las varias razas, descendidos de una raza común) habían alterado mucho, y habían dado lugar a muchos nuevos idiomas y dialectos. Los diferentes grados de diferencia en los idiomas de la misma acción, tendrían que ser expresados por grupos subordinados a grupos; pero el arreglo adecuado o incluso sólo posible sería genealógico; y esto sería estrictamente natural, ya que conectaría todos los idiomas, extinguidos y modernos, por las afinidades más cercanas, y daría la filiación y el origen de cada lengua."

Schleicher nunca había oído hablar de Darwin antes de que Haeckel se lo hiciera notar. Había publicado su propio trabajo sobre el Stammbaum en un artículo de 1853, seis años antes de la primera edición de El origen de las especies en 1859. El concepto de descendencia de las lenguas no era nuevo en absoluto. Thomas Jefferson, un lingüista devoto, había propuesto que la necesidad continua de neologismos implica que las lenguas deben "progresar" o "avanzar". Estas ideas prefiguran la evolución de las especies biológicas o de las lenguas, pero después del contacto de Schleicher con las ideas de Darwin, y tal vez del contacto de Darwin con los lingüistas históricos, la evolución y el cambio lingüístico quedaron inextricablemente vinculados y se convertirían en la base de la clasificación. Ahora, como entonces, los principales problemas serían demostrar líneas de descendencia específicas e identificar los puntos de ramificación.

Árbol filogenético

La antigua metáfora recibió un significado completamente nuevo bajo el antiguo nombre por Joseph Harold Greenberg en una serie de ensayos que comenzaron alrededor de 1950. Desde que los lingüistas adoptaron la metáfora del árbol genealógico, el concepto de evolución había sido propuesto por Charles Darwin y era generalmente aceptado en biología. La taxonomía, la clasificación de los seres vivos, ya había sido inventada por Carl Linnaeus. Utilizaba una nomenclatura binomial para asignar un nombre de especie y un nombre de género a cada organismo vivo conocido. Estos se organizaban en una jerarquía biológica bajo varios filos, o grupos más generales, que finalmente se ramificaban en las diversas especies. La base de esta clasificación biológica eran las características físicas compartidas observadas de las especies.

Sin embargo, Darwin, retomando otra antigua metáfora, el árbol de la vida, planteó la hipótesis de que los grupos de la clasificación de Linneo (los taxones actuales) descendían en una estructura de árbol a lo largo del tiempo desde el más simple al más complejo. El árbol jerárquico de Linneo era sincrónico; Darwin imaginó un proceso diacrónico de descendencia común. Donde Linneo había concebido rangos, que eran consistentes con la gran cadena del ser adoptada por los racionalistas, Darwin concibió linajes. Durante las décadas posteriores a Darwin se hizo evidente que los rangos de la jerarquía de Linneo no se correspondían exactamente con los linajes. Se convirtió en el objetivo principal de la taxonomía descubrir los linajes y alterar la clasificación para reflejarlos, lo que hizo bajo la guía general de los Códigos de Nomenclatura, libros de reglas mantenidos por organizaciones internacionales para autorizar y publicar propuestas para reclasificar especies y otros taxones. El nuevo enfoque se llamó filogenia, la "generación de filos", que ideó una nueva metáfora arbórea, el árbol filogenético. Una unidad del árbol y todas sus unidades descendientes eran un clado y el descubrimiento de los clados era cladística.

Greenberg comenzó a escribir en una época en la que la sistemática filogenética carecía de las herramientas que más tarde estuvieron a su disposición: la computadora (sistemática computacional) y la secuenciación del ADN (sistemática molecular). Para descubrir una relación cladística, los investigadores dependían de la mayor cantidad posible de similitudes morfológicas entre especies que se pudieran definir y tabular. Estadísticamente, cuanto mayor era el número de similitudes, más probable era que las especies estuvieran en el mismo clado. Este enfoque atrajo a Greenberg, que estaba interesado en descubrir universales lingüísticos. Al alterar el modelo de árbol para convertir el árbol genealógico en un árbol filogenético, dijo:

"Cualquier idioma consiste en miles de formas con sonido y significado... cualquier sonido que pueda expresar cualquier significado. Por lo tanto, si dos idiomas coinciden en un número considerable de tales artículos... necesariamente trazamos una conclusión de origen histórico común. Tales clasificaciones genéticas no son arbitrarias... la analogía aquí a la clasificación biológica es extremadamente cercana... al igual que en la biología clasificamos especies en el mismo género o unidad alta porque los parecidos son tales como sugerir una hipótesis de ascendencia común, así con hipótesis genéticas en el lenguaje".

En esta analogía, una familia lingüística es como un clado, las lenguas son como especies, la protolengua es como un taxón ancestral, el árbol lingüístico es como un árbol filogenético y las lenguas y dialectos son como especies y variedades. Greenberg formuló grandes tablas de características de lenguas hasta entonces desatendidas de África, las Américas, Indonesia y el norte de Eurasia y las clasificó según sus similitudes. A este enfoque lo denominó "clasificación tipológica", y se llegó a él mediante la lingüística descriptiva en lugar de la lingüística comparativa.

Fechas y glottocronología

Los lingüistas históricos han utilizado el método comparativo para reconstruir modelos de árboles utilizando datos léxicos, morfológicos y fonológicos discretos. Se puede encontrar la cronología, pero no existen estimaciones de fechas absolutas utilizando este sistema.

La glotocronología permite estimar fechas absolutas. Los cognados compartidos (que significan que tienen un origen histórico común) calculan los tiempos de divergencia. Sin embargo, el método fue desacreditado más tarde debido a que los datos no eran confiables. Debido a esto, los lingüistas históricos tienen problemas con la estimación exacta de la edad a la hora de determinar la edad de la familia de lenguas indoeuropeas. Podría oscilar entre 4000 y 40 000 años antes del presente, o cualquier fecha intermedia según Dixon, que se basó en el ascenso y la caída de la lengua (Cambridge University Press). Como se ve en el artículo aquí.

Se están encontrando posibles soluciones para la glotocronología gracias a los métodos filogenéticos computacionales. Las técnicas como el uso de modelos de evolución mejoran la precisión de la longitud y la topología de las ramas de los árboles. Por lo tanto, el uso de métodos filogenéticos computacionales permite a los investigadores analizar datos lingüísticos de la biología evolutiva. Esto ayuda a contrastar teorías entre sí, como la teoría de Kurgan y la teoría de Anatolia, que afirman los orígenes de las lenguas infoeuropeas.

Filogenética computacional en la lingüística histórica

El método comparativo compara las características de varios idiomas para evaluar la similitud de un idioma con otro. Los resultados de esta evaluación están orientados a los datos, es decir, dependen de la cantidad de características y de la cantidad de idiomas comparados. Hasta la llegada de la computadora al panorama de la lingüística histórica, las cifras en ambos casos eran necesariamente pequeñas. El efecto era el de intentar representar una fotografía utilizando una pequeña cantidad de píxeles grandes, o unidades de imagen. Las limitaciones del modelo de árbol eran demasiado evidentes, lo que dio lugar a quejas de los principales lingüistas históricos.

A finales del siglo XX, los lingüistas comenzaron a utilizar software destinado a la clasificación biológica para clasificar las lenguas. Los programas y métodos se volvieron cada vez más sofisticados. A principios del siglo XXI, el proyecto Computational Phylogenetics in Historical Linguistics (CPHL), un consorcio de lingüistas históricos, recibió financiación de la National Science Foundation para estudiar las filogenias. La familia indoeuropea es un tema de estudio importante. En enero de 2012, habían recopilado y codificado una base de datos "filtrada" de "22 caracteres fonológicos, 13 caracteres morfológicos y 259 caracteres léxicos", y una base de datos no filtrada de más. Se incluyen listas de palabras de 24 lenguas indoeuropeas. Un mayor número de características e idiomas aumenta la precisión, siempre que cumplan ciertos criterios. Utilizando un software informático especializado, prueban varias hipótesis filogenéticas para comprobar su capacidad de explicar los caracteres por descendencia genética.

Limitaciones del modelo

Una limitación endémica del modelo de árbol es la propia presunción fundacional en la que se basa: requiere una clasificación basada en idiomas o, más generalmente, en variedades de idiomas. Dado que una variedad representa una abstracción de la totalidad de las características lingüísticas, existe la posibilidad de pérdida de información durante la traducción de datos (de un mapa de isoglosas) a un árbol. Por ejemplo, está el problema de los continuos dialectales. Proporcionan variedades que no son inequívocamente de un idioma u otro, sino que contienen características propias de más de uno. La cuestión de cómo deben clasificarse es similar a la que plantean las especies en anillo para el concepto de clasificación de especies en biología.

Las limitaciones del modelo de árbol, en particular su incapacidad para manejar la distribución no discreta de innovaciones compartidas en los continuos dialectales, se han abordado mediante el desarrollo de metodologías no cladísticas (no basadas en árboles). Entre ellas se incluyen el modelo Wave y, más recientemente, el concepto de enlace.

Una limitación adicional del modelo de árbol involucra a las lenguas mixtas e híbridas, así como a la mezcla de lenguas en general, ya que el modelo de árbol sólo permite divergencias. Por ejemplo, según Zuckermann (2009:63), "israelí", su término para el hebreo moderno, que él considera un híbrido semitoeuropeo, "demuestra que la realidad de la génesis lingüística es mucho más compleja de lo que permite un sistema de árbol genealógico simple. Es poco probable que las lenguas "revividas" tengan un solo progenitor".

Fylogenies perfectas

El propósito del software filogenético es generar cladogramas, un tipo especial de árbol en el que los enlaces sólo se bifurcan; es decir, en cualquier nodo en la misma dirección sólo se ofrecen dos ramas. Los datos de entrada son un conjunto de caracteres a los que se les pueden asignar estados en diferentes idiomas, como presente (1) o ausente (0). Por lo tanto, un idioma puede describirse mediante un conjunto único de coordenadas que consiste en los valores de estado de todos los caracteres considerados. Estas coordenadas pueden ser similares entre sí o menos. Los idiomas que comparten más estados son los más similares entre sí.

El software procesa todos los estados de todos los caracteres de todos los idiomas mediante uno de varios métodos matemáticos para lograr una comparación por pares de cada idioma con el resto. Luego construye un cladograma basado en grados de similitud; por ejemplo, se supone que los idiomas hipotéticos a y b, que son los más cercanos entre sí, tienen un ancestro común, a-b. Se supone que el idioma siguiente más cercano, c, tiene un ancestro común con a-b, y así sucesivamente. El resultado es una serie proyectada de caminos históricos que van desde el ancestro común general (la raíz) hasta los idiomas (las hojas). Cada camino es único. No hay vínculos entre los caminos. Cada hoja y nodo tiene un solo ancestro. Todos los estados se explican por la descendencia de otros estados. Un cladograma que se ajusta a estos requisitos es una filogenia perfecta.

Al principio, parecía que había poca coherencia en los resultados de los ensayos en los que se variaban los factores que se suponía que eran relevantes. De cualquier cambio se obtenía un nuevo cladograma, lo que sugería que el método no estaba captando la evolución subyacente de las lenguas, sino que solo reflejaba los juicios improvisados de los investigadores. Para encontrar los factores que sí tenían relación con la filogenia, los investigadores necesitaban tener alguna medida de la precisión de sus resultados; es decir, los resultados debían calibrarse con filogenias conocidas. Realizaron el experimento utilizando diferentes supuestos en busca de los que producirían las coincidencias más cercanas a las filogenias indoeuropeas más seguras. Esos supuestos podrían utilizarse en áreas problemáticas de la filogenia indoeuropea con mayor confianza.

Para obtener una filogenia razonablemente válida, los investigadores descubrieron que necesitaban introducir como entrada los tres tipos de caracteres: fonológicos, léxicos y morfológicos, todos ellos necesarios para presentar una imagen lo suficientemente detallada para el cálculo de la filogenia. Sólo los caracteres cualitativos produjeron resultados significativos. Los estados repetidos eran demasiado ambiguos para que el software los interpretara correctamente; por lo tanto, los caracteres que estaban sujetos a formación inversa y desarrollo paralelo, que revertían un carácter a un estado anterior o adoptaban un estado que evolucionaba en otro carácter, respectivamente, se filtraron del conjunto de datos de entrada.

Redes filogenéticas perfectas

A pesar de su esfuerzo por codificar los mejores caracteres cualitativos en cantidades suficientes, los investigadores no pudieron obtener filogenias perfectas para algunos grupos, como el germánico y el albanés dentro del indoeuropeo. Razonaron que un número significativo de caracteres, que no podían explicarse por la descendencia genética del ancestro calculado del grupo, eran préstamos. Presumiblemente, si el modelo de onda, que explicaba los préstamos, fuera una explicación completa de los caracteres del grupo, no podría encontrarse ninguna filogenia para él. Si ambos modelos fueran parcialmente efectivos, entonces existiría un árbol, pero necesitaría ser complementado con explicaciones no genéticas. Por lo tanto, los investigadores modificaron el software y el método para incluir la posibilidad de préstamos.

Los investigadores introdujeron en el experimento el concepto de interfaz, o límite permitido a través del cual fluirían los estados de los caracteres. Existía una interfaz unidireccional, o borde, entre un padre y un hijo. Si sólo los bordes unidireccionales fueran suficientes para explicar la presencia de todos los estados en una lengua, entonces no habría necesidad de mirar más allá de la filogenia perfecta. Si no, entonces se podrían añadir uno o más bordes de contacto, o interfaces bidireccionales, a la filogenia. Por lo tanto, una lengua podría tener más de una fuente de estados: la lengua madre o una lengua de contacto.

Un árbol modificado de esta manera ya no era un árbol como tal: podía haber más de un camino desde la raíz hasta la hoja. Los investigadores llamaron a esta disposición una red. Los estados de un carácter seguían evolucionando a lo largo de un único camino desde la raíz hasta la hoja, pero su origen podía ser la raíz en cuestión o una lengua de contacto. Si todos los estados del experimento podían explicarse mediante la red, se la denominaba una red filogenética perfecta.

Compatibilidad y viabilidad

La generación de redes requirió dos fases. En la primera fase, los investigadores idearon una serie de filogenias, llamadas árboles candidatos, para probar su compatibilidad. Un carácter es compatible cuando su origen se explica por la filogenia generada. En una filogenia perfecta, todos los caracteres son compatibles y la compatibilidad del árbol es del 100%. Según el principio de parsimonia, o navaja de Occam, no se garantiza la existencia de redes. Los árboles candidatos se obtuvieron ejecutando primero el software de generación de filogenias utilizando el conjunto de datos indoeuropeos (las cadenas de estados de caracteres) como entrada, y luego modificando el árbol resultante con otras hipótesis para probar.

Ninguno de los árboles candidatos originales eran filogenias perfectas, aunque algunos de los subárboles dentro de ellos sí lo eran. La siguiente fase fue generar redes a partir de los árboles con los puntajes de compatibilidad más altos, agregando interfaces una a la vez, seleccionando la interfaz de mayor compatibilidad, hasta que se obtuvo la suficiencia; es decir, la compatibilidad de la red fue la más alta. Como se vio, el número de redes compatibles generadas podría variar desde ninguna hasta más de una docena. Sin embargo, no todas las interfaces posibles eran factibles históricamente. Las interfaces entre algunos idiomas eran geográfica y cronológicamente poco probables. Al inspeccionar los resultados, los investigadores excluyeron las interfaces no factibles hasta que quedó una lista de solo redes factibles, que se pudieron organizar en orden de puntaje de compatibilidad.

Red más factible para Indo-Europe

Los investigadores comenzaron con cinco árboles candidatos para el indoeuropeo, con las letras A-E, uno generado a partir del software filogenético, dos modificaciones del mismo y dos sugeridos por Craig Melchert, un lingüista histórico e indoeuropeo. Los árboles diferían principalmente en la ubicación del grupo más ambiguo, las lenguas germánicas, y el albanés, que no tenía suficientes caracteres distintivos para ubicarlo exactamente. El árbol A contenía 14 caracteres incompatibles; el B, 19; el C, 17; el D, 21; el E, 18. Los árboles A y C tenían los mejores puntajes de compatibilidad. Las incompatibilidades eran todas léxicas, y los A eran un subconjunto de los C.

La generación posterior de redes determinó que todas las incompatibilidades podían resolverse con un mínimo de tres aristas de contacto, excepto el árbol E. Como no tenía una alta compatibilidad, se lo excluyó. El árbol A tenía 16 redes posibles, que una inspección de viabilidad redujo a tres. El árbol C tenía una red, pero como requería una interfaz con el Báltico y no con el Eslavo, no era viable.

El árbol A, el más compatible y factible, plantea la hipótesis de que siete grupos se separaron del protoindoeuropeo entre aproximadamente el 4000 a. C. y el 2250 a. C., de la siguiente manera:

El primero en separar fue Anatolian, alrededor de 4000 a.C.
Tocharian siguió a unos 3500 a.C.
Poco después, aproximadamente 3250, Proto-Italo-Celtic (occidental Indo-europeo) se separó, convirtiéndose en Proto-Italic y Proto-Celtic en aproximadamente 2500 BC.
Aproximadamente 3000, Proto-Albano-Germanic se separó, convirtiéndose en albanés y proto-alemánico en aproximadamente 2000.
Aproximadamente 3000 Proto-Greco-Armenian (southern Indo-European) dividido, convirtiéndose en Proto-Greek y Proto-Armenian a aproximadamente 1800.
Balto-Slavic apareció alrededor de 2500, dividiendo en Proto-Baltic y Proto-Slavic alrededor de 1000.
Por último, Proto-Indoeuropeo se convirtió en Proto-Indo-Iraniano (este de Indo-europeo) en aproximadamente 2250.

Los árboles B y E ofrecen la alternativa del protogermano-baltoeslavo (indoeuropeo septentrional), lo que convierte al albanés en una rama independiente. La única fecha que los autores avalan es la última, basándose en la continuidad de la cultura Yamna, la cultura Andronovo y las culturas de habla indoaria conocidas. Todas las demás se describen como "estimación de la situación".

Dada la filogenia de mejor compatibilidad, A, se requieren tres aristas de contacto para completar la compatibilidad. Este es el grupo de aristas con la menor cantidad de eventos de préstamo:

Primero, un borde entre Proto-Italic y Proto-Germanic, que debe haber comenzado después de 2000, según el esquema de citas dado.
Un segundo punto de contacto fue entre Proto-Italic y Proto-Greco-Armenian, que debe haber comenzado después de 2500.
El tercer límite de contacto es entre Proto-Alemania y Proto-Baltic, que debe haber comenzado después de 1000.

Los autores describen el árbol A con los bordes descritos anteriormente como "nuestra mejor PPN". En todas las PPN, está claro que, aunque las lenguas hijas iniciales se volvieron distintas en un aislamiento relativo, la evolución posterior de los grupos solo se puede explicar por la evolución en proximidad a otras lenguas con las que se produce un intercambio según el modelo de onda.

Véase también

Método comparativo
Lingüística Evolutiva
Relación genética (lingüística)
Estudios indoeuropeos
Familia de idiomas
Linkage (linguistics)
Modelo de onda (lingüística)
Padre Tongue hipótesis

Notas

^ a b Lista, Johann-Mattis; Nelson-Sathi, Shijulal; Geisler, Hans; Martin, William (2014). "Networks of lexical borrowing and side gene transfer in language and genome evolution". BioEnsayos. 36 (2): 141–150. doi:10.1002/bies.201300096. ISSN 0265-9247. 3910147. PMID 24375688.
^ a b François (2014).
^ a b Véase Bloomfield 1933, pág. 311; Heggarty et al. (2010); François (2014).
^ Saint Augustine (1948). "XVI: 9–11". Ciudad de Dios.
^ Génesis 10:25
^ 1 Crónicas 1:19.
^ Saint Augustine (Bishop of Hippo.) (1871). Obras de Aurelius Augustine: Una nueva traducción. T. & T. Clark – a través de Google Books.
^ Browne 1684, págs. 223 a 241
^ Browne 1684, p. 224.
^ Browne 1684, pág. 225.
^ Browne 1684, pág. 228.
^ Browne 1684, págs. 226 a 228.
^ Howell, James (1688) [1645]. "Carta LVIII a la derecha honorable el conde R." Epistolae Ho-Elianae, Cartas Familiares, Interior y Forren, Dividido en Cuatro Libros, Parcialmente Histórico, Político, Filosófico, Sobre Ocasiones Emergentes. Vol. II (6a edición). Thomas Guy. p. 356.
^ Jones, William (1807) [1786], "Tercer discurso aniversario, sobre los hindúes", en Lord Teignmouth (ed.), Obras de Sir William Jones con la vida del autor, en 13 volúmenes, vol. III, Londres: John Stockdale y John Walker, págs. 34
^ Young 1813, pág. 251
^ Young 1813, pág. 255
^ Grant, Robert (1813). Un esbozo de la historia de la empresa Este-India, desde su primera formación hasta el paso del acto Regulador de 1773; con una visión resumida de los cambios que han tenido lugar desde ese período en la administración interna de la India británica. Londres: Black, Parry y Co. [etc.] pp. xxxiv–xxxv.
^ Williams, D. M.; Ebach, Malte C.; Nelson, Gareth J. (2008). Fundaciones de sistemática y biogeografía. Nueva York, NY: Springer. p. 45. ISBN 9780387727288.
^ Darwin, Charles (1860). Sobre el origen de las especies por medio de la selección natural, o, La preservación de razas favorecidas en la lucha por la vida. Londres: J. Murray. p. 422. puede valer la pena ilustrar esta visión de clasificación tomando el caso de los idiomas Darwin.
^ Post, David G. (2009). En busca del alce de Jefferson: notas sobre el estado del ciberespacio. Oxford; New York: Oxford University Press. p. 125. ISBN 978-0-19-534289-5.
^ Greenberg, Joseph H. (1990) [1954], "A Quantitative Approach to the Typological Morphology of Language", en Denning, Keith M.; Kemmer, Suzanne (eds.), En el idioma: escritos seleccionados de Joseph H. Greenberg, Stanford: Stanford University Press, pp. 3-4
^ Greenberg, Joseph Harold (1971). Lengua, cultura y comunicación. Stanford: Stanford University Press. p. 113. ISBN 97804707817.
^ Dixon, R. M. W. (1997). The Rise and Fall of Languages by R. M. W. Dixon. Cambridge Core. doi:10.1017/CBO9780511612060. ISBN 9780511612060. Retrieved 2017-09-26.
^ a b Gray, Russell D.; Atkinson, Quentin D. (2003-11-27). "Language-tree Divergence Times Support the Anatolian Theory of Indo-European Origin". Naturaleza. 426 (6965). Nature Publishing Group: 435-9. Bibcode:2003Natur.426..435G. doi:10.1038/nature02029. PMID 14647380. S2CID 42340 – via Google Books.
^ "CPHL: Filogenética Computacional en Linguística Histórica". 2004-2012.
^ Zuckermann, Ghil'ad. 2009. Revivibilidad: múltiples causas, formas y patrones." Journal of Language Contact, Varia 2:40-67.
^ Nakhleh 2005, pág. 383.
^ Nakhleh 2005, pp. 384–385.
^ Los detalles técnicos de los algoritmos utilizados se indican en Nakhleh 2005, Apéndice A. Los datos del conjunto de datos figuran en el Apéndice B.
^ Nakhleh 2005, págs. 388 a 391.
^ Nakhleh 2005, pág. 387.
^ Nakhleh 2005, pág. 396.
^ Nakhleh 2005, pág. 400.
^ Nakhleh 2005, pág. 398.
^ a b Nakhleh 2005, pág. 401.
^ Nakhleh 2005, pág. 407.

Bibliografía

Bloomfield, Leonard (1984) [1933]. Idioma. Chicago y Londres: Universidad de Chicago Press.
Browne, Thomas (1852) [1684], "Miscellany Tracts; Miscellanies; Tract 8, Of Languages, and Particularly of the Saxon Tongue", en Tenison, Thomas (ed.), Las obras de Sir Thomas Browne, Biblioteca Anticuaria de Bohn, vol. III, Lincoln's Inn Fields: Cox (Brothers) y Wyman, págs. 223 a 241.
François, Alexandre (2014), "Trees, Waves y Linkages: Models of Language Diversification" (PDF), en Bowern, Claire; Evans, Bethwyn (eds.), The Routledge Handbook of Historical Linguistics, Londres: Routledge, pp. 161–189, ISBN 978-0-41552-789-789.
Heggarty, Paul; Maguire, Warren; McMahon, abril (2010). "¿Splits o olas? ¿Arboles o telas? Cómo las medidas de divergencia y el análisis de redes pueden desentrañar historias de lenguaje". Transacciones filosóficas de la Sociedad Real B. 365 (1559): 3829–3843. doi:10.1098/rstb.2010.0099. PMC 2981917. PMID 21041208.
Nakhleh, Luay; Ringe, Don; Warnow, Tandy (2005). "Perfect Phylogenetic Networks: A New Methodology for Reconstructing the Evolutionary History of Natural Languages" (PDF). Idioma. 81 (2): 382-420. CiteSeerX 10.1.1.65.1791. doi:10.1353/lan.2005.0078. S2CID 162958.
Young, Thomas (octubre 1813). "La historia general de los idiomas de Adlung". The Quarterly Review. X (XIX Artículo XII). Londres: John Murray: 250–292.

Enlaces externos

Labov, William (2010). "15. La Difusión de Lenguas de Lugar a Lugar". Principios del cambio lingüístico. Vol. 3: Cognition and Cultural Factors. Reino Unido: Wiley-Blackwell – via Scribd.
Santorini, Beatrice; Kroch, Anthony (2007). "Node Relations". La sintaxis del lenguaje natural: Una introducción en línea usando el programa Árboles. Universidad de Pensilvania.

Más resultados...