Árbol filogenético

Ajustar Compartir Imprimir Citar
diagrama de ramificación de relaciones evolutivas entre organismos
BacteriaArchaeaEukaryotaAquifexThermotogaBacteroides–CytophagaPlanctomyces"Cyanobacteria"ProteobacteriaSpirochetesGram-positivesChloroflexiThermoproteus–PyrodictiumThermococcus celerMethanococcusMethanobacteriumMethanosarcinaHaloarchaeaEntamoebaeSlime moldsAnimalsFungiPlantsCiliatesFlagellatesTrichomonadsMicrosporidiaDiplomonads
Un árbol filogenético basado en genes rRNA, mostrando los tres dominios de la vida: bacterias, arqueas y eukaryota. La rama negra en la parte inferior del árbol filogenético conecta las tres ramas de los organismos vivos al último ancestro común universal. En ausencia de un grupo externo, la raíz es especulativa.
Un árbol de vida altamente resuelto, generado automáticamente, basado en genomas completamente secuenciados.

Un árbol filogenético (también filogenia o árbol evolutivo) es un diagrama ramificado o un árbol que muestra las relaciones evolutivas entre varias especies biológicas o otras entidades basadas en similitudes y diferencias en sus características físicas o genéticas. Toda la vida en la Tierra es parte de un solo árbol filogenético, lo que indica una ascendencia común.

En un árbol filogenético enraizado, cada nodo con descendientes representa el ancestro común más reciente inferido de esos descendientes, y las longitudes de los bordes en algunos árboles pueden interpretarse como estimaciones de tiempo. Cada nodo se denomina unidad taxonómica. Los nodos internos generalmente se denominan unidades taxonómicas hipotéticas, ya que no se pueden observar directamente. Los árboles son útiles en campos de la biología como la bioinformática, la sistemática y la filogenética. Los árboles sin raíz ilustran solo la relación de los nodos de hoja y no requieren que la raíz ancestral sea conocida o inferida.

Historia

La idea de un árbol de la vida surgió de las nociones antiguas de una progresión similar a una escalera desde formas de vida inferiores a superiores (como en la Gran Cadena del Ser). Las primeras representaciones de "ramificación" Los árboles filogenéticos incluyen un "cuadro paleontológico" mostrando las relaciones geológicas entre plantas y animales en el libro Geología elemental, de Edward Hitchcock (primera edición: 1840).

Charles Darwin presentó un "árbol" evolutivo esquemático; en su libro de 1859 Sobre el origen de las especies. Más de un siglo después, los biólogos evolutivos todavía usan diagramas de árbol para representar la evolución porque dichos diagramas transmiten efectivamente el concepto de que la especiación ocurre a través de la división adaptativa y semialeatoria de linajes.

El término filogenética, o filogenia, deriva de las dos palabras griegas antiguas φῦλον (phûlon), que significa "raza, linaje" y γένεσις (génesis), que significa "origen, fuente".

Propiedades

Árbol enraizado

Árbol filogenético roto optimizado para personas ciegas. El punto más bajo del árbol es la raíz, que simboliza el antepasado común universal a todos los seres vivos. El árbol se ramifica en tres grupos principales: Bacteria (la rama izquierda, letras a i), Archea (la rama media, letras j a p) y Eukaryota (la rama derecha, letras q a z). Cada carta corresponde a un grupo de organismos, enumerados a continuación esta descripción. Estas letras y la descripción deben ser convertidas a la fuente Braille, e impresas usando una impresora Braille. La figura puede ser impresa en 3D copiando el archivo png y utilizando Cura u otro software para generar el código G para la impresión 3D.

Un árbol filogenético enraizado (ver dos gráficos en la parte superior) es un árbol dirigido con un nodo único, la raíz, que corresponde al ancestro común más reciente (generalmente imputado) de todas las entidades en las hojas del árbol. El nodo raíz no tiene un nodo principal, pero actúa como el principal de todos los demás nodos del árbol. Por lo tanto, la raíz es un nodo de grado 2, mientras que otros nodos internos tienen un grado mínimo de 3 (donde "grado" aquí se refiere al número total de aristas entrantes y salientes).

El método más común para enraizar árboles es el uso de un grupo externo no controvertido: lo suficientemente cercano como para permitir la inferencia a partir de datos de rasgos o secuenciación molecular, pero lo suficientemente lejano como para ser un grupo externo claro. Otro método es el enraizamiento de punto medio, o también se puede enraizar un árbol usando un modelo de sustitución no estacionario.

Árbol sin raíces

Un árbol filogenético no arraigado para la miosina, una superfamilia de proteínas.

Los árboles sin raíz ilustran la relación de los nodos hoja sin hacer suposiciones sobre la ascendencia. No requieren que la raíz ancestral sea conocida o inferida. Los árboles sin raíz siempre se pueden generar a partir de los que están enraizados simplemente omitiendo la raíz. Por el contrario, inferir la raíz de un árbol sin raíz requiere algún medio para identificar la ascendencia. Esto normalmente se hace incluyendo un grupo externo en los datos de entrada para que la raíz esté necesariamente entre el grupo externo y el resto de los taxones en el árbol, o introduciendo suposiciones adicionales sobre las tasas relativas de evolución en cada rama, como una aplicación de la hipótesis del reloj molecular.

Bifurcación frente a multifurcación

Tanto los árboles enraizados como los no enraizados pueden ser bifurcados o multifurcados. Un árbol bifurcado con raíz tiene exactamente dos descendientes que surgen de cada nodo interior (es decir, forma un árbol binario), y un árbol bifurcado sin raíz toma la forma de un árbol binario sin raíz, un árbol libre con exactamente tres vecinos en cada nodo interno. Por el contrario, un árbol multifurcado enraizado puede tener más de dos hijos en algunos nodos y un árbol multifurcado sin raíz puede tener más de tres vecinos en algunos nodos.

Etiquetado versus no etiquetado

Tanto los árboles enraizados como los no enraizados se pueden etiquetar o no. Un árbol etiquetado tiene valores específicos asignados a sus hojas, mientras que un árbol sin etiqueta, a veces llamado forma de árbol, define solo una topología. Algunos árboles basados en secuencias construidos a partir de un locus genómico pequeño, como Phylotree, presentan nodos internos etiquetados con haplotipos ancestrales inferidos.

Enumeración de árboles

Aumento del número total de árboles filogenéticos como función del número de hojas etiquetadas: árboles binarios no arraigados (rombos azules), árboles binarios arraigados (círculos rojos), y árboles multifurcados o binarios (verde: triángulos). La escala del eje Y es logarítmica.

La cantidad de árboles posibles para una cantidad determinada de nodos de hoja depende del tipo específico de árbol, pero siempre hay más árboles etiquetados que no etiquetados, más árboles multifurcados que bifurcados y más árboles con raíces que sin raíces. La última distinción es la más relevante desde el punto de vista biológico; surge porque hay muchos lugares en un árbol sin raíz para poner la raíz. Para bifurcar árboles etiquetados, el número total de árboles enraizados es:

()2n− − 3)!!=()2n− − 3)!2n− − 2()n− − 2)!{displaystyle (2n-3)! para n≥ ≥ 2{displaystyle ngeq 2}, n{displaystyle n} representa el número de nodos de hoja.

Para bifurcar árboles etiquetados, el número total de árboles sin raíz es:

()2n− − 5)!!=()2n− − 5)!2n− − 3()n− − 3)!{displaystyle (2n-5)! para n≥ ≥ 3{displaystyle ngeq 3}.

Entre los árboles de bifurcación etiquetados, el número de árboles desarraigados con n{displaystyle n} hojas es igual al número de árboles arraigados con n− − 1{displaystyle n-1} hojas.

El número de árboles arraigados crece rápidamente como función del número de consejos. Para 10 consejos, hay más que 34× × 106{displaystyle 34times 10^{6} posibles árboles de bifurcación, y el número de árboles multifurcación aumenta más rápido, con un ca. 7 veces más de los últimos como de los primeros.

Contando árboles.
Etiquetas
hojas
binario
árboles desarraigados
binario
árboles enraizados
Multifurcación
árboles enraizados
Todo lo posible
árboles enraizados
11101
21101
31314
43151126
515105131236
61059451,8072.752
794510.39528.81339.208
810.395135.135524.897660.032
9135.1352.027 02510.791.88712.818.912
102.027 02534.459.425247,678,399282,137,824

Tipos de árboles especiales

Dendrograma de la filogenia de algunas razas de perros

Dendrograma

Un dendrograma es un nombre general para un árbol, ya sea filogenético o no, y por lo tanto también para la representación esquemática de un árbol filogenético.

Cladograma

Un cladograma solo representa un patrón de ramificación; es decir, las longitudes de sus ramas no representan el tiempo o la cantidad relativa de cambio de carácter, y sus nodos internos no representan antepasados.

Un cronograma de Lepidoptera. En este tipo de árbol filogenético, las longitudes de rama son proporcionales al tiempo geológico.

Filograma

Un filograma es un árbol filogenético que tiene longitudes de rama proporcionales a la cantidad de cambio de carácter.

Un cronograma es un árbol filogenético que representa explícitamente el tiempo a través de las longitudes de sus ramas.

Dahlgrenograma

Un dahlgrenograma es un diagrama que representa una sección transversal de un árbol filogenético.

Red filogenética

Una red filogenética no es estrictamente un árbol, sino un grafo más general, o un grafo acíclico dirigido en el caso de redes con raíces. Se utilizan para superar algunas de las limitaciones inherentes a los árboles.

Diagrama de husillo

Un diagrama de husillo, mostrando la evolución de los vertebrados a nivel de clase, ancho de husillos indicando número de familias. Los diagramas de husillo se utilizan a menudo en la taxonomía evolutiva.

Un diagrama de huso, o diagrama de burbujas, a menudo se denomina romerograma, después de que el paleontólogo estadounidense Alfred Romer lo popularizara. Representa la diversidad taxonómica (ancho horizontal) frente al tiempo geológico (eje vertical) para reflejar la variación de la abundancia de varios taxones a lo largo del tiempo. Sin embargo, un diagrama de huso no es un árbol evolutivo: los husos taxonómicos oscurecen las relaciones reales del taxón padre con el taxón hijo y tienen la desventaja de involucrar la parafilia del grupo parental. Este tipo de diagrama ya no se usa en la forma originalmente propuesta.

Coral de la vida

El Coral de la Vida

Darwin también mencionó que el coral puede ser una metáfora más adecuada que el árbol. De hecho, los corales filogenéticos son útiles para retratar la vida pasada y presente, y tienen algunas ventajas sobre los árboles (se permiten anastomosis, etc.).

Construcción

Los árboles filogenéticos compuestos con un número no trivial de secuencias de entrada se construyen utilizando métodos filogenéticos computacionales. Los métodos de matriz de distancia, como la unión de vecinos o UPGMA, que calculan la distancia genética a partir de múltiples alineaciones de secuencias, son los más simples de implementar, pero no invocan un modelo evolutivo. Muchos métodos de alineación de secuencias, como ClustalW, también crean árboles mediante el uso de algoritmos más simples (es decir, aquellos basados en la distancia) de construcción de árboles. La parsimonia máxima es otro método simple para estimar árboles filogenéticos, pero implica un modelo implícito de evolución (es decir, parsimonia). Los métodos más avanzados utilizan el criterio de optimización de máxima verosimilitud, a menudo dentro de un marco bayesiano, y aplican un modelo explícito de evolución a la estimación del árbol filogenético. Identificar el árbol óptimo utilizando muchas de estas técnicas es NP-difícil, por lo que se utilizan métodos heurísticos de búsqueda y optimización en combinación con funciones de puntuación de árboles para identificar un árbol razonablemente bueno que se ajuste a los datos.

Los métodos de creación de árboles se pueden evaluar sobre la base de varios criterios:

Las técnicas de construcción de árboles también han llamado la atención de los matemáticos. Los árboles también se pueden construir utilizando la teoría T.

Formatos de archivo

Los árboles se pueden codificar en varios formatos diferentes, todos los cuales deben representar la estructura anidada de un árbol. Pueden o no codificar longitudes de rama y otras características. Los formatos estandarizados son fundamentales para distribuir y compartir árboles sin depender de la salida de gráficos que es difícil de importar al software existente. Los formatos más utilizados son

Limitaciones del análisis filogenético

Aunque los árboles filogenéticos producidos sobre la base de genes secuenciados o datos genómicos en diferentes especies pueden proporcionar información evolutiva, estos análisis tienen importantes limitaciones. Lo que es más importante, los árboles que generan no son necesariamente correctos; no necesariamente representan con precisión la historia evolutiva de los taxones incluidos. Al igual que con cualquier resultado científico, están sujetos a falsificación por estudios adicionales (p. ej., recopilación de datos adicionales, análisis de los datos existentes con métodos mejorados). Los datos en los que se basan pueden ser ruidosos; el análisis puede confundirse por la recombinación genética, la transferencia horizontal de genes, la hibridación entre especies que no eran vecinas más cercanas en el árbol antes de que se produzca la hibridación, la evolución convergente y las secuencias conservadas.

Además, hay problemas al basar un análisis en un solo tipo de carácter, como un solo gen o proteína o solo en análisis morfológico, porque tales árboles construidos a partir de otra fuente de datos no relacionada a menudo difieren del primero y, por lo tanto, son muy buenos. se necesita cuidado al inferir relaciones filogenéticas entre especies. Esto es más cierto en el caso del material genético que está sujeto a la transferencia lateral de genes y la recombinación, donde diferentes bloques de haplotipos pueden tener diferentes historias. En estos tipos de análisis, el árbol de salida de un análisis filogenético de un solo gen es una estimación de la filogenia del gen (es decir, un árbol de genes) y no de la filogenia de los taxones (es decir, el árbol de especies) de donde provienen estos caracteres. fueron muestreados, aunque idealmente, ambos deberían estar muy cerca. Por esta razón, los estudios filogenéticos serios generalmente usan una combinación de genes que provienen de diferentes fuentes genómicas (por ejemplo, de genomas mitocondriales o plástidos versus genomas nucleares), o genes que se espera que evolucionen bajo diferentes regímenes selectivos, de modo que la homoplasia (falso homología) sería poco probable que resultara de la selección natural.

Cuando las especies extintas se incluyen como nodos terminales en un análisis (en lugar de, por ejemplo, restringir los nodos internos), se considera que no representan antepasados directos de ninguna especie existente. Las especies extintas no suelen contener ADN de alta calidad.

La gama de materiales de ADN útiles se ha ampliado con los avances en las tecnologías de extracción y secuenciación. El desarrollo de tecnologías capaces de inferir secuencias a partir de fragmentos más pequeños, o de patrones espaciales de productos de degradación del ADN, ampliaría aún más la gama de ADN que se considera útil.

Los árboles filogenéticos también se pueden inferir a partir de una variedad de otros tipos de datos, incluida la morfología, la presencia o ausencia de tipos particulares de genes, eventos de inserción y eliminación, y cualquier otra observación que se crea que contiene una señal evolutiva.

Las redes filogenéticas se utilizan cuando los árboles bifurcados no son adecuados, debido a estas complicaciones que sugieren una historia evolutiva más reticulada de los organismos muestreados.