Familia de genes

Una familia de genes es un conjunto de varios genes similares, formados por la duplicación de un único gen original, y generalmente con funciones bioquímicas similares. Una de esas familias son los genes de las subunidades de hemoglobina humana; Los diez genes están en dos grupos en cromosomas diferentes, llamados loci de globina α y globina β. Se cree que estos dos grupos de genes surgieron como resultado de la duplicación de un gen precursor hace aproximadamente 500 millones de años.
Los genes se clasifican en familias según secuencias de proteínas o nucleótidos compartidas. Las técnicas filogenéticas se pueden utilizar como prueba más rigurosa. Las posiciones de los exones dentro de la secuencia codificante se pueden utilizar para inferir una ascendencia común. Conocer la secuencia de la proteína codificada por un gen puede permitir a los investigadores aplicar métodos que encuentren similitudes entre secuencias de proteínas que proporcionen más información que las similitudes o diferencias entre secuencias de ADN.
Si los genes de una familia de genes codifican proteínas, el término familia de proteínas se utiliza a menudo de manera análoga a familia de genes.
La expansión o contracción de familias de genes a lo largo de un linaje específico puede deberse al azar o puede ser el resultado de seleccion natural. En la práctica suele resultar difícil distinguir entre estos dos casos. El trabajo reciente utiliza una combinación de modelos estadísticos y técnicas algorítmicas para detectar familias de genes que se encuentran bajo el efecto de la selección natural.
El Comité de Nomenclatura Genética de HUGO (HGNC) crea esquemas de nomenclatura utilizando un "tallo" (o "raíz") símbolo para los miembros de una familia de genes (por homología o función), con un sistema de numeración jerárquico para distinguir los miembros individuales. Por ejemplo, para la familia de las peroxiredoxinas, PRDX es el símbolo raíz y los miembros de la familia son PRDX1, PRDX2, PRDX3, PRDX4, PRDX5 y PRDX6.
Estructura básica

Un nivel de organización del genoma es la agrupación de genes en varias familias de genes. Las familias de genes son grupos de genes relacionados que comparten un ancestro común. Los miembros de familias de genes pueden ser parálogos u ortólogos. Los parálogos de genes son genes con secuencias similares dentro de la misma especie, mientras que los ortólogos de genes son genes con secuencias similares en diferentes especies. Las familias de genes son muy variables en tamaño, diversidad de secuencias y disposición. Dependiendo de la diversidad y funciones de los genes dentro de la familia, las familias pueden clasificarse como familias multigénicas o superfamilias.
Las familiasmultigénicas normalmente constan de miembros con secuencias y funciones similares, aunque un alto grado de divergencia (a nivel de secuencia y/o funcional) no conduce a la eliminación de un gen de otro gen. familia. Los genes individuales de la familia pueden estar dispuestos muy juntos en el mismo cromosoma o dispersos por todo el genoma en cromosomas diferentes. Debido a la similitud de sus secuencias y sus funciones superpuestas, los genes individuales de la familia a menudo comparten elementos de control regulatorio. En algunos casos, los miembros del gen tienen secuencias idénticas (o casi idénticas). Estas familias permiten que se expresen cantidades masivas de productos genéticos en poco tiempo, según sea necesario. Otras familias permiten que productos similares pero específicos se expresen en diferentes tipos de células o en diferentes etapas del desarrollo de un organismo.
Lassuperfamilias son mucho más grandes que las familias multigénicas individuales. Las superfamilias contienen hasta cientos de genes, incluidas múltiples familias multigénicas, así como miembros de genes únicos e individuales. La gran cantidad de miembros permite que las superfamilias estén ampliamente dispersas, con algunos genes agrupados y otros muy dispersos. Los genes son diversos en secuencia y función y muestran varios niveles de expresión y controles de regulación separados.
Algunas familias de genes también contienen pseudogenes, secuencias de ADN que se parecen mucho a secuencias de genes establecidas pero que no son funcionales. Existen diferentes tipos de pseudogenes. Los pseudogenes no procesados son genes que adquirieron mutaciones con el tiempo y se volvieron no funcionales. Los pseudogenes procesados son genes que han perdido su función después de moverse por el genoma mediante retrotransposición. Los pseudogenes que se han aislado de la familia de genes en la que se originaron se denominan huérfanos.
Formación
Las familias de genes surgieron de múltiples duplicaciones de un gen ancestral, seguidas de mutaciones y divergencias. Las duplicaciones pueden ocurrir dentro de un linaje (por ejemplo, los humanos pueden tener dos copias de un gen que se encuentra solo una vez en los chimpancés) o son el resultado de la especiación. Por ejemplo, un solo gen en el antepasado de los humanos y los chimpancés ahora aparece en ambas especies y se puede considerar que ha sido 'duplicado' vía especiación. Como resultado de la duplicación por especiación, una familia de genes podría incluir 15 genes, una copia en cada una de las 15 especies diferentes.
Duplicación
En la formación de familias de genes, existen cuatro niveles de duplicación: 1) duplicación y mezcla de exones, 2) duplicación de genes completos, 3) duplicación de familias multigénicas y 4) duplicación de genes completos. La duplicación y mezcla de exones da lugar a variaciones y nuevos genes. Luego, los genes se duplican para formar familias multigénicas que se duplican para formar superfamilias que abarcan múltiples cromosomas. La duplicación del genoma completo duplica el número de copias de cada gen y familia de genes. La duplicación o poliploidización del genoma completo puede ser autopoliploidización o aloploidización. La autopoliploidización es la duplicación del mismo genoma y la alopoliploidización es la duplicación de dos genomas estrechamente relacionados o genomas hibridados de diferentes especies.
La duplicación se produce principalmente a través del cruce desigual de eventos en la meiosis de las células germinales. (1,2) Cuando dos cromosomas se desalinean, el cruce (el intercambio de alelos genéticos) da como resultado que un cromosoma se expanda o aumente en número de genes y el otro se contraiga o disminuya en número de genes. La expansión de un grupo de genes es la duplicación de genes que conduce a familias de genes más grandes.
Reubicación
Los genes miembros de una familia multigénica o de familias multigénicas dentro de superfamilias existen en diferentes cromosomas debido a la reubicación de esos genes después de la duplicación del gen ancestral. Los elementos transponibles desempeñan un papel en el movimiento de los genes. Los elementos transponibles se reconocen por repeticiones invertidas en sus 5' y 3' termina. Cuando dos elementos transponibles están lo suficientemente cerca en la misma región de un cromosoma, pueden formar un transposón compuesto. La proteína transposasa reconoce las repeticiones invertidas más externas y corta el segmento de ADN. Cualquier gen entre los dos elementos transponibles se reubica cuando el transposón compuesto salta a una nueva área del genoma.
La transcripción inversa es otro método de movimiento genético. Una transcripción de ARNm de un gen se transcribe de forma inversa o se copia nuevamente en ADN. Esta nueva copia de ADN del ARNm se integra en otra parte del genoma, lo que da como resultado la dispersión de los miembros de la familia de genes.
Un tipo especial de familia multigénica está implicado en el movimiento de familias de genes y miembros de familias de genes. LINE (elementos INintercalados Largos) y SINE ( Las familias de elementos cortos IN dispersos) son secuencias de ADN altamente repetitivas repartidas por todo el genoma. Los LINE contienen una secuencia que codifica una proteína transcriptasa inversa. Esta proteína ayuda a copiar las transcripciones de ARN de LINE y SINE nuevamente en el ADN y las integra en diferentes áreas del genoma. Esto perpetúa el crecimiento de las familias LINE y SINE. Debido a la naturaleza altamente repetitiva de estos elementos, los LINE y SINE cuando están muy juntos también desencadenan eventos de cruce desigual que resultan en duplicaciones de un solo gen y la formación de familias de genes.
Divergencia
Las mutaciones no sinónimas que resultan en la sustitución de aminoácidos, aumentan las copias duplicadas de genes. La duplicación da lugar a múltiples copias del mismo gen, lo que proporciona un nivel de redundancia en el que se toleran las mutaciones. Con una copia funcional del gen, otras copias pueden adquirir mutaciones sin ser extremadamente perjudiciales para los organismos. Las mutaciones permiten que genes duplicados adquieran funciones nuevas o diferentes.
Evolución concertada
Algunas familias multigénicas son extremadamente homogéneas y los miembros de genes individuales comparten secuencias idénticas o casi idénticas. El proceso por el cual las familias de genes mantienen una alta homogeneidad es la evolución concertada. La evolución concertada se produce a través de ciclos repetidos de cruce desigual de eventos y ciclos repetidos de transferencia y conversión de genes. El cruce desigual conduce a la expansión y contracción de familias de genes. Las familias de genes tienen un rango de tamaño óptimo hacia el que actúa la selección natural. La contracción elimina copias de genes divergentes y evita que las familias de genes se vuelvan demasiado grandes. La expansión reemplaza las copias de genes perdidas y evita que las familias de genes se vuelvan demasiado pequeñas. Los ciclos repetidos de transferencia y conversión de genes hacen que los miembros de la familia de genes sean cada vez más similares.
En el proceso de transferencia de genes, la conversión de genes alélicos está sesgada. Los alelos mutantes que se propagan en una familia de genes hacia la homogeneidad son el mismo proceso que el de un alelo ventajoso que se propaga en una población hacia la fijación. La conversión genética también ayuda a crear variación genética en algunos casos.
Evolución
Las familias de genes, que forman parte de una jerarquía de almacenamiento de información en un genoma, desempeñan un papel importante en la evolución y diversidad de los organismos multicelulares. Las familias de genes son grandes unidades de información y variabilidad genética. A lo largo del tiempo evolutivo, las familias de genes se han expandido y contraído, se han formado nuevas familias de genes y algunas se han perdido. En varios linajes evolutivos, los genes se ganan y se pierden a un ritmo relativamente igual. La expansión adaptativa de las familias de genes ocurre cuando la selección natural favorecería copias de genes adicionales. Este es el caso cuando un factor estresante ambiental actúa sobre una especie. La amplificación de genes es más común en bacterias y es un proceso reversible. La contracción adaptativa de familias de genes comúnmente resulta de la acumulación de mutaciones de pérdida de función. Una mutación sin sentido que detiene prematuramente la transcripción genética se fija en la población, lo que provoca la pérdida de genes. Este proceso ocurre cuando los cambios en el medio ambiente hacen que un gen sea redundante.
Nuevas familias de genes se originan a partir de genes huérfanos (pseudogenes aislados). Estos genes aislados se producen por medios diferentes. Un gen duplicado acumula suficientes mutaciones para ser lo suficientemente divergente como para ya no ser reconocido como parte de la familia de genes original, la transferencia horizontal de nuevos genes a un genoma o un nuevo gen se origina de novo a partir de secuencias no codificantes. Estos genes huérfanos pasarían luego por procesos de duplicación, reubicación y divergencia para formar una familia. La muerte de la familia genética ocurre cuando la pérdida de un gen conduce a la pérdida de toda la familia genética. La pérdida continua de genes conduce finalmente a la extinción de la familia de genes. La pérdida de genes puede ser la eliminación de genes o la pérdida completa de su función, convirtiéndose en pseudogenes.
Familia funcional
Además de la clasificación por evolución (familia de genes estructurales), el HGNC también hace que las "familias de genes" por función en su nomenclatura de raíz. Como resultado, una raíz también puede referirse a genes que tienen la misma función, a menudo parte del mismo complejo proteico. Por ejemplo, BRCA1 y BRCA2 son genes no relacionados que reciben su nombre por su papel en el cáncer de mama y RPS2 y RPS3 son proteínas ribosómicas no relacionadas que se encuentran en la misma subunidad pequeña.
El HGNC también mantiene un "grupo de genes" (anteriormente clasificación "familia de genes"). Un gen puede ser miembro de varios grupos y todos los grupos forman una jerarquía. Al igual que con la clasificación de raíces, existen grupos tanto estructurales como funcionales.