Estrutura secundária da proteína

format_list_bulleted Contenido keyboard_arrow_down
ImprimirCitar
Protein primary structureProtein secondary structureProtein tertiary structureProtein quaternary structure
The image above contains clickable links
A imagem acima contém links clicáveis
Este diagrama (que é interativo) da estrutura proteica usa PCNA como um exemplo. (PDB: 1AXC)

Estrutura secundária da proteína é a conformação espacial local da estrutura polipeptídica, excluindo as cadeias laterais. Os dois elementos estruturais secundários mais comuns são hélices alfa e folhas beta, embora também ocorram voltas beta e voltas ômega. Os elementos da estrutura secundária normalmente se formam espontaneamente como um intermediário antes que a proteína se dobre em sua estrutura terciária tridimensional.

A estrutura secundária é formalmente definida pelo padrão de ligações de hidrogênio entre os átomos de amino hidrogênio e carboxila de oxigênio na estrutura do peptídeo. A estrutura secundária pode alternativamente ser definida com base no padrão regular de ângulos diédricos da estrutura principal em uma região específica do gráfico de Ramachandran, independentemente de ter as ligações de hidrogênio corretas.

O conceito de estrutura secundária foi introduzido pela primeira vez por Kaj Ulrik Linderstrøm-Lang em Stanford em 1952. Outros tipos de biopolímeros, como ácidos nucleicos, também possuem estruturas secundárias características.

Tipos

Características estruturais das três principais formas de helices proteicas
Atributo Geometria α-helix 310. Helix π-helix
Resíduos por turno3.63.0.4.4
Tradução por resíduo1.5 Å (0,15 nm)(0,20 nm)1.1 Å (0,11 nm)
Raio de hélice2.3 Å (0,23 nm)1,9 Å (0,19 nm)2,8 Å (0,28 nm)
Pitch!5,4 Å (0,54 nm)(0,60 nm)4.8 Å (0.48 nm)
Protein secondary structureBeta sheetAlpha helix
The image above contains clickable links
A imagem acima contém links clicáveis
Diagrama interativo de ligações de hidrogênio na estrutura secundária da proteína. Desenhos animados acima, átomos abaixo com nitrogênio em azul, oxigênio em vermelho (PDB: 1AXC)

As estruturas secundárias mais comuns são alfa-hélices e folhas beta. Outras hélices, como a hélice 310 e a hélice π, são calculadas como tendo padrões de ligação de hidrogênio energeticamente favoráveis, mas raramente são observadas em proteínas naturais, exceto nas extremidades das hélices α devido ao empacotamento desfavorável da estrutura no centro da hélice. Outras estruturas estendidas, como a hélice de poliprolina e a folha alfa, são raras em proteínas do estado nativo, mas são frequentemente consideradas importantes intermediários de dobramento de proteínas. Curvas fechadas e loops soltos e flexíveis unem as curvas mais "regulares" elementos da estrutura secundária. A bobina aleatória não é uma estrutura secundária verdadeira, mas é a classe de conformações que indica ausência de estrutura secundária regular.

Os aminoácidos variam em sua capacidade de formar os vários elementos da estrutura secundária. A prolina e a glicina são às vezes conhecidas como “quebradores de hélices”. porque perturbam a regularidade da conformação da estrutura helicoidal α; no entanto, ambos têm habilidades conformacionais incomuns e são comumente encontrados em turnos. Os aminoácidos que preferem adotar conformações helicoidais nas proteínas incluem metionina, alanina, leucina, glutamato e lisina ("MALEK" em códigos de aminoácidos de 1 letra); em contraste, os grandes resíduos aromáticos (triptofano, tirosina e fenilalanina) e aminoácidos ramificados em C (isoleucina, valina e treonina) preferem adotar conformações de cadeia β. No entanto, estas preferências não são suficientemente fortes para produzir um método fiável de previsão da estrutura secundária apenas a partir da sequência.

Acredita-se que as vibrações coletivas de baixa frequência sejam sensíveis à rigidez local dentro das proteínas, revelando que as estruturas beta são genericamente mais rígidas do que as proteínas alfa ou desordenadas. As medições de espalhamento de nêutrons conectaram diretamente a característica espectral em ~ 1 THz aos movimentos coletivos da estrutura secundária da proteína GFP de barril beta.

Os padrões de ligações de hidrogênio em estruturas secundárias podem ser significativamente distorcidos, o que dificulta a determinação automática da estrutura secundária. Existem vários métodos para definir formalmente a estrutura secundária da proteína (por exemplo, DSSP, DEFINE, STRIDE, ScrewFit, SST).

Classificação DSSP

Distribuição obtida a partir de dataset não redundante pdb_select (março de 2006); Estrutura secundária atribuída pela DSSP; 8 estados conformacionais reduzidos a 3 estados: H=HGI, E=EB, C=STC. Visíveis são misturas de distribuições (gaussianas), resultando também da redução dos estados DSSP.

O Dicionário de Estrutura Secundária de Proteínas, abreviadamente DSSP, é comumente usado para descrever a estrutura secundária de proteínas com códigos de uma única letra. A estrutura secundária é atribuída com base em padrões de ligações de hidrogênio como os inicialmente propostos por Pauling et al. em 1951 (antes de qualquer estrutura proteica ter sido determinada experimentalmente). Existem oito tipos de estrutura secundária que o DSSP define:

  • G = hélice de 3 voltas (310 hélice). Min comprimento 3 resíduos.
  • H = hélice de 4 voltas (α hélice). Comprimento mínimo 4 resíduos.
  • I = hélice de 5 voltas (π helix). Comprimento mínimo 5 resíduos.
  • T = giro ligado a hidrogénio (3, 4 ou 5 turnos)
  • E = fio estendido em conformação paralela e/ou antiparalela β-folha. Min comprimento 2 resíduos.
  • B = resíduo em β-ponte isolado (formação de ligação de hidrogénio em pares únicos β)
  • S = dobra (a única atribuição baseada em não-hidrogênio).
  • C = bobina (residuos que não estão em nenhuma das conformações acima).

'Bobina' é frequentemente codificado como ' ' (espaço), C (bobina) ou '–' (traço). As hélices (G, H e I) e as conformações das folhas devem ter um comprimento razoável. Isto significa que 2 resíduos adjacentes na estrutura primária devem formar o mesmo padrão de ligações de hidrogénio. Se o padrão de ligação de hidrogênio em hélice ou folha for muito curto, eles serão designados como T ou B, respectivamente. Existem outras categorias de atribuição de estrutura secundária de proteínas (curvas acentuadas, voltas Omega, etc.), mas são usadas com menos frequência.

A estrutura secundária é definida por ligações de hidrogênio, portanto a definição exata de uma ligação de hidrogênio é crítica. A definição padrão de ligação de hidrogênio para estrutura secundária é a de DSSP, que é um modelo puramente eletrostático. Ele atribui cargas de ±q1 ≈ 0,42e ao carbono carbonílico e ao oxigênio, respectivamente, e cargas de ±q2< /sub> ≈ 0,20e para a amida, hidrogênio e nitrogênio, respectivamente. A energia eletrostática é

De acordo com o DSSP, uma ligação de hidrogênio existe se e somente se E for menor que −0,5 kcal/mol (−2,1 kJ/mol). Embora a fórmula DSSP seja uma aproximação relativamente grosseira da energia física da ligação de hidrogênio, ela é geralmente aceita como uma ferramenta para definir a estrutura secundária.

Classificação SST

SST é um método Bayesiano para atribuir estrutura secundária a dados de coordenadas de proteínas usando o critério de informação de Shannon de inferência de Comprimento Mínimo de Mensagem (MML). O SST trata qualquer atribuição de estrutura secundária como uma hipótese potencial que tenta explicar (comprimir) determinados dados de coordenadas proteicas. A ideia central é que a melhor atribuição estrutural secundária é aquela que pode explicar (comprimir) as coordenadas de uma determinada proteína da maneira mais econômica, ligando assim a inferência da estrutura secundária para compactação de dados sem perdas. O SST delineia com precisão qualquer cadeia proteica em regiões associadas aos seguintes tipos de atribuição:

  • E = (Extended) fio de um folha de β-pleado
  • G = Mão direita 310 hélices
  • H = Mão direita α-helix
  • I = Mão direita π-helix
  • g = Mão esquerda 310 hélices
  • h = Mão esquerda α-helix
  • i = Esquerda π-helix
  • 3 = 310.- como Turn
  • 4 = α- como Turn
  • 5 = D.como virar
  • T = Turno não especificado
  • C = Bobina
  • - = Resíduos não atribuídos

SST detecta π e 310 tampas helicoidais em α-hélices padrão e monta automaticamente as diversas fios estendidos em folhas β-plissadas consistentes. Ele fornece uma saída legível de elementos estruturais secundários dissecados e um script correspondente carregável em PyMol para visualizar os elementos estruturais secundários atribuídos individualmente.

Determinação experimental

O conteúdo de estrutura secundária áspera de um biopolímero (por exemplo, "esta proteína é 40% de hélice α e 20% de folha β.") pode ser estimado espectroscopicamente. Para proteínas, um método comum é o dicroísmo circular ultravioleta distante (UV distante, 170–250 nm). Um mínimo duplo pronunciado em 208 e 222 nm indica estrutura α-helicoidal, enquanto um mínimo único em 204 nm ou 217 nm reflete estrutura de bobina aleatória ou folha β, respectivamente. Um método menos comum é a espectroscopia infravermelha, que detecta diferenças nas oscilações de ligação dos grupos amida devido à ligação de hidrogênio. Finalmente, o conteúdo da estrutura secundária pode ser estimado com precisão usando os desvios químicos de um espectro de RMN inicialmente não atribuído.

Previsão

Prever a estrutura terciária da proteína apenas a partir de sua sequência de aminoácidos é um problema muito desafiador (ver previsão da estrutura da proteína), mas usar definições mais simples de estrutura secundária é mais tratável.

Os primeiros métodos de predição de estrutura secundária restringiam-se à previsão dos três estados predominantes: hélice, folha ou bobina aleatória. Esses métodos baseavam-se nas propensões de formação de hélices ou folhas de aminoácidos individuais, às vezes juntamente com regras para estimar a energia livre de formação de elementos da estrutura secundária. As primeiras técnicas amplamente utilizadas para prever a estrutura secundária da proteína a partir da sequência de aminoácidos foram o método Chou-Fasman e o método GOR. Embora tais métodos afirmassem atingir aproximadamente 60% de precisão na previsão de qual dos três estados (hélice/folha/bobina) um resíduo adota, avaliações de computação cega mostraram posteriormente que a precisão real era muito menor.

Um aumento significativo na precisão (para quase ~80%) foi obtido explorando o alinhamento de múltiplas sequências; conhecer a distribuição completa dos aminoácidos que ocorrem em uma posição (e em sua vizinhança, normalmente ~7 resíduos de cada lado) ao longo da evolução fornece uma imagem muito melhor das tendências estruturais próximas a essa posição. Por exemplo, uma determinada proteína pode ter uma glicina numa determinada posição, o que por si só pode sugerir uma espiral aleatória ali. No entanto, o alinhamento de múltiplas sequências pode revelar que os aminoácidos favoráveis à hélice ocorrem nessa posição (e em posições próximas) em 95% das proteínas homólogas, abrangendo quase um bilhão de anos de evolução. Além disso, examinando a hidrofobicidade média naquela posição e nas proximidades, o mesmo alinhamento também pode sugerir um padrão de acessibilidade ao solvente do resíduo consistente com uma hélice α. Tomados em conjunto, estes factores sugeririam que a glicina da proteína original adopta uma estrutura α-helicoidal, em vez de uma espiral aleatória. Vários tipos de métodos são usados para combinar todos os dados disponíveis para formar uma previsão de 3 estados, incluindo redes neurais, modelos ocultos de Markov e máquinas de vetores de suporte. Os métodos modernos de previsão também fornecem uma pontuação de confiança para suas previsões em cada posição.

Os métodos de predição de estrutura secundária foram avaliados pelos experimentos de Avaliação Crítica de Predição de Estrutura de Proteína (CASP) e continuamente comparados, por exemplo. pelo EVA (referência). Com base nesses testes, os métodos mais precisos foram Psipred, SAM, PORTER, PROF e SABLE. A principal área de melhoria parece ser a previsão das cadeias β; é provável que os resíduos previstos com segurança como fita β sejam assim, mas os métodos tendem a ignorar alguns segmentos da fita β (falsos negativos). Provavelmente existe um limite superior de aproximadamente 90% de precisão de previsão geral, devido às idiossincrasias do método padrão (DSSP) para atribuir classes de estrutura secundária (hélice/cadeia/bobina) às estruturas PDB, contra as quais as previsões são comparadas.

A previsão precisa da estrutura secundária é um elemento chave na previsão da estrutura terciária, exceto nos casos mais simples (modelagem de homologia). Por exemplo, um padrão previsto com segurança de seis elementos da estrutura secundária βαββαβ é a assinatura de uma dobra de ferredoxina.

Aplicativos

Tanto as estruturas secundárias de proteínas quanto de ácidos nucleicos podem ser usadas para auxiliar no alinhamento de múltiplas sequências. Esses alinhamentos podem ser mais precisos pela inclusão de informações de estrutura secundária além de informações de sequência simples. Às vezes, isso é menos útil no RNA porque o emparelhamento de bases é muito mais conservado do que a sequência. Relações distantes entre proteínas cujas estruturas primárias são desalinhadas às vezes podem ser encontradas pela estrutura secundária.

Foi demonstrado que as hélices α são mais estáveis, robustas a mutações e projetáveis do que as fitas β em proteínas naturais, portanto, projetar proteínas totalmente α funcionais é provavelmente mais fácil do que projetar proteínas com hélices e fitas; isso foi recentemente confirmado experimentalmente.

Contenido relacionado

Teste de Ames

O teste de Ames é um método amplamente empregado que usa bactérias para testar se um determinado produto químico pode causar mutações no DNA do...

Atmosfera (desambiguação)

Uma atmosfera é uma camada de gás em torno de um corpo...

Antimatéria

Na física moderna, a antimatéria é definida como matéria composta de antipartículas das partículas correspondentes em &#034;comum&#034; matéria e pode...
Más resultados...
Tamaño del texto:
undoredo
format_boldformat_italicformat_underlinedstrikethrough_ssuperscriptsubscriptlink
save