12.07.2015 Views

Resumo - capítulo 5 - Predição da estrutura secundária do RNA

Resumo - capítulo 5 - Predição da estrutura secundária do RNA

Resumo - capítulo 5 - Predição da estrutura secundária do RNA

SHOW MORE
SHOW LESS
  • No tags were found...

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

<strong>Resumo</strong> - <strong>capítulo</strong> 5 - <strong>Predição</strong> <strong>da</strong> <strong>estrutura</strong><strong>secundária</strong> <strong>do</strong> <strong>RNA</strong>Pedro Ivo Gomes de FariaSumário1 Introdução 21.1 Fun<strong>da</strong>mentos <strong>da</strong> predição <strong>da</strong> <strong>estrutura</strong> <strong>do</strong> <strong>RNA</strong> . . . . . . . . 21.2 Características <strong>da</strong> <strong>estrutura</strong> <strong>secundária</strong> <strong>do</strong> <strong>RNA</strong> . . . . . . . . 21.3 Limitações <strong>da</strong> predição . . . . . . . . . . . . . . . . . . . . . . 41.4 Desenvolvimento de méto<strong>do</strong>s de predição <strong>do</strong> <strong>RNA</strong> . . . . . . . 42 Méto<strong>do</strong>s 52.1 Regiões autocomplementares em sequências de <strong>RNA</strong> predizema <strong>estrutura</strong> <strong>secundária</strong> . . . . . . . . . . . . . . . . . . . . . . 52.2 Méto<strong>do</strong> <strong>da</strong> energia livre mínima para a predição <strong>da</strong> <strong>estrutura</strong><strong>secundária</strong> <strong>do</strong> <strong>RNA</strong> . . . . . . . . . . . . . . . . . . . . . . . . 52.3 Predições <strong>estrutura</strong>is subótimas pelo MFOLD e uso de gráficosde energia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62.4 Outros algoritmos para o <strong>do</strong>bramento subótimo de moléculasde <strong>RNA</strong> . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72.5 <strong>Predição</strong> <strong>da</strong>s <strong>estrutura</strong>s <strong>secundária</strong>s de <strong>RNA</strong> mais prováveis . 72.6 Usan<strong>do</strong> a covariância de sequências para a predição de <strong>estrutura</strong>s 82.7 Gramáticas livres de contexto estocásticas (SCFGs) para amodelagem <strong>da</strong> <strong>estrutura</strong> <strong>secundária</strong> <strong>do</strong> <strong>RNA</strong> . . . . . . . . . . 92.8 Buscas em genomas por genes que especifiquem <strong>RNA</strong>s . . . . 112.9 Aplicações <strong>da</strong> modelagem <strong>da</strong> <strong>estrutura</strong> <strong>do</strong> <strong>RNA</strong> . . . . . . . . 111


1 IntroduçãoSequências de áci<strong>do</strong>s nucleicos que especificam moléculas de <strong>RNA</strong> não podemser compara<strong>da</strong>s como as sequências proteicas ou as de DNA. Certas variaçõesno <strong>RNA</strong> mantêm padrões de pareamento de bases que dão origem à mesmaconformação de dupla fita (<strong>estrutura</strong> <strong>secundária</strong>) na molécula. Portanto, oalinhamento de duas sequências de <strong>RNA</strong> com o mesmo formato pode mostrarvariação nas posições de interação <strong>do</strong>s pares de bases. Além disso, genes quecodificam moléculas de <strong>RNA</strong> podem ter resíduos similares que reflitam a suaancestrali<strong>da</strong>de comum.1.1 Fun<strong>da</strong>mentos <strong>da</strong> predição <strong>da</strong> <strong>estrutura</strong> <strong>do</strong> <strong>RNA</strong>Um méto<strong>do</strong> para predição <strong>da</strong> <strong>estrutura</strong> <strong>secundária</strong> <strong>do</strong> <strong>RNA</strong> consiste em escolheros conjuntos de pares de bases complementares que resultam nas moléculasenergeticamente mais estáveis. A partir disso, <strong>estrutura</strong>s com energiasquase tão estáveis quanto a mais estável podem ser produzi<strong>da</strong>s, e as regiõescujas predições são as mais confiáveis podem ser identifica<strong>da</strong>s.Outro tipo de méto<strong>do</strong> leva em conta padrões conserva<strong>do</strong>s de pareamentode bases durante a evolução de uma <strong>da</strong><strong>da</strong> classe de moléculas de <strong>RNA</strong>.Posições <strong>da</strong> sequência que pareiam variam ao mesmo tempo (são covariantes)durante a evolução <strong>da</strong>s moléculas de <strong>RNA</strong>, de forma a manter a integri<strong>da</strong>de<strong>estrutura</strong>l. Por exemplo, se duas posições com G e C pareiam em uma <strong>da</strong><strong>da</strong>molécula, considera-se que moléculas com pares C/G, G/C, A/U ou U/A nasposições correspondentes são casamentos razoáveis.1.2 Características <strong>da</strong> <strong>estrutura</strong> <strong>secundária</strong> <strong>do</strong> <strong>RNA</strong>A <strong>estrutura</strong> <strong>secundária</strong> <strong>do</strong> <strong>RNA</strong> pode ser vista como um passo intermediáriona formação <strong>da</strong> <strong>estrutura</strong> tridimensional. Ela é forma<strong>da</strong> por regiões de fitadupla forma<strong>da</strong>s pelo <strong>do</strong>bramento <strong>da</strong> molécula sobre si própria (como ilustra<strong>do</strong>na figura a seguir).2


Figura 1: Tipos de regiões de fita dupla e simples em <strong>estrutura</strong>s <strong>secundária</strong>sde <strong>RNA</strong>.Para que essas regiões ocorram, uma subsequência de bases em um senti<strong>do</strong>precisa ser complementar a outra subsequência de bases no senti<strong>do</strong>oposto. Os principais pares forma<strong>do</strong>s são (em ordem decrescente de estabili<strong>da</strong>demolecular) G/C (três ligações de hidrogênio), A/U (duas ligaçõesde hidrogênio) e G/U (duas ligações de hidrogênio).Além disso, também existem interações terciárias no <strong>RNA</strong> (interaçõesentre <strong>estrutura</strong>s <strong>secundária</strong>s), que não são previsíveis por programas de3


predição <strong>secundária</strong> (mas podem ser encontra<strong>da</strong>s por análise de covariância).1.3 Limitações <strong>da</strong> prediçãoNa predição <strong>da</strong> <strong>estrutura</strong> <strong>secundária</strong> <strong>do</strong> <strong>RNA</strong>, algumas hipóteses simplifica<strong>do</strong>rassão comumente feitas. A primeira delas é a de que a <strong>estrutura</strong> maisprovável é similar à <strong>estrutura</strong> mais estável energeticamente. A segun<strong>da</strong> é ade que a energia associa<strong>da</strong> a um par de bases numa <strong>estrutura</strong> de dupla fitasó é influencia<strong>da</strong> pelo par anterior (e ao por quaisquer outros pares <strong>da</strong> <strong>estrutura</strong>).Finalmente, supõe-se que a <strong>estrutura</strong> seja forma<strong>da</strong> pelo <strong>do</strong>bramento<strong>da</strong> cadeia sobre si própria de forma a não produzir nós.1.4 Desenvolvimento de méto<strong>do</strong>s de predição <strong>do</strong> <strong>RNA</strong>Entre os vários méto<strong>do</strong>s para predição <strong>da</strong> <strong>estrutura</strong> <strong>secundária</strong> <strong>do</strong> <strong>RNA</strong> estáo de Martinez (1984), que considera to<strong>da</strong>s as regiões de dupla fita possíveis.Ca<strong>da</strong> uma delas recebe um peso proporcional à sua constante de equilíbrio,calcula<strong>da</strong> pela função de Boltzmann K eq = exp(−∆G o /RT ) (∆G o é a variaçãode energia livre padrão entre as regiões, R é a constante <strong>do</strong>s gasesperfeitos e T é a temperatura). A molécula de <strong>RNA</strong> é <strong>do</strong>bra<strong>da</strong> por umméto<strong>do</strong> de Monte Carlo no qual uma região é escolhi<strong>da</strong> aleatoriamente deum conjunto com pesos (similar ao méto<strong>do</strong> usa<strong>do</strong> pelo amostra<strong>do</strong>r de Gibbs).Nussinov e Jacobson (1980) foram os primeiros a projetar um algoritmopreciso e eficiente para a predição <strong>da</strong> <strong>estrutura</strong> <strong>secundária</strong>. O algoritmogera duas matrizes de pontuação M (armazena o número máximo de paresde bases que podem ser forma<strong>do</strong>s em qualquer intervalo [i; j] <strong>da</strong> sequência)e K (armazena os pareamentos). A partir dessas matrizes, uma <strong>estrutura</strong>com o número máximo possível de pares de bases pode ser deduzi<strong>da</strong> por umprocedimento que faz o caminho reverso na matriz (similar ao que produz osalinhamentos de sequências via programação dinâmica).O programa MFOLD é comumente usa<strong>do</strong> para prever as <strong>estrutura</strong>s deuma molécula de <strong>RNA</strong> mais estáveis energeticamente, fornecen<strong>do</strong> um conjuntode <strong>estrutura</strong>s possíveis num intervalo de energia e <strong>da</strong>n<strong>do</strong> uma indicaçãode confiabili<strong>da</strong>de. Porém, como o programa possui complexi<strong>da</strong>de de tempoproporcional a N 3 (onde N é o tamanho <strong>da</strong> sequência), ele apenas é usa<strong>do</strong>para moléculas de <strong>RNA</strong> pequenas (até 1000 nucleotídeos).4


2 Méto<strong>do</strong>s2.1 Regiões autocomplementares em sequências de <strong>RNA</strong>predizem a <strong>estrutura</strong> <strong>secundária</strong>Regiões autocomplementares no <strong>RNA</strong> (que podem se hibridizar para formarregiões de fita dupla) podem ser encontra<strong>da</strong>s por uma matriz de pontos. Emum <strong>do</strong>s méto<strong>do</strong>s para isso, a sequência original é disposta no eixo horizontale o seu complemento (desconsideran<strong>do</strong> os pares G/U) no eixo vertical (ambasno senti<strong>do</strong> 5 ′ → 3 ′ ). Pontuan<strong>do</strong> a matriz nas posições em que o nucleotídeo<strong>da</strong> linha é igual ao <strong>da</strong> coluna, as regiões autocomplementares irão aparecercomo diagonais que se dirigem <strong>da</strong> parte superior esquer<strong>da</strong> para a inferiordireita. Como existem muitos casamentos aleatórios entre as quatro bases<strong>do</strong> <strong>RNA</strong>, é necessário usar uma janela larga com eleva<strong>da</strong> estringência parafiltrá-los (como o que é feito com sequências de DNA).2.2 Méto<strong>do</strong> <strong>da</strong> energia livre mínima para a predição<strong>da</strong> <strong>estrutura</strong> <strong>secundária</strong> <strong>do</strong> <strong>RNA</strong>Para predizer a <strong>estrutura</strong> <strong>secundária</strong> <strong>do</strong> <strong>RNA</strong>, ca<strong>da</strong> base é compara<strong>da</strong> a to<strong>da</strong>sas outras por uma análise similar à <strong>da</strong> matriz de pontos. A mesma sequênciaé lista<strong>da</strong> nos <strong>do</strong>is eixos <strong>da</strong> matriz, e as bases complementares são marca<strong>da</strong>spara identificar possíveis regiões de dupla fita. A energia de ca<strong>da</strong> <strong>estrutura</strong>prevista é estima<strong>da</strong> pela regra <strong>do</strong> vizinho mais próximo, soman<strong>do</strong> <strong>do</strong>is tiposde energias:1. as energias negativas acumula<strong>da</strong>s para ca<strong>da</strong> par de bases na região defita dupla;2. as energias positivas desestabiliza<strong>do</strong>ras <strong>da</strong>s outras regiões (como laçosou saliências).Para calcular a energia acumula<strong>da</strong> de pares de bases consecutivos, umatabela semelhante à ilustra<strong>da</strong> a seguir é utiliza<strong>da</strong>.5


Figura 2: A) Energia acumula<strong>da</strong> para uma região de dupla fita quan<strong>do</strong> o parlista<strong>do</strong> na linha é segui<strong>do</strong> pelo par lista<strong>do</strong> na coluna. B) Energias desestabiliza<strong>do</strong>rasassocia<strong>da</strong>s a laços ou saliências.2.3 Predições <strong>estrutura</strong>is subótimas pelo MFOLD euso de gráficos de energiaOriginalmente, o programa FOLD apenas previa uma <strong>estrutura</strong> <strong>secundária</strong>de <strong>RNA</strong> (a que tinha energia livre mínima). Uma versão posterior (MFOLD)é capaz de prever várias <strong>estrutura</strong>s com energias próximas <strong>do</strong> mínimo possível.Para encontrá-las, o méto<strong>do</strong> de programação dinâmica foi modifica<strong>do</strong>para avaliar partes de uma nova matriz de pontuação, na qual a sequência érepresenta<strong>da</strong> em duas cópias (uma no eixo horizontal e outra na vertical).As regiões de i = 1 a n e j = 1 a n são usa<strong>da</strong>s para calcular a energiaV (i, j) <strong>da</strong> melhor <strong>estrutura</strong> que inclui o par de bases i,j (por isso é chama<strong>da</strong>de região incluí<strong>da</strong>). Uma segun<strong>da</strong> região (a região excluí<strong>da</strong>) é usa<strong>da</strong> paracalcular a energia <strong>da</strong> melhor <strong>estrutura</strong> que inclui i,j mas não é deriva<strong>da</strong> <strong>da</strong><strong>estrutura</strong> em i + 1, j − 1. Após certas correções, a diferença entre os valoresincluí<strong>do</strong>s e excluí<strong>do</strong>s é a <strong>estrutura</strong> mais energética que inclui o par i,j.6


2.4 Outros algoritmos para o <strong>do</strong>bramento subótimo demoléculas de <strong>RNA</strong>Um algoritmo originalmente descrito por Waterman e Byers (1985) é capazde encontrar alinhamentos de sequência dentro de um limite a partir <strong>do</strong> ótimo(a partir de modificações no procedimento que faz o caminho reverso na matrizde programação dinâmica). O méto<strong>do</strong> consegue calcular eficientementevárias <strong>estrutura</strong>s alternativas que estejam em um <strong>da</strong><strong>do</strong> limite a partir <strong>da</strong> <strong>estrutura</strong>de energia mínima (o que é uma limitação <strong>do</strong> programa MFOLD). Ométo<strong>do</strong> foi usa<strong>do</strong> para demonstrar que várias sequências naturais de <strong>RNA</strong>tpodem formar várias <strong>estrutura</strong>s alternativas que estão próximas <strong>da</strong> <strong>estrutura</strong>de energia livre mínima, e que a modificação <strong>da</strong>s bases possui um papelimportante nessa estabili<strong>da</strong>de energética.2.5 <strong>Predição</strong> <strong>da</strong>s <strong>estrutura</strong>s <strong>secundária</strong>s de <strong>RNA</strong> maisprováveisUm mo<strong>do</strong> diferente de prever <strong>estrutura</strong>s é considerar a probabili<strong>da</strong>de de queca<strong>da</strong> região parea<strong>da</strong> seja forma<strong>da</strong> basean<strong>do</strong>-se em princípios termodinâmicose na mecânica estatística. A possibili<strong>da</strong>de de formar uma região com energialivre ∆G é expressa pela distribuição de Boltzmann, que diz que ela éproporcional a exp(−∆G/kT ) (onde k é a constante de Boltzmann e T é atemperatura absoluta).Para um conjunto de esta<strong>do</strong>s <strong>estrutura</strong>is possíveis, a soma <strong>da</strong>s possibili<strong>da</strong>desfornece uma função de partição que pode ser usa<strong>da</strong> para normaliza-las,resultan<strong>do</strong> na probabili<strong>da</strong>de de ocorrência de ca<strong>da</strong> uma. Portanto, a probabili<strong>da</strong>dede eu uma <strong>estrutura</strong> A (com energia ∆G a ) ocorra é exp(−∆G a /kT )/Q,onde Q = ∑ s exp(−∆G s /kT ) (com s percorren<strong>do</strong> to<strong>do</strong> o conjunto de <strong>estrutura</strong>spossíveis).A chave para essa análise é o cálculo <strong>da</strong> função de partição Q. Comoexistem muitas <strong>estrutura</strong>s possíveis, o cálculo é simplifica<strong>do</strong> utilizan<strong>do</strong> umafunção auxiliar Q b (i, j) (que é a soma <strong>da</strong>s probabili<strong>da</strong>des de to<strong>da</strong>s as <strong>estrutura</strong>sque incluem o par de bases i,j). A função de partição Q(i, j) incluitanto Q b (i, j) quanto as probabili<strong>da</strong>des <strong>da</strong>s <strong>estrutura</strong>s em que i não estáparea<strong>do</strong> com j.Para ilustrar a diferença entre os méto<strong>do</strong>s <strong>da</strong> energia livre mínima e <strong>da</strong>função de partição, consideremos que as bases nas posições i + 1, j − 1 ei,j formem pares (os <strong>do</strong>is pares são adjacentes). No méto<strong>do</strong> <strong>da</strong> energia livremínima, a energia <strong>do</strong> par i + 1, j − 1 segui<strong>do</strong> pelo par i,j será adiciona<strong>da</strong> aV (i + 1, j − 1) para calcular V (i, j) (onde V é uma matriz de pontuação quearmazena a melhor <strong>estrutura</strong> que possui o par i,j). Por outro la<strong>do</strong>, Q b (i, j)7


será calcula<strong>do</strong> pelo produto de Q b (i + 1, j − 1) por exp(−∆G/kT ) (onde ∆Gé a energia acumula<strong>da</strong> <strong>do</strong> par i + 1, j − 1 segui<strong>do</strong> pelo par i,j). A partir <strong>da</strong>í,Q b (i, j) e Q(i, j) são calcula<strong>do</strong>s iterativamente em uma matriz de pontuaçãoaté que o valor Q(1, n) = Q seja atingi<strong>do</strong>.2.6 Usan<strong>do</strong> a covariância de sequências para a prediçãode <strong>estrutura</strong>sO segun<strong>do</strong> méto<strong>do</strong> mais usa<strong>do</strong> para fazer predições <strong>da</strong> <strong>estrutura</strong> <strong>secundária</strong><strong>do</strong> <strong>RNA</strong> (e também análise de <strong>estrutura</strong>s terciárias) é a análise de covariância.O méto<strong>do</strong> examina sequências <strong>da</strong>s mesmas moléculas de <strong>RNA</strong> de espéciesdiferentes para buscar posições que variem juntas (pois isso é uma evidênciade que elas possam interagir), de mo<strong>do</strong> a fazer com que formem um parde bases em to<strong>da</strong>s as moléculas. Mu<strong>da</strong>nças de sequências que ocorrem nasregiões de dupla fita <strong>do</strong> <strong>RNA</strong> devem manter o pareamento, mas as regiõesde fita simples não possuem essa restrição. A justificativa para o méto<strong>do</strong> é ade que esse tipo de substituição conjunta (ou covariância) ocorre durante aevolução de tais genes.Os passos gerais <strong>da</strong> análise de covariância em sequências de <strong>RNA</strong> são osseguintes:1. alinhe os pares de sequência de mo<strong>do</strong> ótimo para identificar padrõescomplementares que representam uma <strong>estrutura</strong> <strong>secundária</strong> em potencial;2. faça algo análogo ao passo anterior, mas a partir de um alinhamentomúltiplo;3. faça uma análise estatística (teste de chi-quadra<strong>do</strong>) <strong>do</strong> número de observaçõesde um par de bases em particular nas colunas i e j <strong>do</strong> alinhamentomúltiplo, compara<strong>do</strong> ao número espera<strong>do</strong> basea<strong>do</strong> na frequência<strong>da</strong>s duas bases;4. calcule a pontuação <strong>da</strong> informação mútua para ca<strong>da</strong> par de colunas<strong>do</strong> alinhamento. Sen<strong>do</strong> f i (B k ) a frequência <strong>da</strong> base B k na coluna i ef i,j (B m , B n ) a frequência conjunta <strong>da</strong>s bases B m e B n , o conteú<strong>do</strong> deinformação mútua entre as colunas m e n é <strong>da</strong><strong>do</strong> porH(m.n) = ∑B 1 ,B 2f m,n (B 1 , B 2 ) × log 2 {f m,n (B 1 , B 2 )/[f m (B 1 )f n (B 2 )]}8


5. calcule o número de mu<strong>da</strong>nças em ca<strong>da</strong> par de colunas <strong>do</strong> alinhamentodividi<strong>do</strong> pelo número total de mu<strong>da</strong>nças (pontuação ec), examine ocontexto filogenético dessas mu<strong>da</strong>nças (para determinar o número devezes que elas ocorreram durante a evolução) e escolha as pontuaçõesmais altas que são representativas dessas mu<strong>da</strong>nças;6. meça a covariância de ca<strong>da</strong> par de posições <strong>do</strong> alinhamento (contan<strong>do</strong>os números de to<strong>da</strong>s as 16 combinações possíveis de pares de bases edividin<strong>do</strong> pelo número espera<strong>do</strong> de ca<strong>da</strong> combinação), escolha o parpre<strong>do</strong>minante e some as frequências de to<strong>do</strong>s os sítios que covariemindependentemente para obter a pontuação de covariância.Uma dificul<strong>da</strong>de encontra<strong>da</strong> na modelagem de moléculas de <strong>RNA</strong> é aidentificação de pares de bases em potencial num conjunto de moléculas de<strong>RNA</strong> relaciona<strong>da</strong>s, basean<strong>do</strong>-se na covariância entre <strong>do</strong>is sítios. O modelousa<strong>do</strong> para analisar a <strong>estrutura</strong> <strong>secundária</strong> <strong>do</strong> <strong>RNA</strong> é o de árvore ordena<strong>da</strong>.Para construí-lo, começa-se com um modelo mais geral, que é treina<strong>do</strong> comum conjunto de sequências. Posteriormente, pode-se usar o modelo treina<strong>do</strong>para revelar as regiões que se pareiam com maior probabili<strong>da</strong>de ou parafazer uma busca em banco de <strong>da</strong><strong>do</strong>s por sequências que produzam uma altapontuação quan<strong>do</strong> alinha<strong>da</strong>s ao modelo.2.7 Gramáticas livres de contexto estocásticas (SCFGs)para a modelagem <strong>da</strong> <strong>estrutura</strong> <strong>secundária</strong> <strong>do</strong> <strong>RNA</strong>Uma teoria geral para modelar sequências de símbolos (como as bases noDNA) foi desenvolvi<strong>da</strong> por linguistas. Uma gramática livre de contexto éapropria<strong>da</strong> para encontrar grupos de símbolos em partes diferentes <strong>da</strong> sequência(e, portanto, não estão no mesmo contexto). Regiões complementares emsequências (como as que formam as <strong>estrutura</strong>s <strong>secundária</strong>s <strong>do</strong> <strong>RNA</strong>) são exemplosde tais sequências livres de contexto. As gramáticas livres de contextoestocásticas introduzem incerteza na definição de tais regiões (permitin<strong>do</strong> autilização de símbolos alternativos, como ocorre na evolução e moléculas de<strong>RNA</strong>), e por isso definem tanto os tipos de interação entre as bases como asvariações nessas posições.A gramática livre de contexto estabelece uma série de regras (chama<strong>da</strong>sde produções) para gerar a sequência a partir <strong>do</strong> alfabeto (nesse caso, umamolécula de <strong>RNA</strong> com seções que podem parear ou não). Além <strong>do</strong>s símbolos<strong>da</strong> sequências (os terminais) , outro conjunto de símbolos (os não-terminais,designa<strong>do</strong>s por S 0 , S 1 , S 2 , . . .) determinam os estágios intermediários <strong>da</strong>s produções.Em uma SCFG, ca<strong>da</strong> produção de um símbolo não-terminal possui9


uma probabili<strong>da</strong>de associa<strong>da</strong> de resultar no produto. Por exemplo, a produçãoS 1 → CS 2 G também poderia ser representa<strong>da</strong> por outras 15 combinaçõesde pares de bases (ca<strong>da</strong> uma com sua probabili<strong>da</strong>de correspondente).Portanto, ca<strong>da</strong> produção é representa<strong>da</strong> por uma distribuição de probabili<strong>da</strong>dessobre os resulta<strong>do</strong>s possíveis.Figura 3: Exemplo de análise <strong>da</strong> sequência CAUCAGGGAAGAUCUCUUG.A) Definição <strong>da</strong> gramática. B) Uma possível derivação para a sequência. C)Árvore de análise sintática <strong>da</strong> derivação. D) Estrutura <strong>secundária</strong> correspondenteà derivação.10


2.8 Buscas em genomas por genes que especifiquem<strong>RNA</strong>sUm <strong>do</strong>s objetivos <strong>da</strong> pesquisa de <strong>RNA</strong>s é desenvolver méto<strong>do</strong>s para identificarsequências genômicas que codifiquem moléculas de <strong>RNA</strong> pequenas (como<strong>RNA</strong>ts e sno<strong>RNA</strong>s). Moléculas grandes e altamente conserva<strong>da</strong>s podem seridentifica<strong>da</strong>s com base na similari<strong>da</strong>de com sequências já conheci<strong>da</strong>s, mas esseméto<strong>do</strong> não funciona para sequências pequenas ou com maior variação. Umgrande problema <strong>do</strong>s méto<strong>do</strong>s disponíveis para isso está na busca em genomasextensos, pois mesmo os que possuem uma taxa pequena de falsos positivostornam-se inviáveis (pois existem muitos falsos positivos para verificar).2.9 Aplicações <strong>da</strong> modelagem <strong>da</strong> <strong>estrutura</strong> <strong>do</strong> <strong>RNA</strong>Em suma, os méto<strong>do</strong>s para a predição <strong>da</strong> <strong>estrutura</strong> de moléculas de <strong>RNA</strong>incluem:1. análise de to<strong>da</strong>s as combinações possíveis de regiões de fita dupla porméto<strong>do</strong>s de minimização de energia;2. identificação <strong>da</strong> covariância de bases que mantêm as <strong>estrutura</strong>s <strong>secundária</strong>e terciária de uma molécula de <strong>RNA</strong> durante a evolução.11

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!