13.07.2015 Views

Biotecnologia Ciência & Desenvolvimento - nº 37 1

Biotecnologia Ciência & Desenvolvimento - nº 37 1

Biotecnologia Ciência & Desenvolvimento - nº 37 1

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

ubíquos) é inferior a 100, envolvendoprincipalmente os genes responsáveispelos processos de tradução (na grandemaioria), transcrição e replicação/reparo do DNA (Koonin 2003). Este númeroincrivelmente pequeno de genespresumidamente compartilhados entreos diversos organismos sugere que inúmerasfunções essenciais (e tambémnão-essenciais) - que obviamente variamde acordo com as condições nasquais uma dada espécie ou populaçãotem de sobreviver (estilo de vida e nichoecológico) - são desempenhadaspor genes que mantêm entre si relaçõesde parentesco distante (parálogos originadospor duplicações ancestrais ouque evoluíram muito rapidamente, muitasvezes divergindo ao ponto de nãopoderem mais ser reconhecidos comotais) ou que não dividem ancestralidadealguma (análogos) (Koonin et al 1996),ou ainda por genes taxonomicamenterestritos, isto é, exclusivos de uma espécie,família ou linhagem em particular(genes únicos).De um ponto de vista aplicado,tecnologias de alto desempenho(genômica, transcriptômica eproteômica) possibilitam que pesquisadores,através de análises e mineraçãocriteriosas de dados, aumentem nãosomente nosso conhecimento sobre abiologia dos seres vivos, mas tambémsejam capazes de desenvolver novosmétodos de diagnóstico, vacinas maiseficazes, novas drogas, novosmarcadores prognósticos e uma variedadede aplicações biotecnológicas. Noque se refere aos microrganismospatogênicos, por exemplo, e àsmicobactérias em especial, várias aplicaçõespotenciais da análise comparativade genomas têm sido reportadas,visando sobretudo à prevenção (atravésdo desenvolvimento de vacinas maiseficazes), o tratamento (pelo desenvolvimentode novas drogas) e o diagnóstico(através da criação de métodos maisrápidos, sensíveis e específicos) da tuberculosee outras doenças causadaspor micobactérias. Algumas dessas aplicaçõesincluem: a identificação degenes únicos de uma espécie em particular,a identificação de fatores de virulênciae a reconstrução metabólica(Gordon et al 2002); a caracterização depatógenos, a identificação de novosalvos para diagnóstico e para procedimentosterapêuticos (Fitzgerald & Musser2001); a investigação sobre a origemmolecular da patogênese, do espectrode hospedeiros e das diferençasfenotípicas entre isolados clínicos e populaçõesnaturais de patógenos (Behret al 1999; Brosch et al 2001; Cole 2002;Kato-Maeda et al 2001) e a investigaçãodos fundamentos genéticos da virulênciae da resistência a drogas demicobactérias causadoras de tuberculose(Randhawa & Bishai 2002).Como comparar?A análise comparativa de genomas consistena análise e comparação entre todoou grande parte do material genéticode diferentes espécies ou cepas. Portratar-se de uma abordagem holística,em larga escala, exige métodoscomputacionais para sua realização.Apesar de ser uma abordagem relativamenterecente, tendo início com oseqüenciamento dos primeiros genomasna década de 1990, suas ferramentasmais importantes têm origem nas técnicasclássicas de análise computacionalde seqüências: (i) algoritmos de alinhamentoglobal e local de pares ou demúltiplas seqüências, (ii) métodos deanálise filogenética e (iii) asimplementações destes métodos ealgoritmos (Needleman & Wunsch 1970;Smith & Waterman 1981; Felsenstein1981, 1989; Lipman & Pearson 1985;Pearson & Lipman 1988; Feng &Doolittle 1987; Altschul et al 1990, 1997;Thompson et al 1994). De fato, ela sebeneficia não somente de ferramentasdesenvolvidas no passado, mas tambémda criação de novas ferramentas e doaperfeiçoamento de ferramentas já existentes,ambos estimulados pela imensa,diversificada e complexa quantidadede dados produzida com os projetosde seqüenciamento em larga escala.Sendo os genomas basicamente longasseqüências de DNA, poder-se-ia analisálosalinhando-os como se fossem seqüênciascomuns, utilizando um dosalgoritmos de análise de seqüências citadosanteriormente. No entanto, isto sópode ser feito com genomas de espéciesou cepas muito próximas, uma vezque mudanças na organização dogenoma (inserções, deleções, inversões,rearranjos, trocas e duplicações) ocorremcom uma taxa muito elevada. Alémdisto, por tratar-se de seqüências de tamanhoextremo, torna-secomputacionalmente inviável a análisede mais de um par de genomas de umasó vez, mesmo com o uso de algoritmose programas eficazes, especialmente desenvolvidospara esta finalidade(Morgenstern et al 1998, 1999, 2002;Jareborg et al 1999; Delcher et al 1999,2002; Kent & Zahler 2000; Batzoglou etal 2000; Ma et al 2002; Bray et al 2003,2004; Schwartz et al 2003; Brudno et al2003a, 2003b; Kurtz et al 2004) (para umarevisão abrangente sobre este assunto,consulte Blanchette 2007). Portanto, namaioria das vezes as análises comparativasentre genomas são feitas em umnível de abordagem mais modular, tomando-seas partes que compõem taisseqüências, como por exemplo, oconjunto completo de genes codificadospelas espécies em estudo.Entre os métodos mais comumenteempregados nestas análises está abusca por similaridades entre seqüências.A etapa crucial deste tipo deanálise é determinar se as seqüênciascomparadas são ou nãohomólogas, ou seja, se descendemou não de uma seqüência ancestralcomum, estabelecendo-se equivalênciaentre as partes comparadas. Oresultado obtido permite, entre outrascoisas, a predição de função, jáque é presumido que seqüênciashomólogas tendem a ter funções similarese também determinar quaisos genes correspondentes (ortólogos)entre pares ou grupos de genomasanalisados (Rigden & Mello 2002; Leeet al 2007). Esta tarefa nada trivial éfeita comparando-se uma ou mais seqüênciasde entrada (querysequences), com outras inúmeras seqüênciasdepositadas em um bancode dados (subject sequences), atravésdo alinhamento consecutivo de cadaseqüência de entrada com cada seqüênciadepositada no banco, coma utilização de um algoritmo de alinhamentolocal (Smith & Waterman1981; Pearson & Lipman 1988;Altschul et al 1997). Para cada alinhamento,calcula-se o número de pontosobtidos (score), com base em umamatriz de substituição (PAM ouBLOSUM normalmente) e em valoresarbitrados de penalidade para a aberturae extensão de espaços nas seqüênciasalinhadas (gap opening/extension penalties), e o número dealinhamentos esperados ao acasocom pontuação igual ou superior aodo alinhamento em questão (Evalue),a partir da pontuação normalizada(bitscore) e do tamanho e composiçãodo banco de dados. Ahomologia é inferida com base nosvalores calculados dos diferentesparâmetros do alinhamento, algunsdeles já mencionados: pontuação,pontuação normalizada, número dealinhamentos esperados ao acasocom pontuação igual ou superior aodo alinhamento em questão,percentual de identidade, percentualda extensão de cada seqüência nopar alinhado que contribui para o alinhamento,diferença de tamanho entreas seqüências alinhadas etc. Aexistência de domínios - módulosque constituem unidades distintas doponto de vista evolutivo, funcional e<strong>Biotecnologia</strong> Ciência & <strong>Desenvolvimento</strong> - nº <strong>37</strong> 23

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!