09.04.2014 Views

Aprendendo com as agrobacterias - Biotecnologia

Aprendendo com as agrobacterias - Biotecnologia

Aprendendo com as agrobacterias - Biotecnologia

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

o mais impressionante avanço foi a<br />

emergência da bioinformática e o treinamento<br />

dos cientist<strong>as</strong> em tecnologi<strong>as</strong><br />

modern<strong>as</strong> de pesquisa. Inicialmente<br />

a bioinformática teve <strong>com</strong>o<br />

aplicação principal facilitar o manuseio<br />

da grande quantidade de dados gerados<br />

pelos projetos genoma, <strong>com</strong>o a<br />

montagem de contigs e fechamento<br />

de seqüênci<strong>as</strong> genômic<strong>as</strong>, além de dar<br />

suporte para outr<strong>as</strong> estratégi<strong>as</strong> experimentais<br />

no campo da biologia molecular.<br />

De lá para cá, muit<strong>as</strong> informações<br />

foram disponibilizad<strong>as</strong> em bancos de<br />

dados públicos de seqüênci<strong>as</strong> gênic<strong>as</strong>,<br />

proteín<strong>as</strong>, estrutur<strong>as</strong> de macromolécul<strong>as</strong>,<br />

perfil metabólico, filogenia e outros,<br />

cujo valor ainda não pode sequer<br />

ser estimado. Hoje não é mais possível<br />

avançar em biotecnologia sem a<br />

integração da tecnologia da informação<br />

<strong>com</strong> a tecnologia experimental.<br />

As abordagens de estudos biotecnológicos<br />

atualmente buscam resolver<br />

questões específic<strong>as</strong>, optando-se<br />

normalmente por fazer uma análise<br />

<strong>com</strong>putacional inicial <strong>com</strong> a utilização<br />

dess<strong>as</strong> informações para direcionar e<br />

selecionar <strong>as</strong> estratégi<strong>as</strong> experimentais,<br />

<strong>com</strong> considerável economia financeira<br />

e de tempo, sem considerar a<br />

efetividade de tais procedimentos na<br />

aceleração da obtenção dos resultados<br />

e descobert<strong>as</strong> científic<strong>as</strong>.<br />

Além disso, muit<strong>as</strong> descobert<strong>as</strong><br />

estão sendo feit<strong>as</strong> simplesmente pela<br />

análise sistematizada dess<strong>as</strong> fontes de<br />

dados, que não param de crescer tanto<br />

em volume <strong>com</strong>o em <strong>com</strong>plexidade<br />

e variabilidade. A tendência atual<br />

é para descobert<strong>as</strong> científic<strong>as</strong> e síntese<br />

sendo dirigid<strong>as</strong> pela informação<br />

emergindo intrinsecamente a partir da<br />

biologia em si e a partir da diversidade<br />

e heterogeneidade d<strong>as</strong> observações<br />

experimentais. Um projeto típico de<br />

pesquisa pode <strong>com</strong>eçar <strong>com</strong> a coleção<br />

de sequênci<strong>as</strong> genômic<strong>as</strong> conhecid<strong>as</strong><br />

ou não conhecid<strong>as</strong>. Para sequênci<strong>as</strong><br />

não conhecid<strong>as</strong>, pode-se conduzir uma<br />

busca em bancos de dados por sequênci<strong>as</strong><br />

similares ou usar algoritmos <strong>com</strong>putacionais<br />

procurando predizer <strong>as</strong><br />

su<strong>as</strong> possíveis identidades e funções.<br />

Isso requer o acesso à versão mais<br />

atual da coleção de dados, em bancos<br />

de dados mundiais, e <strong>as</strong> ferrament<strong>as</strong><br />

fundamentais da bioinformática agora<br />

são cada vez mais parte dos métodos<br />

experimentais. Entretanto, ess<strong>as</strong> informações<br />

estão espalhad<strong>as</strong> em múltipl<strong>as</strong><br />

fontes, impossibilitando que os cientist<strong>as</strong><br />

obtenham direta e eficientemente<br />

a informação requerida para<br />

converter os dados <strong>com</strong>plexos e heterogêneos<br />

em dados úteis, informação<br />

organizada e sistematizada conforme<br />

<strong>as</strong> linh<strong>as</strong> de pesquisa específic<strong>as</strong>.<br />

Nesse ambiente, para responder<br />

uma simples questão pode ser<br />

necessário acessar vári<strong>as</strong> fontes de<br />

dados e utilizar ferrament<strong>as</strong> de análise<br />

sofisticad<strong>as</strong>, <strong>com</strong>o alinhamento de<br />

sequênci<strong>as</strong>, agrupamento, modelagem<br />

molecular etc. Enquanto a integração<br />

dos dados é uma área de pesquisa<br />

dinâmica, necessidades específic<strong>as</strong><br />

dos biocientist<strong>as</strong> têm levado ao<br />

desenvolvimento de numerosos sistem<strong>as</strong><br />

que acabam desconectando o<br />

acesso aos dados em um ambiente<br />

direcionado por resultados. O resultado<br />

é o crescente número de bancos<br />

de dados e web sites representando<br />

uma coleção confinada de dados, governada<br />

por sistem<strong>as</strong> próprios de gerenciamento<br />

e formatos particulares de<br />

input e output dos dados, apresentações<br />

gráfic<strong>as</strong> dos resultados, e problem<strong>as</strong><br />

sérios de <strong>com</strong>patibilidade e<br />

interoperabilidade <strong>com</strong> outros sistem<strong>as</strong>.<br />

Uma evidência disso é o número<br />

crescente de novos bancos de dados<br />

relatados a cada ano na edição de<br />

janeiro da Nucleic Acids Research<br />

(http://nar.oupjournals.org/). A edição<br />

atual lista 548 bancos de dados, 162 a<br />

mais em relação ao ano anterior (Galperin,<br />

2004). Boa parte desses bancos<br />

ainda são construídos <strong>com</strong> enfoques<br />

extremamente limitados para<br />

aplicações restrit<strong>as</strong>, sem a preocupação<br />

<strong>com</strong> relação à <strong>com</strong>patibilidade<br />

e troca de informações <strong>com</strong> outros<br />

sistem<strong>as</strong>. Adaptações são lent<strong>as</strong> e<br />

muit<strong>as</strong> vezes difíceis de implementar<br />

quando a filosofia básica do banco precisa<br />

ser mantida.<br />

O acesso a esses dados precisa<br />

melhorar em termos de eficiência,<br />

velocidade e facilidade. Para facilitar<br />

o entendimento dos processos biológicos,<br />

é necessário fazer novos arranjos<br />

aos recursos de dados disponíveis. Por<br />

exemplo, o que se faz inicialmente<br />

em uma rota metabólica, uma rede de<br />

interações moleculares etc., é<br />

necessário generalizar para outros<br />

sistem<strong>as</strong> biológicos; a partir de E. coli<br />

para levedura, e chegar à biologia de<br />

organismos mais <strong>com</strong>plexos, <strong>com</strong>o o<br />

homem, animais e plant<strong>as</strong> economicamente<br />

importantes. Trabalhar toda<br />

essa informação conjuntamente é fundamental<br />

para a geração de novos insights.<br />

O rápido crescimento do volume<br />

de dados é um desafio para cada<br />

um, e <strong>com</strong> a produção de dados mais<br />

diversos e em larga escala (por e-<br />

xemplo, dados de DNA microarrays)<br />

esse crescimento está apen<strong>as</strong><br />

<strong>com</strong>eçando.<br />

As atividades de bancos de dados<br />

e desenvolvimento de algoritmos<br />

<strong>com</strong>putacionais precisam estar integrad<strong>as</strong><br />

para produzir uma infra-estrutura<br />

de informação coesiva delimitando<br />

toda a biologia. Para isso é necessário<br />

o desenvolvimento de ferrament<strong>as</strong><br />

para disseminar e analisar m<strong>as</strong>siv<strong>as</strong><br />

quantidades de dados, inclusive literatura,<br />

e a construção de <strong>com</strong>unidades<br />

de bancos de dados b<strong>as</strong>ead<strong>as</strong> em<br />

princípios operacionais padronizados<br />

e <strong>com</strong> padrões interoperacionais.<br />

Muitos dos problem<strong>as</strong> da bioinformática<br />

são genéricos, por isso<br />

soluções em um domínio podem ser<br />

naturalmente aplicáveis para outros.<br />

O entendimento da informação molecular<br />

até a célula, órgão e o sistema<br />

biológico do organismo será o maior<br />

desafio (fenomenoma). A p<strong>as</strong>sagem<br />

do genótipo para o fenótipo requererá<br />

um novo conjunto de ferrament<strong>as</strong><br />

<strong>com</strong>putacionais altamente robust<strong>as</strong>. O<br />

principal enfoque da bioinformática<br />

para os próximos anos será integrar<br />

esses dados de modo a permitir busc<strong>as</strong><br />

transparentes através dos dados.<br />

Fazer isso de forma robusta abrangendo<br />

todo o conjunto de dados é um<br />

desafio real.<br />

Apesar do avanço já feito, é<br />

necessário continuar a pesquisa no<br />

campo da genômica, principalmente<br />

para microrganismos <strong>as</strong>sociados a<br />

plant<strong>as</strong> economicamente importantes,<br />

incluindo fungos, e buscar entender<br />

<strong>as</strong> interações hospedeiro-microrganismo<br />

ou planta-patógeno. No c<strong>as</strong>o da<br />

medicina, a necessidade atual é por<br />

dados clínicos bem estruturados e consistentes<br />

sobre grandes populações.<br />

Tais dados, que são difíceis de coletar<br />

e caros, serão críticos para ligar os<br />

<strong>Biotecnologia</strong> Ciência & Desenvolvimento n.32 - janeiro/junho 2004 35

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!