Aprendendo com as agrobacterias - Biotecnologia
Aprendendo com as agrobacterias - Biotecnologia
Aprendendo com as agrobacterias - Biotecnologia
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
o mais impressionante avanço foi a<br />
emergência da bioinformática e o treinamento<br />
dos cientist<strong>as</strong> em tecnologi<strong>as</strong><br />
modern<strong>as</strong> de pesquisa. Inicialmente<br />
a bioinformática teve <strong>com</strong>o<br />
aplicação principal facilitar o manuseio<br />
da grande quantidade de dados gerados<br />
pelos projetos genoma, <strong>com</strong>o a<br />
montagem de contigs e fechamento<br />
de seqüênci<strong>as</strong> genômic<strong>as</strong>, além de dar<br />
suporte para outr<strong>as</strong> estratégi<strong>as</strong> experimentais<br />
no campo da biologia molecular.<br />
De lá para cá, muit<strong>as</strong> informações<br />
foram disponibilizad<strong>as</strong> em bancos de<br />
dados públicos de seqüênci<strong>as</strong> gênic<strong>as</strong>,<br />
proteín<strong>as</strong>, estrutur<strong>as</strong> de macromolécul<strong>as</strong>,<br />
perfil metabólico, filogenia e outros,<br />
cujo valor ainda não pode sequer<br />
ser estimado. Hoje não é mais possível<br />
avançar em biotecnologia sem a<br />
integração da tecnologia da informação<br />
<strong>com</strong> a tecnologia experimental.<br />
As abordagens de estudos biotecnológicos<br />
atualmente buscam resolver<br />
questões específic<strong>as</strong>, optando-se<br />
normalmente por fazer uma análise<br />
<strong>com</strong>putacional inicial <strong>com</strong> a utilização<br />
dess<strong>as</strong> informações para direcionar e<br />
selecionar <strong>as</strong> estratégi<strong>as</strong> experimentais,<br />
<strong>com</strong> considerável economia financeira<br />
e de tempo, sem considerar a<br />
efetividade de tais procedimentos na<br />
aceleração da obtenção dos resultados<br />
e descobert<strong>as</strong> científic<strong>as</strong>.<br />
Além disso, muit<strong>as</strong> descobert<strong>as</strong><br />
estão sendo feit<strong>as</strong> simplesmente pela<br />
análise sistematizada dess<strong>as</strong> fontes de<br />
dados, que não param de crescer tanto<br />
em volume <strong>com</strong>o em <strong>com</strong>plexidade<br />
e variabilidade. A tendência atual<br />
é para descobert<strong>as</strong> científic<strong>as</strong> e síntese<br />
sendo dirigid<strong>as</strong> pela informação<br />
emergindo intrinsecamente a partir da<br />
biologia em si e a partir da diversidade<br />
e heterogeneidade d<strong>as</strong> observações<br />
experimentais. Um projeto típico de<br />
pesquisa pode <strong>com</strong>eçar <strong>com</strong> a coleção<br />
de sequênci<strong>as</strong> genômic<strong>as</strong> conhecid<strong>as</strong><br />
ou não conhecid<strong>as</strong>. Para sequênci<strong>as</strong><br />
não conhecid<strong>as</strong>, pode-se conduzir uma<br />
busca em bancos de dados por sequênci<strong>as</strong><br />
similares ou usar algoritmos <strong>com</strong>putacionais<br />
procurando predizer <strong>as</strong><br />
su<strong>as</strong> possíveis identidades e funções.<br />
Isso requer o acesso à versão mais<br />
atual da coleção de dados, em bancos<br />
de dados mundiais, e <strong>as</strong> ferrament<strong>as</strong><br />
fundamentais da bioinformática agora<br />
são cada vez mais parte dos métodos<br />
experimentais. Entretanto, ess<strong>as</strong> informações<br />
estão espalhad<strong>as</strong> em múltipl<strong>as</strong><br />
fontes, impossibilitando que os cientist<strong>as</strong><br />
obtenham direta e eficientemente<br />
a informação requerida para<br />
converter os dados <strong>com</strong>plexos e heterogêneos<br />
em dados úteis, informação<br />
organizada e sistematizada conforme<br />
<strong>as</strong> linh<strong>as</strong> de pesquisa específic<strong>as</strong>.<br />
Nesse ambiente, para responder<br />
uma simples questão pode ser<br />
necessário acessar vári<strong>as</strong> fontes de<br />
dados e utilizar ferrament<strong>as</strong> de análise<br />
sofisticad<strong>as</strong>, <strong>com</strong>o alinhamento de<br />
sequênci<strong>as</strong>, agrupamento, modelagem<br />
molecular etc. Enquanto a integração<br />
dos dados é uma área de pesquisa<br />
dinâmica, necessidades específic<strong>as</strong><br />
dos biocientist<strong>as</strong> têm levado ao<br />
desenvolvimento de numerosos sistem<strong>as</strong><br />
que acabam desconectando o<br />
acesso aos dados em um ambiente<br />
direcionado por resultados. O resultado<br />
é o crescente número de bancos<br />
de dados e web sites representando<br />
uma coleção confinada de dados, governada<br />
por sistem<strong>as</strong> próprios de gerenciamento<br />
e formatos particulares de<br />
input e output dos dados, apresentações<br />
gráfic<strong>as</strong> dos resultados, e problem<strong>as</strong><br />
sérios de <strong>com</strong>patibilidade e<br />
interoperabilidade <strong>com</strong> outros sistem<strong>as</strong>.<br />
Uma evidência disso é o número<br />
crescente de novos bancos de dados<br />
relatados a cada ano na edição de<br />
janeiro da Nucleic Acids Research<br />
(http://nar.oupjournals.org/). A edição<br />
atual lista 548 bancos de dados, 162 a<br />
mais em relação ao ano anterior (Galperin,<br />
2004). Boa parte desses bancos<br />
ainda são construídos <strong>com</strong> enfoques<br />
extremamente limitados para<br />
aplicações restrit<strong>as</strong>, sem a preocupação<br />
<strong>com</strong> relação à <strong>com</strong>patibilidade<br />
e troca de informações <strong>com</strong> outros<br />
sistem<strong>as</strong>. Adaptações são lent<strong>as</strong> e<br />
muit<strong>as</strong> vezes difíceis de implementar<br />
quando a filosofia básica do banco precisa<br />
ser mantida.<br />
O acesso a esses dados precisa<br />
melhorar em termos de eficiência,<br />
velocidade e facilidade. Para facilitar<br />
o entendimento dos processos biológicos,<br />
é necessário fazer novos arranjos<br />
aos recursos de dados disponíveis. Por<br />
exemplo, o que se faz inicialmente<br />
em uma rota metabólica, uma rede de<br />
interações moleculares etc., é<br />
necessário generalizar para outros<br />
sistem<strong>as</strong> biológicos; a partir de E. coli<br />
para levedura, e chegar à biologia de<br />
organismos mais <strong>com</strong>plexos, <strong>com</strong>o o<br />
homem, animais e plant<strong>as</strong> economicamente<br />
importantes. Trabalhar toda<br />
essa informação conjuntamente é fundamental<br />
para a geração de novos insights.<br />
O rápido crescimento do volume<br />
de dados é um desafio para cada<br />
um, e <strong>com</strong> a produção de dados mais<br />
diversos e em larga escala (por e-<br />
xemplo, dados de DNA microarrays)<br />
esse crescimento está apen<strong>as</strong><br />
<strong>com</strong>eçando.<br />
As atividades de bancos de dados<br />
e desenvolvimento de algoritmos<br />
<strong>com</strong>putacionais precisam estar integrad<strong>as</strong><br />
para produzir uma infra-estrutura<br />
de informação coesiva delimitando<br />
toda a biologia. Para isso é necessário<br />
o desenvolvimento de ferrament<strong>as</strong><br />
para disseminar e analisar m<strong>as</strong>siv<strong>as</strong><br />
quantidades de dados, inclusive literatura,<br />
e a construção de <strong>com</strong>unidades<br />
de bancos de dados b<strong>as</strong>ead<strong>as</strong> em<br />
princípios operacionais padronizados<br />
e <strong>com</strong> padrões interoperacionais.<br />
Muitos dos problem<strong>as</strong> da bioinformática<br />
são genéricos, por isso<br />
soluções em um domínio podem ser<br />
naturalmente aplicáveis para outros.<br />
O entendimento da informação molecular<br />
até a célula, órgão e o sistema<br />
biológico do organismo será o maior<br />
desafio (fenomenoma). A p<strong>as</strong>sagem<br />
do genótipo para o fenótipo requererá<br />
um novo conjunto de ferrament<strong>as</strong><br />
<strong>com</strong>putacionais altamente robust<strong>as</strong>. O<br />
principal enfoque da bioinformática<br />
para os próximos anos será integrar<br />
esses dados de modo a permitir busc<strong>as</strong><br />
transparentes através dos dados.<br />
Fazer isso de forma robusta abrangendo<br />
todo o conjunto de dados é um<br />
desafio real.<br />
Apesar do avanço já feito, é<br />
necessário continuar a pesquisa no<br />
campo da genômica, principalmente<br />
para microrganismos <strong>as</strong>sociados a<br />
plant<strong>as</strong> economicamente importantes,<br />
incluindo fungos, e buscar entender<br />
<strong>as</strong> interações hospedeiro-microrganismo<br />
ou planta-patógeno. No c<strong>as</strong>o da<br />
medicina, a necessidade atual é por<br />
dados clínicos bem estruturados e consistentes<br />
sobre grandes populações.<br />
Tais dados, que são difíceis de coletar<br />
e caros, serão críticos para ligar os<br />
<strong>Biotecnologia</strong> Ciência & Desenvolvimento n.32 - janeiro/junho 2004 35