13.07.2015 Views

Formato PDF - mtc-m17:80 - Inpe

Formato PDF - mtc-m17:80 - Inpe

Formato PDF - mtc-m17:80 - Inpe

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

da página para o servidor WS. Caso contrário, enviará para o servidor WS somente as URLsencontradas na página para que possam ser visitadas posteriormente. No final do processo, oconteúdo HTML capturado é descartado e o ciclo é reiniciado com o rastreamento de umanova página.SolicitaURL / HashRecebeURL / HashDispara rastejadorVisitaPágina WebSolicitaDadosEnviaDadosDownloadHTMLExecutaParserGeoNãoExisteServidor WSLoopEnviaConteúdoEnviaURLsEnviaDadosDescartaHTMLEnviaDadosFigura 3-6 – Fluxo de tarefas do usuário colaborador.A análise sintática dos conteúdos HTML adotada pelo GeoDiscover é um processocomplexo que inclui a identificação de contexto geográfico na página, o respeito ao códigode ética dos rastejadores, a conversão de URLs relativas em URLs absolutas e o envio dedados para o servidor WS. A análise sintática será discutida em detalhes na seção 3.6.55

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!