Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
da página para o servidor WS. Caso contrário, enviará para o servidor WS somente as URLsencontradas na página para que possam ser visitadas posteriormente. No final do processo, oconteúdo HTML capturado é descartado e o ciclo é reiniciado com o rastreamento de umanova página.SolicitaURL / HashRecebeURL / HashDispara rastejadorVisitaPágina WebSolicitaDadosEnviaDadosDownloadHTMLExecutaParserGeoNãoExisteServidor WSLoopEnviaConteúdoEnviaURLsEnviaDadosDescartaHTMLEnviaDadosFigura 3-6 – Fluxo de tarefas do usuário colaborador.A análise sintática dos conteúdos HTML adotada pelo GeoDiscover é um processocomplexo que inclui a identificação de contexto geográfico na página, o respeito ao códigode ética dos rastejadores, a conversão de URLs relativas em URLs absolutas e o envio dedados para o servidor WS. A análise sintática será discutida em detalhes na seção 3.6.55