12.07.2015 Views

METODOLOGIA DE MINERAÇÃO DE DADOS PARA ANÁLISE DO ...

METODOLOGIA DE MINERAÇÃO DE DADOS PARA ANÁLISE DO ...

METODOLOGIA DE MINERAÇÃO DE DADOS PARA ANÁLISE DO ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Neste exemplo, tem-se uma sessão com nove páginas visitadas, todas no mesmo dia ecom intervalos dentro do limite especificado para time-out. A página pivô, definida deacordo com o problema a ser analisado, é a página “/2004/rec_em/rec_em.shtml”, quenesta sessão é a página 2.A página 2 e a página 9 são selecionadas automaticamente pois são, respectivamente, apágina pivô e a última página. As páginas restantes são avaliadas de acordo com otempo de visitação calculada, sendo selecionadas as três com maior tempo. A página 1não entra nessa comparação pois é a página inicial. Assim, dentre as páginasconsideradas (página 3 à página 8), ficam as páginas 3, 4 e 7. Na Tabela 4.1 sãomostradas a sessão original e a que seria considerada para este caso.sessão original 1,2,3,4,5,6,7,8,9sessão considerada 2,3,4,7,9Tabela 4.1 – Sessão consideradaA grande vantagem deste tratamento é que a grande maioria das sessões terá umtamanho menor do que cinco (e sempre maior que dois), fazendo com que a tarefa deextração de padrões seqüenciais gere regras mais simples. Uma sessão final poderápossuir um tamanho maior que cinco num caso particular: quando a página pivô évisitada mais de uma vez, mas entre elas exista uma visita a uma das páginasselecionadas pelo critério do tempo. Também é importante destacar que esta tarefa detratamento das sessões está contida dentro da fase de pré-processamento.A heurística aqui definida e utilizada é semelhante ao trabalho de COOLEY et al.(1997b), onde os autores fazem a consideração de que um usuário, durante a navegaçãoem um web site, trata cada página apenas de duas maneiras: como um elemento denavegação para achar links aos dados desejados, ou como conteúdo. Estes doispropósitos, denominados respectivamente de “propósito de navegação” e “propósito deconteúdo”, dependem de cada usuário. Por exemplo, uma página que contém apenas umtítulo e vários links para outras páginas certamente pode ser considerada de navegação.Mas uma página com textos, fotos e links não pode ser classificada facilmente; ela tem63

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!