12.07.2015 Views

METODOLOGIA DE MINERAÇÃO DE DADOS PARA ANÁLISE DO ...

METODOLOGIA DE MINERAÇÃO DE DADOS PARA ANÁLISE DO ...

METODOLOGIA DE MINERAÇÃO DE DADOS PARA ANÁLISE DO ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

O projeto WebSIFT (Web Site Information Filter), desenvolvido por COOLEY et al.(1999b) e COOLEY (2000), mostra que é possível inferir, a partir de arquivos de log, aspáginas não registradas nos logs devido ao uso de cache nos clientes. Além disso,mostra também que o tipo de utilização de uma página pode ser inferido a partir dotempo gasto pelo usuário na mesma.O WUM (Web Utilization Miner), proposto por SPILIOPOULOU & FAULSTICH(1998), é uma arquitetura que emprega uma técnica inovadora para descobrir os padrõesde navegação utilizando uma visão agregada do arquivo de log de acesso. Nele, asnavegações individuais, chamadas de trilhas, são combinadas numa estrutura de árvore.Esta árvore de agregação é formada juntando as trilhas com o mesmo prefixo, onde cadanó desta árvore contém uma URL e a informação de quantos visitantes chegaram a estenó através do mesmo caminho. Utilizando-se a linguagem de mineração MINT(disponível através de uma interface), é possível descobrir os padrões freqüentes.BERENDT (2000) desenvolveu um módulo add-on para a ferramenta WUM,denominado STRATDYN. Este módulo implementa um algoritmo para classificação deseqüências ou sessões, permitindo que diferenças relevantes sejam percebidas nocomportamento dos usuários. Desta forma, é possível determinar se uma mudança nodesenho do site obteve o resultado desejado.ZAÏANE et al. (1998) utilizam uma estrutura de cubos de dados para armazenar os logsdo servidor web, onde é possível executar tarefas de Data Mining e atividades de OLAP(Online Analytical Processing). O projeto, denominado WebLogMiner, possui quatroestágios: filtragem dos dados, construção dos cubos de dados, utilização de OLAP noscubos de dados de log e aplicação de técnicas de Data Mining.Uma das técnicas que tem se adaptado bem na modelagem e previsão docomportamento do usuário num web site é o modelo de Markov, muito aplicado emprocessos estocásticos (MASSA & PULIAFITO, 2002, SINGH, 2004). Em geral, ummodelo de Markov é caracterizado por um conjunto de estados {s 1 , s 2 , ..., s n } e umamatriz de probabilidade de transição {p 1,1 , ..., p 1,n , ..., p 2,1 , ..., p 2,n , ..., p n,1 , ..., p n,n }, ondep i,j representa a probabilidade da transição do estado s i para s j . A ordem de um modelo32

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!