12.07.2015 Views

METODOLOGIA DE MINERAÇÃO DE DADOS PARA ANÁLISE DO ...

METODOLOGIA DE MINERAÇÃO DE DADOS PARA ANÁLISE DO ...

METODOLOGIA DE MINERAÇÃO DE DADOS PARA ANÁLISE DO ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

owser dos usuários e têm a função de enviar os dados de navegação (SHAHABI et al.,1997). Esse é o processo conhecido como “JavaScript Page Tags”, já explicadoanteriormente.Estando o usuário identificado, o próximo passo é executar a identificação das sessõesde cada usuário. A solução mais usual é definir um tempo de intervalo máximo, ondedois acessos consecutivos que excedam este limite pertencerão a diferentes sessões.CATLEDGE & PITKOW (1995) fizeram um estudo para avaliar o intervalo de tempoentre as interações do usuário e o browser e concluíram que a probabilidade de umusuário ficar mais que 25,5 minutos sem fazer qualquer solicitação é muito baixa. Comoresultado deste estudo, muitos autores e softwares comerciais adotaram o valor de 30minutos para time-out.Pode-se também definir um tempo mínimo de duração, onde acessos consecutivosdentro deste limite pertencerão à mesma sessão (SPILIOPOULOU & FAULSTICH,1998, SPILIOPOULOU et al, 1999).Considerando que erros na reconstrução de sessões e um monitoramento incompleto dasatividades dos usuários num site podem facilmente invalidar os padrões e gerarconclusões erradas, SPILIOPOULOU et al. (2003) avaliaram o desempenho de váriasheurísticas destinadas à reconstrução de sessões a partir do log do servidor web. Osresultados mostraram que cada heurística foi eficiente numa determinada situação.Todas as sessões identificadas dos usuários servirão como entrada da fase de descobertade padrões ou da etapa de identificação de transações. Esta última, ainda consideradapreparatória, é necessária para o descobrimento de regras de associação. Uma transaçãocaracteriza-se por ser um agrupamento semanticamente significativo de referências depáginas (COOLEY et al., 1999a), podendo incluir desde apenas uma até todas aspáginas acessadas em uma sessão.COOLEY et al. (1997a, 1999a) comparam três métodos principais de identificação detransações: (a) identificação por duração da referência, (b) identificação por referênciasposteriores máximas, e (c) identificação por janelas de tempo.20

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!