12.07.2015 Views

METODOLOGIA DE MINERAÇÃO DE DADOS PARA ANÁLISE DO ...

METODOLOGIA DE MINERAÇÃO DE DADOS PARA ANÁLISE DO ...

METODOLOGIA DE MINERAÇÃO DE DADOS PARA ANÁLISE DO ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Além disso, TANASA (2005) enumera outros problemas ainda existentes no processotradicional de Web Usage Mining:1. A fase de pré-processamento não recebe a atenção necessária e devida;2. Os web sites possuem pouca ou nenhuma definição semântica de suas páginas;3. As técnicas de mineração de padrões seqüenciais não são apropriadas paratrabalhar com as especificidades dos dados de utilização da web, principalmenteem grande quantidade;4. As técnicas de mineração de padrões seqüenciais freqüentemente geramresultados curtos e desinteressantes;5. As fases do Web Usage Mining não são coordenadas para criar um processoúnico e coerente.Devido às limitações de quantidade de dados existentes nas técnicas de mineração depadrões seqüenciais, várias soluções podem ser adotadas, tal como limitar a quantidadede dados analisada (por exemplo, considerar somente um dia por semana), ou reduzir acomplexidade dos dados utilizando uma generalização das páginas.Um dos problemas encontrados, efetivamente, na extração de padrões seqüenciais emWeb Usage Mining é a grande quantidade de regras descobertas com baixo suporte.Diferentemente do que ocorre em outras áreas, em se tratando de log de navegação, amaioria das regras encontradas possui suporte abaixo de 5%. Apesar disso, ainda sãopoucos os trabalhos que tratam deste problema.Em ALVES et al. (2004) os autores minimizam o problema de baixo suporte utilizandoa noção de conceito, que é o agrupamento de páginas baseado no modelo (ou estrutura)do site. Por exemplo, todas as páginas contendo detalhamento de produtos pertencem aoconceito “Produtos”. Com isso, cada sessão é convertida e trabalhada como umaseqüência de conceitos.58

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!