12.07.2015 Views

METODOLOGIA DE MINERAÇÃO DE DADOS PARA ANÁLISE DO ...

METODOLOGIA DE MINERAÇÃO DE DADOS PARA ANÁLISE DO ...

METODOLOGIA DE MINERAÇÃO DE DADOS PARA ANÁLISE DO ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

LIU et al. (2002) onde, através de uma mineração de conteúdo associada a uma técnicade visualização, pode-se comparar um determinado site com outro (para análise deconcorrentes), de forma a encontrar as similaridades e diferenças entre páginas.1.3 Web Structure MiningÉ o processo de extração de conhecimento dos links entre documentos da web. Aestrutura de links, normalmente, contém uma quantidade enorme de anotações humanasescondidas que podem auxiliar na inferência automática da importância da página comrelação a um dado tópico.Seus conceitos estão baseados na Análise de Co-citações, desenvolvido em meados dadécada de 70 por SMALL & GRIFFITH (1974). É um método que mede o interesseintelectual em comum existente num par de documentos. Esta medida, definida comoforça de co-citação (cocitation strength), é dada pelo número de documentos que foramcitados por ambos. No ambiente web, esta Análise de Co-citações traduz-se na noção deque, quando um documento contém links referenciando outros documentos, porexemplo, documento A e documento B, estes documentos estão inter-relacionados dealguma maneira. Neste exemplo, os documentos A e B são ditos co-citados.Os principais conceitos do Web Structure Mining são:• Concentrador (hub): página web conectada a uma coleção de sites relevantespara determinado tópico;• Autoridade (authority): página web apontada por vários concentradores;• Relacionamento mútuo de reforço: uma autoridade boa é aquela apontada pormuitos concentradores bons; um concentrador bom é a página que aponta paramuitas autoridades boas.6

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!