13.07.2015 Views

Formato PDF - mtc-m17:80 - Inpe

Formato PDF - mtc-m17:80 - Inpe

Formato PDF - mtc-m17:80 - Inpe

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

fornecidas pelo usuário e compará-las com o índice, a fim de encontrar respostas relevantesao seu interesse. As expressões podem ser compostas por operadores “e”, “ou” e “não”.Para estabelecer a ordem de exibição dos resultados, o mecanismo utiliza um algoritmo declassificação. Esse algoritmo tem diferentes critérios. Pode ser baseado na quantidade devezes que a palavra aparece na página, pela classificação de hubs e autoridades (Kleinberg;Lawrence, 2001). Temos ainda algoritmos especiais baseados na estrutura de links da Webcomo o PageRank (Page et al., 1999) e o Hyperlink Vector Voting (HVV) (Li, 1998).2.3 Medidas de qualidade em recuperação da informaçãoPara medir o desempenho de sistemas de recuperação de informações, seis diferentescritérios de avaliação foram julgados críticos pelos usuários: recall, precision, effort, time,form of presentation e coverage (Cleverdon, 1970). Dentre eles, as métricas de abrangência(Recall) e de precisão (Precision) são as mais utilizadas para avaliar a eficiência de sistemasde recuperação de informação.A abordagem mais objetiva considera três diferentes aspectos: os recursos usados naoperação de recuperação, a quantidade de tempo e esforços gastos para obter a informação ea habilidade que o sistema possui para recuperar itens úteis (Raghavan et al., 1989). É difícilobter todos os parâmetros relevantes para a medida. Desta forma, uma prática comum eminvestigações de pesquisa é concentrar principalmente em medidas que remetam à qualidadeda produção da recuperação.Para a definição de abrangência e precisão, Buckland (1994) baseou-se nas seguintessuposições: (a) classificação binária de relevância, na qual o item recuperável é classificadocomo “relevante” ou como “não relevante”; (b) a recuperação é vista como um processoexpansivo, na qual o buscador aumenta sua abrangência continuamente.Relevância é uma medida de quão bem um item atende à expectativa do usuário. Arelevância é uma medida de difícil quantificação, devido às seguintes características (Lee,2005):• Subjetiva – depende do julgamento de um usuário específico;39

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!