15.07.2013 Views

ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa

ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa

ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Os resultados mostram que o algoritmo BUC apresenta melhor <strong>de</strong>sempenho na computação <strong>de</strong> cubos<br />

esparsos do que o algoritmo Memory-Cube [Beyer1999].<br />

2.5.2 H-cubing<br />

Han et al [Han2001]propuseram um algoritmo orientado para a resolução do problema dos cubos iceberg<br />

mas para a situação específica em que a condição a ser satisfeita pelos agregados envolve uma medida<br />

não distributiva, como a média. O recurso a este tipo <strong>de</strong> medidas, que normalmente não obe<strong>de</strong>cem à<br />

proprieda<strong>de</strong> anti-monotónica, faz com que não possa ser feito filtragem com base nessa proprieda<strong>de</strong>. No<br />

caso concreto da média, o facto <strong>de</strong> o valor médio numa célula c <strong>de</strong> um cubói<strong>de</strong> A ser inferior a um valor<br />

mínimo pré-<strong>de</strong>finido não significa obrigatoriamente que o valor das células <strong>de</strong>scen<strong>de</strong>ntes seja igualmente<br />

inferior.<br />

O algoritmo proposto utiliza uma estrutura em árvore (H-tree) baseada na FP-tree usada pelo algoritmo<br />

FP-growth [Han1999]. São características <strong>de</strong>sta estrutura o facto <strong>de</strong> po<strong>de</strong>r ser construída com um único<br />

varrimento da base <strong>de</strong> dados e a sua completu<strong>de</strong>, no sentido em que a H-tree e respectiva tabela<br />

(hea<strong>de</strong>r table) fornecem toda a informação necessária para calcular um cubo iceberg. Cada nível da<br />

árvore representa uma dimensão no cubói<strong>de</strong> base e cada tuplo <strong>de</strong> d-dimensões compõe um caminho<br />

com d nós na árvore. Os nós que se encontram ao mesmo nível e contêm o mesmo valor estão ligados<br />

entre si. A cada nível está associada uma tabela (hea<strong>de</strong>r table) que regista a frequência <strong>de</strong> cada um dos<br />

valores possíveis das dimensões e mantém ligações aos primeiros nós correspon<strong>de</strong>ntes a esses valores.<br />

Figura 23 - Exemplo <strong>de</strong> uma H-tree [Agrawal1994]<br />

43

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!