15.07.2013 Views

ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa

ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa

ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

4 Estudo do algoritmo Multi-Way<br />

Esta secção <strong>de</strong>screve os resultados obtidos na sequência do estudo do algoritmo Multi-Way, incluindo<br />

também os efeitos das optimizações propostas na secção 3. Para realizar o estudo, foram realizados<br />

testes no sentido <strong>de</strong> avaliar a influência da <strong>de</strong>nsida<strong>de</strong> dos dados e do volume dos dados sobre o<br />

algoritmo com e sem as optimizações propostas. A nível da análise da influência do volume <strong>de</strong> dados,<br />

foram ainda estudados dois níveis <strong>de</strong> variação diferentes <strong>de</strong>vido à natureza específica do problema, ou<br />

seja, o volume <strong>de</strong> dados submetidos ao algoritmo foi variado tanto em termos do número <strong>de</strong> dimensões<br />

existentes como em termos do número <strong>de</strong> valores comportados por cada dimensão. Na sequência dos<br />

testes, foram recolhidos dados sobre o número <strong>de</strong> leituras e escritas realizadas na base <strong>de</strong> dados, o<br />

tempo <strong>de</strong> execução total e individualizado para cada etapa do algoritmo e o número <strong>de</strong> nós da estrutura<br />

base explorados para realizar o cálculo do cubo.<br />

4.1 Dados <strong>de</strong> teste<br />

Os dados utilizados para realizar o estudo do algoritmo foram gerados recorrendo ao projecto Illimine 2 .<br />

Trata-se <strong>de</strong> um projecto mantido pelo grupo <strong>de</strong> pesquisa em exploração <strong>de</strong> dados (data mining) da<br />

<strong>Universida<strong>de</strong></strong> <strong>de</strong> Illinois li<strong>de</strong>rado pelo professor Jiawei Han que reúne diversas ferramentas nas áreas <strong>de</strong><br />

data mining e aprendizagem, disponibilizando mesmo via internet <strong>de</strong>monstrações <strong>de</strong> alguns dos<br />

principais algoritmos nessa área. Igualmente disponibilizado por este projecto está um gerador aleatório<br />

<strong>de</strong> dados, no qual o utilizador po<strong>de</strong> especificar o número <strong>de</strong> transacções que preten<strong>de</strong>, o número <strong>de</strong><br />

dimensões e a cardinalida<strong>de</strong> <strong>de</strong> cada dimensão.<br />

Seguidamente, foi <strong>de</strong>finido um plano <strong>de</strong> testes que nos permitisse avaliar os aspectos referidos<br />

anteriormente, nomeadamente a influência da <strong>de</strong>nsida<strong>de</strong> e quantida<strong>de</strong> <strong>de</strong> dados submetidos ao<br />

algoritmo, tal como mostra a tabela abaixo. Cada um dos testes, à execpção dos testes T1 a T4<br />

inclusivé, foi executado para a implementação realizada do algoritmo original (MW), para a<br />

implementação com cada uma das optimizações propostas (MW + SC e MW + ST) e para a<br />

implementação reunindo as duas optimizações (MW + SC + ST). Em cada um dos testes, proce<strong>de</strong>u-se<br />

ao cálculo do agregado ALL por forma a forçar o algoritmo a percorrer o maior número possível <strong>de</strong> níveis<br />

da MMST e utilizar o maior bloco <strong>de</strong> memória necessário para efectuar esse cálculo.<br />

2 http://illimine.cs.uiuc.edu<br />

52

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!