ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa
ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa
ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
4 Estudo do algoritmo Multi-Way<br />
Esta secção <strong>de</strong>screve os resultados obtidos na sequência do estudo do algoritmo Multi-Way, incluindo<br />
também os efeitos das optimizações propostas na secção 3. Para realizar o estudo, foram realizados<br />
testes no sentido <strong>de</strong> avaliar a influência da <strong>de</strong>nsida<strong>de</strong> dos dados e do volume dos dados sobre o<br />
algoritmo com e sem as optimizações propostas. A nível da análise da influência do volume <strong>de</strong> dados,<br />
foram ainda estudados dois níveis <strong>de</strong> variação diferentes <strong>de</strong>vido à natureza específica do problema, ou<br />
seja, o volume <strong>de</strong> dados submetidos ao algoritmo foi variado tanto em termos do número <strong>de</strong> dimensões<br />
existentes como em termos do número <strong>de</strong> valores comportados por cada dimensão. Na sequência dos<br />
testes, foram recolhidos dados sobre o número <strong>de</strong> leituras e escritas realizadas na base <strong>de</strong> dados, o<br />
tempo <strong>de</strong> execução total e individualizado para cada etapa do algoritmo e o número <strong>de</strong> nós da estrutura<br />
base explorados para realizar o cálculo do cubo.<br />
4.1 Dados <strong>de</strong> teste<br />
Os dados utilizados para realizar o estudo do algoritmo foram gerados recorrendo ao projecto Illimine 2 .<br />
Trata-se <strong>de</strong> um projecto mantido pelo grupo <strong>de</strong> pesquisa em exploração <strong>de</strong> dados (data mining) da<br />
<strong>Universida<strong>de</strong></strong> <strong>de</strong> Illinois li<strong>de</strong>rado pelo professor Jiawei Han que reúne diversas ferramentas nas áreas <strong>de</strong><br />
data mining e aprendizagem, disponibilizando mesmo via internet <strong>de</strong>monstrações <strong>de</strong> alguns dos<br />
principais algoritmos nessa área. Igualmente disponibilizado por este projecto está um gerador aleatório<br />
<strong>de</strong> dados, no qual o utilizador po<strong>de</strong> especificar o número <strong>de</strong> transacções que preten<strong>de</strong>, o número <strong>de</strong><br />
dimensões e a cardinalida<strong>de</strong> <strong>de</strong> cada dimensão.<br />
Seguidamente, foi <strong>de</strong>finido um plano <strong>de</strong> testes que nos permitisse avaliar os aspectos referidos<br />
anteriormente, nomeadamente a influência da <strong>de</strong>nsida<strong>de</strong> e quantida<strong>de</strong> <strong>de</strong> dados submetidos ao<br />
algoritmo, tal como mostra a tabela abaixo. Cada um dos testes, à execpção dos testes T1 a T4<br />
inclusivé, foi executado para a implementação realizada do algoritmo original (MW), para a<br />
implementação com cada uma das optimizações propostas (MW + SC e MW + ST) e para a<br />
implementação reunindo as duas optimizações (MW + SC + ST). Em cada um dos testes, proce<strong>de</strong>u-se<br />
ao cálculo do agregado ALL por forma a forçar o algoritmo a percorrer o maior número possível <strong>de</strong> níveis<br />
da MMST e utilizar o maior bloco <strong>de</strong> memória necessário para efectuar esse cálculo.<br />
2 http://illimine.cs.uiuc.edu<br />
52