15.07.2013 Views

ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa

ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa

ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

3 Trabalho realizado<br />

Esta secção <strong>de</strong>screve os principais aspectos da implementação realizada e as alterações propostas ao<br />

algoritmo Multi-Way no sentido <strong>de</strong> aumentar a capacida<strong>de</strong> <strong>de</strong> gestão <strong>de</strong> memória do mesmo e,<br />

consequentemente, o número <strong>de</strong> situações em que po<strong>de</strong> ser aplicado.<br />

3.1 Motivação<br />

O estudo dos trabalhos realizados nesta área mostra que a computação <strong>de</strong> agregados multidimensionais<br />

e agregados é uma operação fundamental no que se refere às aplicações OLAP, tendo sido concebidos<br />

diferentes algoritmos e estratégias <strong>de</strong> optimização para esse fim. Porém, muitos dos algoritmos<br />

anteriormente apresentados foram <strong>de</strong>senvolvidos para sistemas ROLAP, sendo o número <strong>de</strong> algoritmos<br />

<strong>de</strong>senhados para sistemas MOLAP bastante inferior. Os sistemas do tipo MOLAP são mais afectados<br />

pelo carácter esparso dos dados, uma situação frequente na vida real, mas conseguem alcançar uma<br />

eficiência semelhante à dos algoritmos para sistemas ROLAP <strong>de</strong>s<strong>de</strong> que sejam aplicadas técnicas que<br />

lhes permitam lidar com esse tipo <strong>de</strong> dados ou quando são aplicados a conjuntos <strong>de</strong> dados <strong>de</strong> pequena<br />

ou média dimensão.<br />

O algoritmo Multi-Way foi proposto por Zhao et al [Zhao1997] exactamente na sequência da ausência <strong>de</strong><br />

trabalhos nesta área. A i<strong>de</strong>ia básica <strong>de</strong>ste algoritmo resi<strong>de</strong> no aproveitamento das características<br />

inerentes a este tipo <strong>de</strong> sistemas, que pela sua própria organização dispensam a necessida<strong>de</strong> <strong>de</strong><br />

reor<strong>de</strong>nar atributos e efectuar agrupamentos <strong>de</strong> forma a que os primeiros agregados calculados possam<br />

servir <strong>de</strong> base ao cálculo <strong>de</strong> agregados posteriores: o truque consiste em percorrer os valores das<br />

dimensões, armazenados em posições fixas, da forma mais eficiente possível e calcular<br />

simultaneamente o máximo <strong>de</strong> agregados parciais espacialmente <strong>de</strong>limitados que for possível. O<br />

principal problema que se põe a esta abordagem está relacionado com a forma como os arrays vão ser<br />

geridos, uma vez que é necessário carregar e armazenar arrays que provavelmente ultrapassam a<br />

capacida<strong>de</strong> <strong>de</strong> memória existente. Para resolver os problemas <strong>de</strong> gestão <strong>de</strong> memória, os autores<br />

propuseram o uso <strong>de</strong> chunking, por forma a dividir arrays n-dimensionais em fragmentos n-dimensionais<br />

mais pequenos que po<strong>de</strong>m ser armazenados como um único objecto.<br />

Os princípios básicos <strong>de</strong>ste algoritmo, tais como a or<strong>de</strong>nação óptima, o chunking e a MMST, estiveram<br />

na base <strong>de</strong> um algoritmo <strong>de</strong>senvolvido e implementado por Tam [Tam1998], tal como explicado no<br />

<strong>de</strong>correr da secção anterior. Embora na prática o algoritmo se afaste do que foi proposto por Zhao et al,<br />

continua a ser um exemplo válido <strong>de</strong> uma implementação possível baseada nesse conjunto <strong>de</strong><br />

princípios, apesar <strong>de</strong> direccionada e optimizada para um fim específico. Porém, in<strong>de</strong>pen<strong>de</strong>ntemente dos<br />

bons resultados conseguidos, o algoritmo continua a apresentar limitações uma vez que apenas<br />

consegue computar cubos com pequena a média dimensão (com menos <strong>de</strong> <strong>de</strong>z dimensões) [Tam1998].<br />

Tendo em conta a escassez <strong>de</strong> trabalhos direccionados para sistemas MOLAP e os bons resultados<br />

alcançados por este algoritmo, consi<strong>de</strong>rou-se que seria interessante focar o trabalho sobre o algoritmo<br />

46

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!