ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa
ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa
ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
3 Trabalho realizado<br />
Esta secção <strong>de</strong>screve os principais aspectos da implementação realizada e as alterações propostas ao<br />
algoritmo Multi-Way no sentido <strong>de</strong> aumentar a capacida<strong>de</strong> <strong>de</strong> gestão <strong>de</strong> memória do mesmo e,<br />
consequentemente, o número <strong>de</strong> situações em que po<strong>de</strong> ser aplicado.<br />
3.1 Motivação<br />
O estudo dos trabalhos realizados nesta área mostra que a computação <strong>de</strong> agregados multidimensionais<br />
e agregados é uma operação fundamental no que se refere às aplicações OLAP, tendo sido concebidos<br />
diferentes algoritmos e estratégias <strong>de</strong> optimização para esse fim. Porém, muitos dos algoritmos<br />
anteriormente apresentados foram <strong>de</strong>senvolvidos para sistemas ROLAP, sendo o número <strong>de</strong> algoritmos<br />
<strong>de</strong>senhados para sistemas MOLAP bastante inferior. Os sistemas do tipo MOLAP são mais afectados<br />
pelo carácter esparso dos dados, uma situação frequente na vida real, mas conseguem alcançar uma<br />
eficiência semelhante à dos algoritmos para sistemas ROLAP <strong>de</strong>s<strong>de</strong> que sejam aplicadas técnicas que<br />
lhes permitam lidar com esse tipo <strong>de</strong> dados ou quando são aplicados a conjuntos <strong>de</strong> dados <strong>de</strong> pequena<br />
ou média dimensão.<br />
O algoritmo Multi-Way foi proposto por Zhao et al [Zhao1997] exactamente na sequência da ausência <strong>de</strong><br />
trabalhos nesta área. A i<strong>de</strong>ia básica <strong>de</strong>ste algoritmo resi<strong>de</strong> no aproveitamento das características<br />
inerentes a este tipo <strong>de</strong> sistemas, que pela sua própria organização dispensam a necessida<strong>de</strong> <strong>de</strong><br />
reor<strong>de</strong>nar atributos e efectuar agrupamentos <strong>de</strong> forma a que os primeiros agregados calculados possam<br />
servir <strong>de</strong> base ao cálculo <strong>de</strong> agregados posteriores: o truque consiste em percorrer os valores das<br />
dimensões, armazenados em posições fixas, da forma mais eficiente possível e calcular<br />
simultaneamente o máximo <strong>de</strong> agregados parciais espacialmente <strong>de</strong>limitados que for possível. O<br />
principal problema que se põe a esta abordagem está relacionado com a forma como os arrays vão ser<br />
geridos, uma vez que é necessário carregar e armazenar arrays que provavelmente ultrapassam a<br />
capacida<strong>de</strong> <strong>de</strong> memória existente. Para resolver os problemas <strong>de</strong> gestão <strong>de</strong> memória, os autores<br />
propuseram o uso <strong>de</strong> chunking, por forma a dividir arrays n-dimensionais em fragmentos n-dimensionais<br />
mais pequenos que po<strong>de</strong>m ser armazenados como um único objecto.<br />
Os princípios básicos <strong>de</strong>ste algoritmo, tais como a or<strong>de</strong>nação óptima, o chunking e a MMST, estiveram<br />
na base <strong>de</strong> um algoritmo <strong>de</strong>senvolvido e implementado por Tam [Tam1998], tal como explicado no<br />
<strong>de</strong>correr da secção anterior. Embora na prática o algoritmo se afaste do que foi proposto por Zhao et al,<br />
continua a ser um exemplo válido <strong>de</strong> uma implementação possível baseada nesse conjunto <strong>de</strong><br />
princípios, apesar <strong>de</strong> direccionada e optimizada para um fim específico. Porém, in<strong>de</strong>pen<strong>de</strong>ntemente dos<br />
bons resultados conseguidos, o algoritmo continua a apresentar limitações uma vez que apenas<br />
consegue computar cubos com pequena a média dimensão (com menos <strong>de</strong> <strong>de</strong>z dimensões) [Tam1998].<br />
Tendo em conta a escassez <strong>de</strong> trabalhos direccionados para sistemas MOLAP e os bons resultados<br />
alcançados por este algoritmo, consi<strong>de</strong>rou-se que seria interessante focar o trabalho sobre o algoritmo<br />
46