ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa
ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa
ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
2 Trabalhos prévios sobre geração <strong>de</strong> hipercubos<br />
Esta secção apresenta os trabalhos já realizados na área <strong>de</strong> geração <strong>de</strong> hipercubos e OLAP, com<br />
especial relevância para os problemas que se põem ao cálculo <strong>de</strong> agregados multidimensionais e aos<br />
vários algoritmos que foram concebidos para ultrapassar estes problemas.<br />
2.1 Mo<strong>de</strong>lo <strong>de</strong> dados multidimensional<br />
Com a crescente quantida<strong>de</strong> <strong>de</strong> dados disponíveis, o recurso a data warehouses torna-se cada vez mais<br />
necessário e frequente. Apesar disso, o conceito <strong>de</strong> data warehouse não tem uma <strong>de</strong>finição única.<br />
Normalmente, o termo é utilizado para referir uma base <strong>de</strong> dados que é mantida separada da base <strong>de</strong><br />
dados operacional <strong>de</strong> uma organização e que está integrada com vários sistemas que permitem efectuar<br />
o processamento e análise dos dados. Uma das <strong>de</strong>finições mais usadas <strong>de</strong>fen<strong>de</strong> que a data warehouse<br />
é um conjunto <strong>de</strong> dados organizados em torno <strong>de</strong> um <strong>de</strong>terminado tópico, resultante da integração <strong>de</strong><br />
diferentes fontes <strong>de</strong> dados, mantidos <strong>de</strong> forma persistente e que expressa uma perspectiva histórica<br />
<strong>de</strong>sses dados. Segundo Inmon, o conceito <strong>de</strong> data warehouse po<strong>de</strong> ser <strong>de</strong>finido como um conjunto<br />
integrado e não-volátil <strong>de</strong> informação orientada a um <strong>de</strong>terminado tema e que expressa a variação<br />
<strong>de</strong>sses dados ao longo do tempo, po<strong>de</strong>ndo esses dados ser usados para fins <strong>de</strong> apoio a <strong>de</strong>cisões<br />
[Inmon1996].<br />
Esta separação entre a base <strong>de</strong> dados operacional e a data warehouse promove a eficiência e<br />
<strong>de</strong>sempenho <strong>de</strong> cada um dos sistemas, tendo em conta os diferentes fins a que se <strong>de</strong>stina. A principal<br />
função das bases <strong>de</strong> dados operacionais é a realização <strong>de</strong> transacções online e processamento <strong>de</strong><br />
interrogações (queries), sendo esse conjunto <strong>de</strong> operações conhecido como processamento <strong>de</strong><br />
transacções online (online transaction processing - OLTP). Em oposição, as data warehouses têm por<br />
objectivo servir <strong>de</strong> suporte à análise <strong>de</strong> dados e tomada <strong>de</strong> <strong>de</strong>cisões, pelo que sobre elas são realizados<br />
outros tipos <strong>de</strong> operações. Normalmente, tratam-se <strong>de</strong> operações que manipulam gran<strong>de</strong>s quantida<strong>de</strong>s<br />
<strong>de</strong> dados históricos, permitem a realização <strong>de</strong> sumarizações e agregações e a gestão <strong>de</strong> informação em<br />
diferentes níveis <strong>de</strong> granularida<strong>de</strong>. A este tipo <strong>de</strong> operações dá-se o nome <strong>de</strong> processamento analítco<br />
online (online analytical processing - OLAP).<br />
De uma forma genérica, uma data warehouse é composta por uma tabela <strong>de</strong> factos, on<strong>de</strong> se encontram<br />
os dados que po<strong>de</strong>m ser objecto <strong>de</strong> análise, e tabelas <strong>de</strong> dimensões, que armazenam os dados sobre as<br />
perspectivas segundo as quais os factos po<strong>de</strong>m ser analisados. Tanto as data warehouses como as<br />
operações OLAP são baseadas no mo<strong>de</strong>lo multidimensional, em que os dados são visualizados sob a<br />
forma <strong>de</strong> um cubo. Um cubo é <strong>de</strong>finido por um conjunto <strong>de</strong> dimensões e <strong>de</strong> factos. De uma forma<br />
genérica, as dimensões são as perspectivas ou entida<strong>de</strong>s em relação às quais os factos se referem.<br />
Por exemplo, uma empresa po<strong>de</strong> manter uma data warehouse <strong>de</strong> vendas como forma <strong>de</strong> manter<br />
registos sobre as suas vendas no que se refere aos itens vendidos, à filial em que foram vendidos e à<br />
data <strong>de</strong> venda. Cada dimensão po<strong>de</strong> estar associada a uma tabela que pormenoriza a sua <strong>de</strong>scrição. No<br />
13