15.07.2013 Views

ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa

ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa

ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

2 Trabalhos prévios sobre geração <strong>de</strong> hipercubos<br />

Esta secção apresenta os trabalhos já realizados na área <strong>de</strong> geração <strong>de</strong> hipercubos e OLAP, com<br />

especial relevância para os problemas que se põem ao cálculo <strong>de</strong> agregados multidimensionais e aos<br />

vários algoritmos que foram concebidos para ultrapassar estes problemas.<br />

2.1 Mo<strong>de</strong>lo <strong>de</strong> dados multidimensional<br />

Com a crescente quantida<strong>de</strong> <strong>de</strong> dados disponíveis, o recurso a data warehouses torna-se cada vez mais<br />

necessário e frequente. Apesar disso, o conceito <strong>de</strong> data warehouse não tem uma <strong>de</strong>finição única.<br />

Normalmente, o termo é utilizado para referir uma base <strong>de</strong> dados que é mantida separada da base <strong>de</strong><br />

dados operacional <strong>de</strong> uma organização e que está integrada com vários sistemas que permitem efectuar<br />

o processamento e análise dos dados. Uma das <strong>de</strong>finições mais usadas <strong>de</strong>fen<strong>de</strong> que a data warehouse<br />

é um conjunto <strong>de</strong> dados organizados em torno <strong>de</strong> um <strong>de</strong>terminado tópico, resultante da integração <strong>de</strong><br />

diferentes fontes <strong>de</strong> dados, mantidos <strong>de</strong> forma persistente e que expressa uma perspectiva histórica<br />

<strong>de</strong>sses dados. Segundo Inmon, o conceito <strong>de</strong> data warehouse po<strong>de</strong> ser <strong>de</strong>finido como um conjunto<br />

integrado e não-volátil <strong>de</strong> informação orientada a um <strong>de</strong>terminado tema e que expressa a variação<br />

<strong>de</strong>sses dados ao longo do tempo, po<strong>de</strong>ndo esses dados ser usados para fins <strong>de</strong> apoio a <strong>de</strong>cisões<br />

[Inmon1996].<br />

Esta separação entre a base <strong>de</strong> dados operacional e a data warehouse promove a eficiência e<br />

<strong>de</strong>sempenho <strong>de</strong> cada um dos sistemas, tendo em conta os diferentes fins a que se <strong>de</strong>stina. A principal<br />

função das bases <strong>de</strong> dados operacionais é a realização <strong>de</strong> transacções online e processamento <strong>de</strong><br />

interrogações (queries), sendo esse conjunto <strong>de</strong> operações conhecido como processamento <strong>de</strong><br />

transacções online (online transaction processing - OLTP). Em oposição, as data warehouses têm por<br />

objectivo servir <strong>de</strong> suporte à análise <strong>de</strong> dados e tomada <strong>de</strong> <strong>de</strong>cisões, pelo que sobre elas são realizados<br />

outros tipos <strong>de</strong> operações. Normalmente, tratam-se <strong>de</strong> operações que manipulam gran<strong>de</strong>s quantida<strong>de</strong>s<br />

<strong>de</strong> dados históricos, permitem a realização <strong>de</strong> sumarizações e agregações e a gestão <strong>de</strong> informação em<br />

diferentes níveis <strong>de</strong> granularida<strong>de</strong>. A este tipo <strong>de</strong> operações dá-se o nome <strong>de</strong> processamento analítco<br />

online (online analytical processing - OLAP).<br />

De uma forma genérica, uma data warehouse é composta por uma tabela <strong>de</strong> factos, on<strong>de</strong> se encontram<br />

os dados que po<strong>de</strong>m ser objecto <strong>de</strong> análise, e tabelas <strong>de</strong> dimensões, que armazenam os dados sobre as<br />

perspectivas segundo as quais os factos po<strong>de</strong>m ser analisados. Tanto as data warehouses como as<br />

operações OLAP são baseadas no mo<strong>de</strong>lo multidimensional, em que os dados são visualizados sob a<br />

forma <strong>de</strong> um cubo. Um cubo é <strong>de</strong>finido por um conjunto <strong>de</strong> dimensões e <strong>de</strong> factos. De uma forma<br />

genérica, as dimensões são as perspectivas ou entida<strong>de</strong>s em relação às quais os factos se referem.<br />

Por exemplo, uma empresa po<strong>de</strong> manter uma data warehouse <strong>de</strong> vendas como forma <strong>de</strong> manter<br />

registos sobre as suas vendas no que se refere aos itens vendidos, à filial em que foram vendidos e à<br />

data <strong>de</strong> venda. Cada dimensão po<strong>de</strong> estar associada a uma tabela que pormenoriza a sua <strong>de</strong>scrição. No<br />

13

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!