ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa
ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa
ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
1 Introdução<br />
Ao longo das últimas décadas, as nossas capacida<strong>de</strong>s <strong>de</strong> gerar, recolher e coleccionar dados têm<br />
aumentado <strong>de</strong> forma significativa. A investigação crescente na área das tecnologias <strong>de</strong> informação e<br />
sistemas <strong>de</strong> bases <strong>de</strong> dados <strong>de</strong>s<strong>de</strong> a década <strong>de</strong> 70, associada ao custo cada vez menor e consequente<br />
vulgarização dos recursos <strong>de</strong> hardware, tornou prática relativamente comum o armazenamento <strong>de</strong><br />
diferentes tipos <strong>de</strong> dados em estruturas relacionais. Consequentemente, a maioria das organizações<br />
começou a manter dados sobre os seus eventos, activida<strong>de</strong>s e clientes, tais como inventários, históricos<br />
<strong>de</strong> vendas, fichas <strong>de</strong> clientes, dados sobre o mercado, entre outros. O facto <strong>de</strong> efectuar esta<br />
armazenagem po<strong>de</strong> ser convertido numa vantagem competitiva, <strong>de</strong>s<strong>de</strong> que os dados sejam analisados<br />
criteriosamente e com rigor, por forma a extrair <strong>de</strong>les informação útil. Porém, a quantida<strong>de</strong> <strong>de</strong> dados<br />
acumulados atingiu gran<strong>de</strong>s dimensões e cresceu muito rapidamente, pelo que exce<strong>de</strong>u a capacida<strong>de</strong><br />
humana para os compreen<strong>de</strong>r e analisar. Por esta razão, as <strong>de</strong>cisões não eram realmente tomadas com<br />
base na informação oculta nas bases <strong>de</strong> dados, dando origem a uma situação <strong>de</strong>signada como ―data rich<br />
but information poor‖ [Han2001a].<br />
Assim sendo, as exigências do mundo mo<strong>de</strong>rno e em constante mudança levaram à criação <strong>de</strong> várias<br />
técnicas e ferramentas para auxiliar os indivíduos encarregues das tomadas <strong>de</strong> <strong>de</strong>cisão nessa tarefa. A<br />
partir da década <strong>de</strong> 80, a área das tecnologias <strong>de</strong> informação verificou novamente um gran<strong>de</strong><br />
crescimento, com a adopção generalizada do mo<strong>de</strong>lo relacional e a intensificação da investigação na<br />
área das bases <strong>de</strong> dados, nomeadamente a nível dos mo<strong>de</strong>los <strong>de</strong> dados e <strong>de</strong> bases <strong>de</strong> dados<br />
orientados a aplicações e/ou fins específicos. Devido ao surgimento e expansão da Internet, a<br />
investigação nesta área passou a focar igualmente temas relacionados com a distribuição, partilha <strong>de</strong><br />
dados e a heterogeneida<strong>de</strong> das bases <strong>de</strong> dados. Surgiram, assim, sistemas sofisticados <strong>de</strong> apoio à<br />
<strong>de</strong>cisão que permitiram às organizações agilizar e tornar mais eficiente o processo <strong>de</strong> tomada <strong>de</strong><br />
<strong>de</strong>cisões com base nos dados armazenados. O termo datawarehousing refere-se exactamente a um<br />
conjunto <strong>de</strong> tecnologias <strong>de</strong> suporte à <strong>de</strong>cisão que possibilitam a análise da informação oculta pela<br />
quantida<strong>de</strong> <strong>de</strong> dados. Como as bases <strong>de</strong> dados operacionais estão organizadas no sentido <strong>de</strong> optimizar<br />
o uso diário e normalmente é necessária a consolidação <strong>de</strong> dados <strong>de</strong> diferentes fontes para fins <strong>de</strong><br />
suporte à <strong>de</strong>cisão, as datawarehouses são preferidas em relação às bases <strong>de</strong> dados correntes pelo facto<br />
<strong>de</strong> conterem registos históricos que agregam dados <strong>de</strong> diferentes fontes. Este tipo <strong>de</strong> repositório po<strong>de</strong><br />
ser implementado sobre os sistemas <strong>de</strong> gestão <strong>de</strong> base <strong>de</strong> dados relacionais, recorrendo a extensões <strong>de</strong><br />
SQL e métodos próprios para implementar as operações necessárias <strong>de</strong> forma eficiente. Porém, existe<br />
um outro tipo <strong>de</strong> data warehouses que implementam o mo<strong>de</strong>lo <strong>de</strong> dados multidimensional, no qual os<br />
dados são representados na forma <strong>de</strong> um cubo, implementados em estruturas especiais (por exemplo,<br />
arrays).<br />
In<strong>de</strong>pen<strong>de</strong>ntemente do tipo <strong>de</strong> implementação, um aspecto fulcral na análise <strong>de</strong> dados organizados<br />
segundo o mo<strong>de</strong>lo multidimensional é a computação eficiente <strong>de</strong> agregações segundo várias dimensões<br />
do cubo, ou seja, a computação dos vários cubói<strong>de</strong>s que compõem um cubo. Os algoritmos concebidos<br />
10