15.07.2013 Views

ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa

ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa

ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

1 Introdução<br />

Ao longo das últimas décadas, as nossas capacida<strong>de</strong>s <strong>de</strong> gerar, recolher e coleccionar dados têm<br />

aumentado <strong>de</strong> forma significativa. A investigação crescente na área das tecnologias <strong>de</strong> informação e<br />

sistemas <strong>de</strong> bases <strong>de</strong> dados <strong>de</strong>s<strong>de</strong> a década <strong>de</strong> 70, associada ao custo cada vez menor e consequente<br />

vulgarização dos recursos <strong>de</strong> hardware, tornou prática relativamente comum o armazenamento <strong>de</strong><br />

diferentes tipos <strong>de</strong> dados em estruturas relacionais. Consequentemente, a maioria das organizações<br />

começou a manter dados sobre os seus eventos, activida<strong>de</strong>s e clientes, tais como inventários, históricos<br />

<strong>de</strong> vendas, fichas <strong>de</strong> clientes, dados sobre o mercado, entre outros. O facto <strong>de</strong> efectuar esta<br />

armazenagem po<strong>de</strong> ser convertido numa vantagem competitiva, <strong>de</strong>s<strong>de</strong> que os dados sejam analisados<br />

criteriosamente e com rigor, por forma a extrair <strong>de</strong>les informação útil. Porém, a quantida<strong>de</strong> <strong>de</strong> dados<br />

acumulados atingiu gran<strong>de</strong>s dimensões e cresceu muito rapidamente, pelo que exce<strong>de</strong>u a capacida<strong>de</strong><br />

humana para os compreen<strong>de</strong>r e analisar. Por esta razão, as <strong>de</strong>cisões não eram realmente tomadas com<br />

base na informação oculta nas bases <strong>de</strong> dados, dando origem a uma situação <strong>de</strong>signada como ―data rich<br />

but information poor‖ [Han2001a].<br />

Assim sendo, as exigências do mundo mo<strong>de</strong>rno e em constante mudança levaram à criação <strong>de</strong> várias<br />

técnicas e ferramentas para auxiliar os indivíduos encarregues das tomadas <strong>de</strong> <strong>de</strong>cisão nessa tarefa. A<br />

partir da década <strong>de</strong> 80, a área das tecnologias <strong>de</strong> informação verificou novamente um gran<strong>de</strong><br />

crescimento, com a adopção generalizada do mo<strong>de</strong>lo relacional e a intensificação da investigação na<br />

área das bases <strong>de</strong> dados, nomeadamente a nível dos mo<strong>de</strong>los <strong>de</strong> dados e <strong>de</strong> bases <strong>de</strong> dados<br />

orientados a aplicações e/ou fins específicos. Devido ao surgimento e expansão da Internet, a<br />

investigação nesta área passou a focar igualmente temas relacionados com a distribuição, partilha <strong>de</strong><br />

dados e a heterogeneida<strong>de</strong> das bases <strong>de</strong> dados. Surgiram, assim, sistemas sofisticados <strong>de</strong> apoio à<br />

<strong>de</strong>cisão que permitiram às organizações agilizar e tornar mais eficiente o processo <strong>de</strong> tomada <strong>de</strong><br />

<strong>de</strong>cisões com base nos dados armazenados. O termo datawarehousing refere-se exactamente a um<br />

conjunto <strong>de</strong> tecnologias <strong>de</strong> suporte à <strong>de</strong>cisão que possibilitam a análise da informação oculta pela<br />

quantida<strong>de</strong> <strong>de</strong> dados. Como as bases <strong>de</strong> dados operacionais estão organizadas no sentido <strong>de</strong> optimizar<br />

o uso diário e normalmente é necessária a consolidação <strong>de</strong> dados <strong>de</strong> diferentes fontes para fins <strong>de</strong><br />

suporte à <strong>de</strong>cisão, as datawarehouses são preferidas em relação às bases <strong>de</strong> dados correntes pelo facto<br />

<strong>de</strong> conterem registos históricos que agregam dados <strong>de</strong> diferentes fontes. Este tipo <strong>de</strong> repositório po<strong>de</strong><br />

ser implementado sobre os sistemas <strong>de</strong> gestão <strong>de</strong> base <strong>de</strong> dados relacionais, recorrendo a extensões <strong>de</strong><br />

SQL e métodos próprios para implementar as operações necessárias <strong>de</strong> forma eficiente. Porém, existe<br />

um outro tipo <strong>de</strong> data warehouses que implementam o mo<strong>de</strong>lo <strong>de</strong> dados multidimensional, no qual os<br />

dados são representados na forma <strong>de</strong> um cubo, implementados em estruturas especiais (por exemplo,<br />

arrays).<br />

In<strong>de</strong>pen<strong>de</strong>ntemente do tipo <strong>de</strong> implementação, um aspecto fulcral na análise <strong>de</strong> dados organizados<br />

segundo o mo<strong>de</strong>lo multidimensional é a computação eficiente <strong>de</strong> agregações segundo várias dimensões<br />

do cubo, ou seja, a computação dos vários cubói<strong>de</strong>s que compõem um cubo. Os algoritmos concebidos<br />

10

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!