ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa

1 Introdução 

Ao longo das últimas décadas, as nossas capacidades de gerar, recolher e coleccionar dados têm 

aumentado de forma significativa. A investigação crescente na área das tecnologias de informação e 

sistemas de bases de dados desde a década de 70, associada ao custo cada vez menor e consequente 

vulgarização dos recursos de hardware, tornou prática relativamente comum o armazenamento de 

diferentes tipos de dados em estruturas relacionais. Consequentemente, a maioria das organizações 

começou a manter dados sobre os seus eventos, actividades e clientes, tais como inventários, históricos 

de vendas, fichas de clientes, dados sobre o mercado, entre outros. O facto de efectuar esta 

armazenagem pode ser convertido numa vantagem competitiva, desde que os dados sejam analisados 

criteriosamente e com rigor, por forma a extrair deles informação útil. Porém, a quantidade de dados 

acumulados atingiu grandes dimensões e cresceu muito rapidamente, pelo que excedeu a capacidade 

humana para os compreender e analisar. Por esta razão, as decisões não eram realmente tomadas com 

base na informação oculta nas bases de dados, dando origem a uma situação designada como ―data rich 

but information poor‖ [Han2001a]. 

Assim sendo, as exigências do mundo moderno e em constante mudança levaram à criação de várias 

técnicas e ferramentas para auxiliar os indivíduos encarregues das tomadas de decisão nessa tarefa. A 

partir da década de 80, a área das tecnologias de informação verificou novamente um grande 

crescimento, com a adopção generalizada do modelo relacional e a intensificação da investigação na 

área das bases de dados, nomeadamente a nível dos modelos de dados e de bases de dados 

orientados a aplicações e/ou fins específicos. Devido ao surgimento e expansão da Internet, a 

investigação nesta área passou a focar igualmente temas relacionados com a distribuição, partilha de 

dados e a heterogeneidade das bases de dados. Surgiram, assim, sistemas sofisticados de apoio à 

decisão que permitiram às organizações agilizar e tornar mais eficiente o processo de tomada de 

decisões com base nos dados armazenados. O termo datawarehousing refere-se exactamente a um 

conjunto de tecnologias de suporte à decisão que possibilitam a análise da informação oculta pela 

quantidade de dados. Como as bases de dados operacionais estão organizadas no sentido de optimizar 

o uso diário e normalmente é necessária a consolidação de dados de diferentes fontes para fins de 

suporte à decisão, as datawarehouses são preferidas em relação às bases de dados correntes pelo facto 

de conterem registos históricos que agregam dados de diferentes fontes. Este tipo de repositório pode 

ser implementado sobre os sistemas de gestão de base de dados relacionais, recorrendo a extensões de 

SQL e métodos próprios para implementar as operações necessárias de forma eficiente. Porém, existe 

um outro tipo de data warehouses que implementam o modelo de dados multidimensional, no qual os 

dados são representados na forma de um cubo, implementados em estruturas especiais (por exemplo, 

arrays). 

Independentemente do tipo de implementação, um aspecto fulcral na análise de dados organizados 

segundo o modelo multidimensional é a computação eficiente de agregações segundo várias dimensões 

do cubo, ou seja, a computação dos vários cubóides que compõem um cubo. Os algoritmos concebidos 

10

Previous page

Next page

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

25

26

27

28

29

30

31

32

33

35

36

37

38

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?