ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa

Para isso, foram estudados dois métodos básicos para computação de um único agregado: um deles é 

baseado em ordenamento (PipeSort) e outro é baseado em dispersão (PipeHash) [Agrawal1996]. Estes 

métodos podem ser aplicados à computação de múltiplos agregados recorrendo às seguintes 

optimizações: 

Pais mais pequenos (smallest-parents) – consiste em computar um agregado a partir de outros 

de menor dimensão já computados. 

Resultados em cache (cache-results) – consiste em manter em memória os resultados de um 

agregado a partir do qual seja possível calcular outros, por forma a evitar as operações de 

entrada e saída. 

Amortização de varrimentos (amortize-scans) – trata-se de amortizar o número de operações de 

leitura do disco ao computar o maior número de agregados que for possível manter em memória. 

Partilha da ordenação (share-sorts) – apenas se aplica a algoritmos baseados em ordenação e 

aposta na partilha dos custos associados à ordenação por vários agregados. 

Partilha de partições (share-partitions) – apenas se aplica a algoritmos que utilizem dispersão e 

refere-se à partição da tabela de dispersão, caso seja demasiado grande para os recursos de 

memória disponíveis, e a efectuar a agregação apenas para cada uma das partições. 

Tanto PipeSort como PipeHash computam vários agregados segundo uma lógica sequencial, sendo 

cada fio de computação constituído por agregados que podem ser computados pelo mesmo varrimento 

dos dados de entrada. De forma a estabelecer quais os agregados que podem ser computados a partir 

de outros e qual a sequência pela qual os atributos devem ser tratados, foi utilizado o conceito de malha 

de procura apresentado em [Harinarayan1996]. 

Basicamente, uma malha de procura é um grafo em que cada nó representa um agregado do cubo. 

Quando um nó i está ligado a um nó j, isso significa que o agregado j pode ser gerado a partir do 

agregado i e que j tem exactamente um atributo a menos que i [Agrawal1996]. A figura 7 apresenta um 

exemplo de uma malha de procura para quatro atributos (A, B, C e D), em que cada nível k reúne os 

agregados que contêm exactamente k atributos. 

Figura 7 - Exemplo de uma malha de procura [Agrawal1996] 

24

Previous page

Next page

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

25

26

27

28

29

30

31

32

33

35

36

37

38

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

ISCTE – ESCOLA DE GESTÃO - Universidade Técnica de Lisboa

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?