Formato PDF - mtc-m17:80 - Inpe

More documents

Recommendations

Info

4.1.2 Estratégias de paralelização Tanto o método ACO, quanto o método LTS N tiveram seus códigos sequenciais paralelizados ao longo da tese. Em ambos casos foi possível encontrar uma estratégia de paralelização trivial, ou seja, foi possível identificar tarefas independentes com granularidade grossa e praticamente nenhuma dependência de dados entre processadores, e assim obter “speed ups” próximos ao linear. Dado o limitado número de processadores disponível, optou-se por paralelizar apenas o ACO e não o LTS N . Especificamente com relação ao LTS N , um estudo preliminar abordou as estratégias possíveis (SOUTO et al., 2003). O método, como foi visto na Equação 2.55, discretiza os ângulos de direção polar e azimutal em N e (N F + 1) valores, respectivamente, para R regiões homogêneas. Uma primeira análise pode considerar a paralelização baseada na distribuição destas quantidades entre os processadores: • N ângulos polares • N g + 1 ângulos azimutais • R regiões • uma combinação dos itens acima Os ângulos polares são fortemente acoplados, como se observa na Equação (2.55), onde têm-se que µ j ≠ µ i , nos somatórios, o que torna esta opção de paralelização inviável. Por outro lado, os modos azimutais (m = 0, 1, 2, · · · , N F ) são totalmente independentes, fazendo desta a opção adotada, onde modos diferentes podem ser atribuídos a processadores diferentes com um mínimo custo de comunicação entre eles. Obviamente isso não é possível nos casos de radiância com simetria azimutal (N F = 0). Na terceira opção, a condição de continuidade entre regiões adjacentes (Equação 2.84), força que as regiões sejam processadas em sequência, uma após a outra. A última opção seria também inviável, pois uma combinação destas opções acabaria sofrendo as limitações descritas acima. Com relação ao método de otimização ACO, a estratégia trivial é a paralelização da avaliação das formigas de cada geração/iteração. Assim, o conjunto de formigas a ser avaliado é distribuído equitativamente entre os processadores, considerando-se que o número de formigas seja múltiplo do número de processadores. Cada processador resolve o LTS N 94
para cada formiga de seu subconjunto de formigas. Esta estratégia aplica-se ao laço correspondente às linhas 8, 9 e 10 do algoritmo 3.2 3.4.1. É interessante notar que, nos casos considerados o maior tempo de processamento é demandado pela avaliação de cada solução candidata, ou seja, pelo LTS N . O esquema de pré-seleção das formigas demanda um custo de processamento relativamente menor, pois implica apenas na avaliação da norma-2 de Tikhonov e, além disso, não seria trivialmente paralelizável, pois demandaria comunicação entre processadores. Entretanto, a execução sequencial da pré-seleção afeta negativamente o "speed up"devido à Lei de Amdahl. Conforme será discutido adiante, esta penalização é maior no caso com simetria azimutal pois a fração de código sequencial (que inclui a pré-seleção) é maior comparativamente ao caso sem simetria azimutal. Apesar da opção de paralelizar o ACO, ou seja, distribuir a avaliação das formigas entre processadores, testes comparativos realizados com N F = N g =173, discretização usada em algumas reconstruções apresentadas, mostraram que o ganho de desempenho é equivalente ao que seria obtido com a paralelização dos modos azimutais do LTS N . Entretanto, conforme mencionado acima, seria possível, nos casos sem simetria azimutal, distribuir a avaliação de formigas entre processadores, sendo que, para cada avaliação, os modos azimutais do LTS N seriam distribuídos entre outros conjuntos de processadores. Para isto, seria necessária uma MPP. Os programas associados ao presente trabalho foram paralelizados pela inclusão de chamadas a rotinas da biblioteca de comunicação MPI e executados em uma máquina paralela de memória distribuída, um cluster de baixo custo, composto por 17 nós monoprocessados interligados por uma rede padrão Fast Ethernet com um switch de 24 portas. Os processadores são AMD 1,67 GHZ, de arquitetura IA32, escalares, e cada nó tem 1 GB de memória principal. Pode-se afirmar que, apesar do cluster utilizado, a paralelização tornou viável a execução dos casos de testes apresentados, possibilitando um ciclo de experimentação numérica possível de ser realizado em poucas horas. Caso contrário, seria ainda possível executar cada reconstrução independentemente num nó monoprocessado diferente, mas isso demandaria dias para cada uma. Este esquema é relativamente adequado para a execução de programas que demandam menor tempo de processamento, não estão paralelizados (ou não podem ser paralelizados) e que diferem entre si apenas por utilizarem dados de entrada diferentes. Assim, utiliza-se cada nó do 95
Page 1 and 2:
INPE-14195-TDI/1097 RECUPERAÇÃO D
Page 5:
Ao meu pai Gilberto Souto
Page 8 and 9:
À Dra. Elisabete Caria Moraes da D
Page 11:
RECONSTRUCTION OF VERTICAL PROFILES
Page 14 and 15:
4.2.2 - Radiância sem simetria azi
Page 16 and 17:
4.1 Estimativa do perfil vertical d
Page 18 and 19:
4.26 Radiâncias sem simetria azimu
Page 20 and 21:
4.9 Concentração de clorofila em
Page 23 and 24:
LISTA DE SÍMBOLOS λ - comprimento
Page 25 and 26:
CAPÍTULO 1 INTRODUÇÃO A ótica
Page 27 and 28:
e do código PEESNA (implementa o e
Page 29 and 30:
1998; STEPHANY et al., 2000b), send
Page 31 and 32:
CAPÍTULO 2 EQUAÇÃO DE TRANSFERÊ
Page 33 and 34:
Neste Capítulo, esta grandeza ganh
Page 35 and 36:
sólido dΩ ′ , com intervalo de
Page 37 and 38:
ou então, de acordo com a Equaçã
Page 39 and 40:
ou simplesmente µ dL s(τ, µ, ϕ)
Page 41 and 42:
Representando agora cosΘ em termos
Page 43 and 44: se utilizar um esquema de Gauss-Leg
Page 45 and 46: matriz M m N (s), tal como segue L
Page 47 and 48: com as letras d e u indicando se fl
Page 49 and 50: τ 0= 0 τ 1 Superficie regiao 1 re
Page 51 and 52: B (R) 21 (ζ R )L d R(0) + B (R) 22
Page 53 and 54: sadores, gerando uma massa crítica
Page 55 and 56: Dada então a ETR descrita pela Equ
Page 57 and 58: e por E ou (z; λ) = ∫ 2π ∫ π
Page 59 and 60: L [W m −2 sr −1 nm −1 ] L [W
Page 61: e à condição de continuidade nas
Page 64 and 65: MODELO DIRETO ^ PARAMETROS ~ + COND
Page 66 and 67: que suavize demais, nem tão baixo
Page 68 and 69: 1 2 3 4 5 6 7 8 9 10 Algoritmo 3.1:
Page 70 and 71: ⎡ ⎤ 1 −2 1 0 0 B (2) ⎢ ⎥
Page 72 and 73: identificar a condutividade elétri
Page 74 and 75: azul e do verde do sensor CZCS, tê
Page 76 and 77: 0 −5 −10 Profundidade z (m) −
Page 78 and 79: Neste trabalho os esforços foram n
Page 80 and 81: função objetivo J(C) é expressa
Page 82 and 83: FIGURA 3.7 - Formigas contornando o
Page 84 and 85: melhor avaliada, o incremento da co
Page 86 and 87: C min C max z 0 z 1 z 2 z 3 . . . .
Page 88 and 89: Algoritmo 3.3: Esquema de pré-sele
Page 90 and 91: Colony Optimization” (ACO) para m
Page 92 and 93: iprocessadas mais modernas tentam c
Page 96 and 97: cluster como se fosse uma máquina
Page 98 and 99: 0 −4 −9 EXATO SOLUCAO MEDIA SOL
Page 100 and 101: direções polares negativas (i = 1
Page 102 and 103: 0 −4 EXATO SOLUCAO MEDIA 0 −4 E
Page 108 and 109: L [W m −2 sr −1 nm −1 ] L [W
Page 110 and 111: 1597 Tempo (s) Tempo Ideal (s) 8 7
Page 112 and 113: 0 −4 −9 EXATO MEDIA RECUPERADOS
Page 114 and 115: O passo seguinte, consiste em aplic
Page 116 and 117: TABELA 4.9 - Concentração de clor
Page 122 and 123: problema. Foram gerados valores de
Page 126 and 127: Para o caso com simetria azimutal (
Page 128 and 129: inverso particular, com a estratég
Page 130 and 131: Uma modificação no algorítmo ACO
Page 132 and 133: CAMPOSVELHO, H. F.; RETAMOSO, M. R.
Page 134 and 135: GORDON, H. R.; CLARK, D. K. Clear w
Page 136 and 137: método LTS N . Tese (Doutorado em
Page 138 and 139: . A radiative-transfer inverse-sour
show all

Formato PDF - mtc-m17:80 - Inpe

Create successful ePaper yourself

Delete template?

Save as template?