download completo - SET - USP

More documents

Recommendations

Info

152 Célia Leiko Ogawa Kawabata, Wilson Sergio Venturini & Humberto Breves Coda O objetivo desse trabalho é a criação de um programa computacional em arquitetura paralela (ACADSOFT-P), para ser utilizado como plataforma para futuras pesquisas em métodos numéricos e mecânica estrutural. Pretende-se dar continuidade a elaboração de um sistema computacional decorrente do projeto de pesquisa de Rodrigo Ribeiro Paccola. Com o sistema em implementação criou-se no Departamento de Engenharia de Estruturas da EESC uma estratégia simples e eficiente da transformação de códigos científicos, desenvolvidos no grupo, usando modelos seqüenciais (ACADSOFT-S) utilizáveis em pesquisas aplicadas e numéricas. Esta estratégia permite a utilização, em uma mesma plataforma, de um pré-processador de um software comercial, ANSYS® por exemplo, e um pós-processador. Os resultados alcançados com o projeto mencionado foram excelentes como verificados em diversos trabalhos que se utilizam dessa estratégia, Paccola (2004). Além desses trabalhos, deve-se ainda destacar os seguintes artigos sobre o assunto publicados em periódicos de grande circulação: Greco & Coda (2004); Greco et al. (2004), Coda & Greco (2006). A opção pelo processamento paralelo está permitindo a evolução, em termos de aplicações mais complexas, da análise estrutural com a redução significativa dos tempos de processamento em comparação com os hoje observados quando se emprega o processamento seqüencial. Com o aumento de desempenho do sistema computacional está sendo possível abordar problemas diversos de engenharia estrutural tais como: impacto de veículos (automóveis, aeronaves, trens), impacto de projéteis em blindados, análise não-linear geométrica exata de edifícios altos, torres de transmissão, pontes pênseis e estaiadas etc. Deve-se mencionar que estas aplicações já estavam sendo feitas em modelos bidimensionais com bastante sucesso e tempo de processamento aceitáveis utilizando-se a plataforma do ACADSOFT seqüencial, Paccola (2004). A paralelização do método de elementos finitos em desenvolvimento está permitindo o aumento tanto do tamanho quanto do nível de detalhamento do modelo. 2 METODOLOGIA O processamento paralelo de ser realizado tanto em clusters quanto em computadores de múltiplos núcleos. Há dois computadores com processadores Xeon de 8 núcleos de processamento e 16 GB de RAM. O cluster é composto por 14 computadores, onde existe um computador mestre, 12 computadores que fazem o papel de escravos e uma máquina que possui a mesma configuração dos computadores escravos para fazer a tomada de tempo do programa sendo executado na sua forma seqüencial para cálculo do speedup e da eficiência do programa paralelo. O computador mestre possui um processador Xeon X5160 de dois núcleos de 3 GHz cada e tem 64 GB de memória RAM. Os computadores escravos possuem processador Xeon X5460 de 4 núcleos de 2,67 GHz cada e 12 GB de memória RAM. São 12 escravos com essa configuração. Os computadores que formam o cluster estão interligados com rede Gigabit Ethernet. O sistema operacional utilizado é o Linux Ubuntu versão 8.04. Nos escravos utilizou-se a versão Ubuntu Server 8.04, e no computador mestre utilizou-se a versão workstation com interface gráfica que facilita o uso do cluster. Em todos os nós foi instalado o ambiente de passagem de mensagem LAM versão 7.1.2 e o compilador Fortran Intel versão 10. As etapas que estão sendo seguidas para a execução do projeto compreendem os itens: • Estudos específicos sobre programação em paralelo utilizando linguagem FORTRAN e o ambiente de passagem de mensagem MPI. • Identificação dos pontos críticos de processamento. Nessa fase, além do estudo pormenorizado do código seqüencial e da identificação dos laços mais importantes, foram processados exemplos com grande número de graus de liberdade (com processador seqüencial) identificando pontos de consumo excessivo de tempo e de memória. Cadernos de Engenharia de Estruturas, São Carlos, v. 11, n. 53, p. 151-155, 2009
Desenvolvimento e implementação de um Método de Elementos Finitos paralelo para análise não linear de... 153 • Paralelização do programa. A paralelização do programa foi desenvolvida em uma máquina do tipo PC utilizando o sistema operacional Linux. Primeiro paralelizou-se a integração de elementos, depois a montagem da matriz Hessiana e por último a solução do sistema. • Processamento de modelos com grande número de graus de liberdade. Estão sendo processados exemplos reais que antes não eram passíveis de serem processados devido ao consumo de memória excessivo e ao tempo de processamento. Os mesmos passos serão seguidos para a paralelização do algoritmo de elementos de contorno. 3 DESENVOLVIMENTO A paralelização do código do método de elementos finitos está finalizada. Inicialmente paralelizou-se a integração dos elementos, depois a montagem da matriz e por fim a solução do sistema. A comunicação entre os nós foi implementada com o envio apenas dos dados necessários para a execução dos escravos. Foi implementada uma fase de pré-processamento da montagem da matriz, definindo-se rotulação direta das posições relativas dos graus de liberdade para balancear o processamento da montagem da matriz. Assim, tanto a integração dos elementos quanto o tempo de montagem da matriz se tornaram balanceados. Essa modificação não apenas balanceou a carga entre os processadores escravos como também proporcionou um ganho de desempenho tanto no programa seqüencial quanto no paralelo. Outra modificação efetuada no código foi a otimização do uso da memória nos escravos. Os escravos passaram a alocar apenas a memória necessária para o cálculo da parte que lhes cabe. Dessa forma, apenas o processador mestre precisa de mais memória para a montagem da matriz completa e da solução do sistema. A solução do sistema foi paralelizada utilizando o software aberto MUMPS (Multifrontal Massively Parallel Solver) (Amestoy et al., 2006) versão 4.8.4. Ele foi escolhido por suportar tanto arquitetura seqüencial quanto paralela, estar totalmente adaptado para o formato da matriz comprimida utilizada pelo MA27 e utilizar o ambiente de passagem de mensagem MPI. Há um ganho de desempenho com a adoção do software MUMPS, tanto no caso seqüencial quanto no caso paralelo. Dependendo do modelo que está sendo utilizado alcança-se um desempenho (caso seqüencial) de até 5 vezes mais rápido que o MA27. No atual estágio, a integração dos elementos e montagem da matriz são feitos nos escravos, que enviam os resultados para o mestre que então redistribui a matriz para que o sistema seja resolvido. Atualmente está em fase de implementação o cálculo da solução da matriz distribuída, sem a necessidade de comunicação com o mestre, diminuindo o tráfego e a necessidade de memória no mestre para o armazenamento da matriz completa. O algoritmo do método de elementos de contorno está em fase de análise e preparação para a paralelização. Como os passos de tempo nesse tipo de método são calculados independentemente, a paralelização será feita dividindo-se o total de passos de tempo entre os processadores escravos. 4 RESULTADOS OBTIDOS Para uma análise global do programa paralelizado, utilizou-se um toróide com 201.600 graus de liberdade. A Figura 1 mostra os resultados, considerando-se o comportamento do speedup de acordo com o número de escravos e cada parte do programa. Cadernos de Engenharia de Estruturas, São Carlos, v. 11, n. 53, p. 151-155, 2009
Page 1 and 2:
Edição Especial ENDOSET 2009 São
Page 3 and 4:
Edição Especial ENDOSET 2009 São
Page 5:
Fica aqui expresso o agradecimento
Page 8 and 9:
Inserção de laminados de PRFC em
Page 10 and 11:
Uma formulação para identificaç
Page 12 and 13:
2 Alexandre Luis Sudano & João Ben
Page 14 and 15:
4 Alexandre Luis Sudano & João Ben
Page 17 and 18:
ISSN 1809-5860 CISALHAMENTO EM LAJE
Page 19 and 20:
Cisalhamento em lajes alveolares pr
Page 21:
Cisalhamento em lajes alveolares pr
Page 24 and 25:
14 Christiane Mylena Tavares de Men
Page 26 and 27:
16 Christiane Mylena Tavares de Men
Page 28 and 29:
18 Eduardo Aurélio Barros Aguiar &
Page 30 and 31:
20 Eduardo Aurélio Barros Aguiar &
Page 32 and 33:
22 Jefferson Lins da Silva & Mounir
Page 34 and 35:
24 Jefferson Lins da Silva & Mounir
Page 37 and 38:
ISSN 1809-5860 ESTUDO DA LIGAÇÃO
Page 39 and 40:
Estudo da ligação entre pilares m
Page 41:
Estudo da ligação entre pilares m
Page 44 and 45:
34 Luiz Álvaro de Oliveira Júnior
Page 46 and 47:
36 Luiz Álvaro de Oliveira Júnior
Page 49 and 50:
ISSN 1809-5860 ANÁLISE NUMÉRICA E
Page 51 and 52:
Análise numérica e experimental d
Page 53:
Análise numérica e experimental d
Page 56 and 57:
46 Rodrigo Carvalho da Mata & Márc
Page 58 and 59:
48 Rodrigo Carvalho da Mata & Márc
Page 61 and 62:
ISSN 1809-5860 PRÉ-MOLDADOS ESBELT
Page 63 and 64:
Pré-moldados esbeltos em CAD 53 O
Page 65:
Pré-moldados esbeltos em CAD 55 7
Page 68 and 69:
58 Sandra Freire de Almeida & João
Page 70 and 71:
60 Sandra Freire de Almeida & João
Page 73 and 74:
ISSN 1809-5860 INSERÇÃO DE LAMINA
Page 75 and 76:
Page 77:
Page 80 and 81:
70 Julio Cesar Molina & Carlito Cal
Page 82 and 83:
72 Julio Cesar Molina & Carlito Cal
Page 85 and 86:
ISSN 1809-5860 AVALIAÇÃO DA RIGID
Page 87 and 88:
Avaliação da rigidez à flexão d
Page 89:
Avaliação da rigidez à flexão d
Page 92 and 93:
82 Pedro Gutemberg de Alcântara Se
Page 94 and 95:
84 Pedro Gutemberg de Alcântara Se
Page 97 and 98:
ISSN 1809-5860 ESTUDO DO COMPORTAME
Page 99 and 100:
Estudo do comportamento de ligaçõ
Page 101 and 102:
Estudo do comportamento de ligaçõ
Page 103 and 104:
ISSN 1809-5860 DESENVOLVIMENTO E AP
Page 105 and 106:
Desenvolvimento e aplicação de c
Page 107:
Desenvolvimento e aplicação de c
Page 110 and 111:
100 Saulo José de Castro Almeida &
Page 112 and 113: 102 Saulo José de Castro Almeida &
Page 114 and 115: 104
Page 116 and 117: 106 Wanderson Fernando Maia & Maxim
Page 118 and 119: 108 Wanderson Fernando Maia & Maxim
Page 120 and 121: 110
Page 122 and 123: 112 Ana Paula Moreno Trigo & Jeffer
Page 124 and 125: 114 Ana Paula Moreno Trigo & Jeffer
Page 126 and 127: 116
Page 128 and 129: 118 Edmar Borges Theóphilo Prado &
Page 130 and 131: 120 Edmar Borges Theóphilo Prado &
Page 132 and 133: 122
Page 134 and 135: 124 Eduardo Toledo de Lima Junior &
Page 136 and 137: 126 Eduardo Toledo de Lima Junior &
Page 138 and 139: 128
Page 140 and 141: 130 Thiago Catoia & Jefferson Bened
Page 142 and 143: 132 Thiago Catoia & Jefferson Bened
Page 144 and 145: 134
Page 146 and 147: 136 Edson Denner Leonel & Wilson Se
Page 148 and 149: 138 Edson Denner Leonel & Wilson Se
Page 150 and 151: 140
Page 152 and 153: 142 Ana Paula Ferreira Ramos & Joã
Page 154 and 155: 144 Ana Paula Ferreira Ramos & Joã
Page 156 and 157: 146 Caio Gorla Nogueira & Wilson Se
Page 158 and 159: 148 Caio Gorla Nogueira & Wilson Se
Page 160 and 161: 150
Page 164 and 165: 154 Célia Leiko Ogawa Kawabata, Wi
Page 166 and 167: 156
Page 168 and 169: 158 Dimas Betioli Ribeiro & João B
Page 170 and 171: 160 Dimas Betioli Ribeiro & João B
Page 172 and 173: 162 João Paulo Pascon & Humberto B
Page 174 and 175: 164 João Paulo Pascon & Humberto B
Page 176 and 177: 166
Page 178 and 179: 168 Manoel Dênis Costa Ferreira &
Page 180 and 181: 170 Manoel Dênis Costa Ferreira &
Page 182 and 183: 172 Michell Macedo Alves & Sergio P
Page 184 and 185: 174 Michell Macedo Alves & Sergio P
Page 186 and 187: 176
Page 188 and 189: 178 Raimundo Gomes de Amorim Neto &
Page 190 and 191: 180
Page 192 and 193: 182 Robenson Luiz Minski & Humberto
Page 194 and 195: 184 Robenson Luiz Minski & Humberto
Page 196 and 197: 186
Page 198 and 199: 188 Rodolfo André Kuche Sanches &
Page 200 and 201: 190 Rodolfo André Kuche Sanches &
Page 202: 192
show all

download completo - SET - USP

Create successful ePaper yourself

Delete template?

Save as template?