download completo - SET - USP
download completo - SET - USP
download completo - SET - USP
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
152<br />
Célia Leiko Ogawa Kawabata, Wilson Sergio Venturini & Humberto Breves Coda<br />
O objetivo desse trabalho é a criação de um programa computacional em arquitetura paralela<br />
(ACADSOFT-P), para ser utilizado como plataforma para futuras pesquisas em métodos numéricos e<br />
mecânica estrutural. Pretende-se dar continuidade a elaboração de um sistema computacional<br />
decorrente do projeto de pesquisa de Rodrigo Ribeiro Paccola. Com o sistema em implementação<br />
criou-se no Departamento de Engenharia de Estruturas da EESC uma estratégia simples e eficiente<br />
da transformação de códigos científicos, desenvolvidos no grupo, usando modelos seqüenciais<br />
(ACADSOFT-S) utilizáveis em pesquisas aplicadas e numéricas. Esta estratégia permite a utilização,<br />
em uma mesma plataforma, de um pré-processador de um software comercial, ANSYS® por exemplo,<br />
e um pós-processador. Os resultados alcançados com o projeto mencionado foram excelentes como<br />
verificados em diversos trabalhos que se utilizam dessa estratégia, Paccola (2004). Além desses<br />
trabalhos, deve-se ainda destacar os seguintes artigos sobre o assunto publicados em periódicos de<br />
grande circulação: Greco & Coda (2004); Greco et al. (2004), Coda & Greco (2006).<br />
A opção pelo processamento paralelo está permitindo a evolução, em termos de aplicações<br />
mais complexas, da análise estrutural com a redução significativa dos tempos de processamento em<br />
comparação com os hoje observados quando se emprega o processamento seqüencial. Com o<br />
aumento de desempenho do sistema computacional está sendo possível abordar problemas diversos<br />
de engenharia estrutural tais como: impacto de veículos (automóveis, aeronaves, trens), impacto de<br />
projéteis em blindados, análise não-linear geométrica exata de edifícios altos, torres de transmissão,<br />
pontes pênseis e estaiadas etc. Deve-se mencionar que estas aplicações já estavam sendo feitas em<br />
modelos bidimensionais com bastante sucesso e tempo de processamento aceitáveis utilizando-se a<br />
plataforma do ACADSOFT seqüencial, Paccola (2004). A paralelização do método de elementos<br />
finitos em desenvolvimento está permitindo o aumento tanto do tamanho quanto do nível de<br />
detalhamento do modelo.<br />
2 METODOLOGIA<br />
O processamento paralelo de ser realizado tanto em clusters quanto em computadores de<br />
múltiplos núcleos. Há dois computadores com processadores Xeon de 8 núcleos de processamento e<br />
16 GB de RAM. O cluster é composto por 14 computadores, onde existe um computador mestre, 12<br />
computadores que fazem o papel de escravos e uma máquina que possui a mesma configuração dos<br />
computadores escravos para fazer a tomada de tempo do programa sendo executado na sua forma<br />
seqüencial para cálculo do speedup e da eficiência do programa paralelo.<br />
O computador mestre possui um processador Xeon X5160 de dois núcleos de 3 GHz cada e<br />
tem 64 GB de memória RAM. Os computadores escravos possuem processador Xeon X5460 de 4<br />
núcleos de 2,67 GHz cada e 12 GB de memória RAM. São 12 escravos com essa configuração. Os<br />
computadores que formam o cluster estão interligados com rede Gigabit Ethernet.<br />
O sistema operacional utilizado é o Linux Ubuntu versão 8.04. Nos escravos utilizou-se a<br />
versão Ubuntu Server 8.04, e no computador mestre utilizou-se a versão workstation com interface<br />
gráfica que facilita o uso do cluster.<br />
Em todos os nós foi instalado o ambiente de passagem de mensagem LAM versão 7.1.2 e o<br />
compilador Fortran Intel versão 10.<br />
As etapas que estão sendo seguidas para a execução do projeto compreendem os itens:<br />
• Estudos específicos sobre programação em paralelo utilizando linguagem FORTRAN e o<br />
ambiente de passagem de mensagem MPI.<br />
• Identificação dos pontos críticos de processamento. Nessa fase, além do estudo<br />
pormenorizado do código seqüencial e da identificação dos laços mais importantes, foram<br />
processados exemplos com grande número de graus de liberdade (com processador<br />
seqüencial) identificando pontos de consumo excessivo de tempo e de memória.<br />
Cadernos de Engenharia de Estruturas, São Carlos, v. 11, n. 53, p. 151-155, 2009