Scarica il pdf con la mia tesi - Parallel Programming Laboratory

More documents

Recommendations

Info

28 Modifiche al codice Cap. 4zione: uno locale e uno globale la cui dimensione è impostabile dall’utente (CommSize,vedi Sez. 4.7 a pag. 39 per una descrizione del parametro).P 0P 1P 2P 3Dati da elaborare(in buffer Locale)Esportazione a tuttii processoriutilizzo di SendRecvper la comunicazionediretta con tutti iprocessori singolarmenteDati esportati per elaborazione(in buffer Globale)P 0P 1P 2P 3Ogni processorefa i calcoli sui datiricevuti con i datiin suo possessoP 0I contributi parziali dei variP 0P 1processori vengonoriaggregati sommandoliP 1P 2P 3Risultati totali riaggregati(in buffer Locale)utilizzo di SendRecvpiù somme eseguitelocalmenteRisultati parziali dei calcoli locali(in buffer Globale)P 2P 3Figura 4.1: Schema di come vengono utilizzati i buffer per il calcolo delle forze inremotoNel buffer locale vengono posti i dati dai singoli processori prima di essere esportatie i dati raccolti dai processori dopo le elaborazioni in remoto. Poiché in questi bufferdevono essere contenuti solo i dati relativi ad un processore la loro dimensione è metàdi quella dei buffer globali in quanto un processore non deve mai poter avere più dimetà di tutti i dati da gestire, altrimenti ci si troverebbe sicuramente in una situazionedi forte sbilanciamento, cosa da evitare.Nel buffer globale vengono invece posti tutti i dati provenienti da tutti i processoriin modo che quando un processore deve fare i suoi calcoli trovi tutto in un array unicoe possa scandirlo con maggiore facilità. Questi buffer vengono poi sovrascritti a manoa mano che i dati vengono consumati e si producono i risultati. In questo modo si evitadi dover allocare due buffer per mantenere input e output. Per evitare di cancellare datiprima che siano stati utilizzati basta avere l’accortezza di iniziare ad elaborare i dati apartire dalla fine del buffer qualora i dati in uscita siano più grandi di quelli in ingresso.La Figura 4.1 mostra come tale procedimento evolve nel tempo: ogni processoreha una certa quantità di particelle da avanzare e quindi su cui calcolare le forze. Questevengono inviate a tutti i processori (compreso se stesso) e posizionate nel buffer globale.A questo punto ogni processore può eseguire i calcoli con i dati in suo possesso
Sez. 4.3 Spostamento di particelle 29ReceiverSenderGlobaleGlobaleProcessori difrontieraProcessoreROOTLocaleAltri processorinon di frontieraLocaleAltri processoriFigura 4.2: Rappresentazione di come avviene lo spostamento delle particelle tra ledue parti di un taglio quando si necessità di un ribilanciamento.su tutte le particelle ricevute e sovrascrivere i dati iniziali con i risultati parziali (datiin grigio nella figura), infine questi vengono rimandati ai proprietari delle particelle iquali provvederanno a sommare tutti i contributi ricevuti e a sistemarli nel buffer localee da qui poi dove sono tenute le particelle.Ovviamente può accadere che il buffer globale non sia in grado di tenere tutte leparticelle da aggiornare, in questo caso si ripete la procedura più volte fino ad esauriretutti i dati. In ogni passo di trasmissione il buffer verrà a contenere le particelle da tutti iprocessori che necessitano aggiornamenti in maniera proporzionale a quante particellevogliono avanzare, in questo modo un processore avrà alcune particelle vicine su cuidovrà effettuare più calcoli e alcune particelle lontane su cui ne dovrà effettuare dimeno andando quindi a distribuire il carico in modo più uniforme possibile.4.3 Spostamento di particelleUna volta che il programma ha deciso secondo le modalità analizzate nella Sez. 3.3a pag. 18 che per ribilanciare i tempi di calcolo è necessario spostare delle particelle,queste vengono spostate mediante l’utilizzo dei buffer come illustrato in Figura 4.2.Come si può vedere, i processori che devono ricevere particelle si predispongonoa riceverle nel loro buffer globale per poi analizzarle e decidere se tenerle. È da evi-
Page 1: UNIVERSITÀ DI PADOVAFACOLTÀ DI IN
Page 5 and 6: IndiceSommariovii1 Introduzione 12
Page 7: Elenco delle figure2.1 Esempio di a
Page 11 and 12: Capitolo 1IntroduzioneLa cosmologia
Page 13 and 14: Capitolo 2Gli algoritmi utilizzati2
Page 15 and 16: Sez. 2.2 Codici Tree 5Figura 2.1: E
Page 17 and 18: Sez. 2.3 Codici SPH 7celle di un fl
Page 19 and 20: Sez. 2.3 Codici SPH 9Figura 2.3: An
Page 21 and 22: Sez. 2.4 Integrazione temporale 11
Page 23 and 24: Capitolo 3Strategie di parallelizza
Page 25 and 26: Sez. 3.1 La decomposizione 15Proc 0
Page 27 and 28: Sez. 3.2 Le comunicazioni 17P 1P 2
Page 29 and 30: Sez. 3.3 Lo sbilanciamento 19P 0dat
Page 31 and 32: Sez. 3.3 Lo sbilanciamento 21a rend
Page 33 and 34: Sez. 3.3 Lo sbilanciamento 23P 0 ca
Page 35 and 36: Sez. 3.3 Lo sbilanciamento 25al mom
Page 37: Capitolo 4Modifiche al codiceIn que
Page 41 and 42: Sez. 4.4 Ricerca dei vicini e domin
Page 43 and 44: Sez. 4.5 Metodi di scrittura dei fi
Page 45 and 46: Sez. 4.5 Metodi di scrittura dei fi
Page 47 and 48: Sez. 4.6 Modifiche alla struttura m
Page 49 and 50: Sez. 4.7 Modifiche al file dei para
Page 51 and 52: Capitolo 5PrestazioniDato che sul c
Page 53 and 54: 43Monoprocessore 4 processori 8 pro
Page 55 and 56: Figura 5.1: Immagine a redshift zer
Page 57 and 58: Capitolo 6ConclusioniLa parallelizz
Page 59 and 60: Appendice AGlossarioAAstrofisica Di
Page 61 and 62: 51Multiprocessore Sistema al cui in
Page 63 and 64: Appendice BUtilizzo del codiceDato
Page 65: Bibliografia[Aoyama, 1][MPI, 2]Y. A

Scarica il pdf con la mia tesi - Parallel Programming Laboratory

Create successful ePaper yourself

Delete template?

Save as template?