Algoritmen en Datastructuren III Partim: Parallelle algoritmen - caagt

More documents

Recommendations

Info

4 Hoofdstuk 1. Inleiding op basis van hun parallelle uitvoeringstijd en hun versnelling, maar ook op basis van het aantal processoren dat ze gebruiken. De kost Cp(n) van een parallel algoritme is het product van het aantal processoren p en het aantal stappen dat het algoritme uitvoert, m.a.w. Cp(n) = p × Tp(n). Merk op dat een parallel algoritme met kost Cp(n) kan omgezet worden in een sequentieel algoritme dat Θ(Cp(n)) uitvoeringstijd vraagt. Voorbeeld 1.1.3. Het parallelle algoritme uit Voorbeeld 1.1.2 heeft kost Cn(n) = Θ(nlogn), hetgeen slechter is dan het sequentiële algoritme dat uitvoeringstijd (en dus kost) T ∗ (n) = Θ(n) heeft (aangezien het n stappen uitvoert op 1 processor). In termen van kost is het parallelle algoritme dus niet optimaal, omdat er een ander algoritme bestaat dat minder kost vraagt. We noemen een algoritme kost-optimaal als Cp(n) = Θ(T ∗ (n)). Zoals we verder zullen zien, bestaan er technieken die dikwijls toelaten om parallelle algoritmen kost-optimaal te maken. 1.2 Modellen van parallelle computers Een algemeen aanvaard model voor het ontwerpen en analyseren van sequentiële algoritmen bestaat uit een centrale verwerkingseenheid, die verbonden is met een random-access geheugen. De typische instructieset voor dit model omvat lezen uit en schrijven naar het geheugen, evenals elementaire logische en rekenkundige bewerkingen. Dit model heeft zijn welslagen te danken aan zijn eenvoud enerzijds en aan het feit dat het de performantie van sequentiële algoritmen op computers van het von Neumann-type adequaat kan inschatten. Jammer genoeg is er voor parallelle berekeningen geen dergelijk algemeen aanvaard algoritmisch model beschikbaar. Een van de redenen hiervoor is het feit dat de performantie van parallelle algoritmen afhankelijk is van een complex geheel van factoren die machine-afhankelijk zijn. Deze factoren zijn onder meer de mate waarin berekeningen kunnen geparallelliseerd worden, het toewijzen van processoren aan deeltaken, het plannen van taken over verscheidene processoren, aspecten van communicatie en synchronisatie. In de praktijk worden meerdere verschillende modellen voor parallelle computers gebruikt. We kunnen bijvoorbeeld de complexiteit van de gebruikte processoren beperken. Wanneer een parallel algoritme op hardware-niveau wordt geïmplementeerd, kan het gebeuren dat we niet aan elke processor de algemeenheid van een doorsnee-processor willen geven. Bijvoorbeeld, bij het berekenen van het maximum hebben we enkel een kleine gespecialiseerde poort nodig die het maximum van twee inputs kan berekenen. Deze poort heeft zelfs geen lokaal geheugen nodig; ze moet enkel de grootste van de twee inputs verder doorgeven. Modellen van parallelle computers die op dit fijne niveau van parallellisme werken, worden circuits genoemd, naar analogie met elektrische circuits. Algoritmen en Datastructuren III Veerle.Fack@UGent.be
1.2. Modellen van parallelle computers 5 Op een minder fijn niveau van parallellisme kunnen we elke processor zien als een complete computer, die elk zijn eigen sequentiële algoritme kan uitvoeren. We spreken dan van parallelle architecturen. Op dit niveau wordt het onderscheid tussen de verschillende modellen gemaakt op basis van de manier waarop de processoren met elkaar communiceren. In het PRAM-model hebben alle processoren een gemeenschappelijk geheugen dat voor communicatie gebruikt wordt. Bepaalde taken kunnen goed worden opgelost door speciale types van netwerken, zoals ringen, bomen of roosters. In sommige gevallen zijn de processoren minder sterk met elkaar gekoppeld. Geheugen kan gedistribueerd zijn, eerder dan gedeeld; elke processor heeft zijn eigen lokale geheugen en er is geen globaal geheugen. Het kan gebeuren dat de processoren geen gemeenschappelijke klok delen, waardoor ze asynchroon moeten werken. Het kan zijn dat we weinig kennis of controle hebben over het specifieke netwerk tussen de processoren; denk bijvoorbeeld aan het Internet. We spreken dan van gedistribueerde architecturen. Algoritmen voor dergelijke architecturen zijn belangrijk in het kader van lokale netwerken en het Internet. In de volgende hoofdstukken bespreken we deze modellen in detail. Algoritmen en Datastructuren III Veerle.Fack@UGent.be
Page 1 and 2: Algoritmen en Datastructuren III Pa
Page 3 and 4: ii INHOUDSOPGAVE 3.4.1 One-to-all b
Page 5 and 6: Hoofdstuk 1 Inleiding In dit gedeel
Page 7: 1.1. Parallelle algoritmen ontwerpe
Page 11 and 12: Hoofdstuk 2 Het gedeelde-geheugenmo
Page 13 and 14: 2.1. Het gedeelde-geheugenmodel 9 A
Page 15 and 16: 2.2. De Parallel Random-Access Mach
Page 17 and 18: 2.2. De Parallel Random-Access Mach
Page 19 and 20: 2.3. Het werk-tijd-paradigma 15 ren
Page 21 and 22: 2.3. Het werk-tijd-paradigma 17 Alg
Page 23 and 24: Hoofdstuk 3 Het netwerkmodel In dit
Page 25 and 26: 3.3. Interconnectienetwerken 21 van
Page 27 and 28: 3.3. Interconnectienetwerken 23 Alg
Page 29 and 30: 3.3. Interconnectienetwerken 25 010
Page 31 and 32: 3.4. Communicatie-algoritmen 27 Alg
Page 33 and 34: 3.4. Communicatie-algoritmen 29 Dit
Page 35 and 36: 3.4. Communicatie-algoritmen 31 sam
Page 37 and 38: 3.5. Gedistribueerde algoritmen 33
Page 39 and 40: Hoofdstuk 4 Ontwerptechnieken voor
Page 41 and 42: 4.1. Pipelining / Sorteren & Priemz
Page 43 and 44: 4.2. Gebalanceerde bomen / Prefixso
Page 45 and 46: 4.2. Gebalanceerde bomen / Prefixso
Page 47 and 48: 4.3. Partitionering / Merge 43 klei
Page 49 and 50: 4.4. Accelerated cascading / Maximu
Page 51 and 52: 4.4. Accelerated cascading / Maximu
Page 53 and 54: Hoofdstuk 5 Parallelle sorteeralgor
Page 55 and 56: 5.1. Sorteernetwerken 51 (a) Een so
Page 57 and 58: 5.1. Sorteernetwerken 53 Figuur 5.5
Page 59 and 60:
5.1. Sorteernetwerken 55 bestaan zo
Page 61 and 62:
5.1. Sorteernetwerken 57 S2 S2 Figu
Page 63 and 64:
5.1. Sorteernetwerken 59 1 1 1 1 0
Page 65 and 66:
5.2. Sorteren op interconnectienetw
Page 67:
5.3. PRAM-varianten van klassieke s
show all

Algoritmen en Datastructuren III Partim: Parallelle algoritmen - caagt

You also want an ePaper? Increase the reach of your titles

Delete template?

Save as template?