11.07.2015 Views

2014.1.futuro

2014.1.futuro

2014.1.futuro

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

NEC SX-9 vuodelta 2008, Japanin hallituksen Earth Simulator -projektissa. Käyttö avattiin 2012.dollisuudet ja alkoivat kilvan kehittääomia, erityisesti laskentaan soveltuviaversioita grafiikkasiruistaan. Niitä olivatNvidia Tesla ja ATI Firestream. Nykyäänmyös useimpia tavallisia kuluttajakäyttöönsuunnattuja GPU-piirejä voi käyttäälaskentaan. Ne ovat kuitenkin ominaisuuksiltaan,laskentateholtaan ja muisinmäärältään heikompia kuin nimenomaisestilaskentaan tarkoitetut suorittimet.Perusarkkitehtuuri on silti sama.GPU:t ovat kasvattaneet osuuttaanTop 500 -listalla ja vakiintuneet nykyäänosaksi supertietokoneiden valtavirtaa.Nvidia on selvä markkinajohtaja, mikäjohtuu pitkälti sitä, että se panostaa ohjelmointiympäristöönja kehittäjien tukemiseen.AMD:n ja ATI:n suorittimet ovatkilpailukykyisiä, mutta sekavat kehitystyökalutsekä suppea sovellus- ja kirjastotarjontaovat pitäneet ne marginaalissa.Molempien yritysten pääasialliset markkinatovat kuitenkin tavallisten kuluttajienraudassa.Grafiikan ehdoillaNykyään grafiikkaprosessoreissa on noinseitsemän miljardia transistoria, kuntaas tehokkaimmissa palvelinprosessoreissavain kolme miljardia. Ero on siisjo yli kaksinkertainen. Grafiikkasirujenteoreettinen suorituskyky on 5–10 kertaaCPU:ita parempi, ja energiankulutuksessane ovat 3–5 kertaa taloudellisempia.Tuoreimman Green 500 -listan kärkipäänkoneet hyödyntävätkin poikkeuksettaGPU-pohjaisia kiihdyttimiä.Suorituskyvyn ero selittyy muun muassasillä, että GPU:ssa ei ole läheskäänniin paljon ohjauslogiikkaa kuin CPU:ssaja lähes kaikki pinta-ala on omistettulaskentayksiköille. Tämä tosin aiheuttaasen, että prosessori ei voi suorituksenaikana yhtä älykkäästi peittää huonostioptimoidun koodin ongelmia. Niinpäohjelmoijalla ja kääntäjällä on suurempivastuu koodin optimoinnista.Siinä missä normaalissa CPU:ssa onyhtenäinen välimuisti, GPU:ssa se onhajautettu pieniin paikallismuisteihin.Tämä yksinkertaistaa prosessoria ja helpottaaarkkitehtuurin laajentamista yhäsuurempiin ydinmääriin. Tässäkin vastuuvälimuistin tehokkaasta käytöstä siirtyykääntäjälle ja ohjelmoijalle.GPU:n keskusmuisti on hyvin nopeaaGDDR-muistia, joka tarjoaa nykyään noinneljä kertaa suuremman kaistanleveydenkuin CPU:n DDR-muistit (vrt. 200 Gt/s ja50 Gt/s). GDDR-muisti on kuitenkin melkokallista ja sitä on vähemmän. Data pitäämyös siirtää ensin kortille käyttämällähitaampaa (8 Gt/s) PCI Express -väylää.AMD on kyllä suunnitellut Playstation4:ää varten mielenkiintoisen prosessorin,jossa sekä CPU että GPU käyttävätsamaa GDDR-muistia. Tuotteesta ei toistaiseksiole tiedossa ”avointa” versiota.Jotta ohjelma toimisi hyvin grafiikkasuorittimissa,koodin pitäisi olla sellaista,että se käsittelee suuria yhtenäisiä datamääriäja sisältää vain vähän if-ehtoja.Esimerkiksi Top 500 -listan matriisiratkaisusoveltuu hyvin GPU:ille, muttaesimerkiksi epäsäännöllisen verkostonkäsittely (esim. kielitieteissä) on vaikeampaa.GPU-laskenta on siis monissa tapauksissaerittäin tehokasta, mutta se ei sovellukaikkiin käyttötarkoituksiin. LisäksiGPU-ohjelmointi on edelleen melko vaativaa,vaikkakin se on helpottunut huomattavastiviime vuosina.Parhaat puolet molemmistaIntel on lähtenyt mukaan kiihdytinkilpailuunXeon Phi -prosessoreilla, jotkapohjautuvat Many Integrated Core(MIC) -arkkitehtuuriin. MICin juuretovat vuonna 2008 esitellyssä LarrabeenimisessäGPU-arkkitehtuurissa, jossasuuri osa GPU-logiikasta oli toteutettux86-ytimillä. Arkkitehtuurista ei koskaantullut kaupallista tuotetta GPU-käyttöön,mutta superkoneyhteisö heräsi: tässä olisimahdollisesti tuote, joka tarjoaa GPUtasoisensuorituskyvyn yhdistettynä x86-yhteensopivuuteen.Paria vuotta myöhemmin Intel esittelikinarkkitehtuurin uudestaan MICnimelläja hiottuna erityisesti laskentakäyttöön.Ensimmäiset Phit tulivatmarkkinoille vuonna 2013, ja ne ovat suorituskyvyltäänsamaa luokkaa GPU:idenkanssa.Fyysisesti Phi on PCI Express -kortti,joka asennetaan palvelimeen. Se poikkeaakuitenkin grafiikkakäyttöön tarkoitetuistakorkeista monin tavoin. Itseprosessorissa on 50–60 kappaletta x86-ydintä, jotka pohjautuvat alkuperäiseenPentium-arkkitehtuuriin (P54C). Ytimeenon kuitenkin tehty monia uudistuksia,merkittävimpänä 512-bittinen liukulu-41

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!