folder in pdf-formaat hier downloaden - IVPV - Instituut voor ...

ivpv.ugent.be
  • No tags were found...

folder in pdf-formaat hier downloaden - IVPV - Instituut voor ...

Module 1: Het pakket RHet softwarepakket R heeft, in tegenstelling totandere statistische pakketten, geen grafische gebruikersinterface,maar het omvat een programmeertaaldie volledig gericht is op dataverwerking en –analyse.Doordat R gemakkelijk kan worden uitgebreid,worden bijna dagelijks vanuit de onderzoekswereldnieuwe ontwikkelingen in onderzoeksmethodentoegevoegd en geïmplementeerd als nieuwe tools.In deze module bieden we een inleiding in R aanvoor wetenschappers uit alle vakgebieden. In deeerste les maken we kennis met R, de command lineen enkele editors aan de hand van enkele voorbeelden.De tweede les gaat dieper in op het werken metvectoren, matrices en data frames in R. In de derdeles introduceren we een aantal methoden voor hetmanipuleren en opkuisen van datasets. De grafischemogelijkheden van R exploreren we in de vierdeles. De vijfde les wordt gewijd aan het zelf schrijvenvan functies in R. De lessenreeks sluit af met enkelevoorbeelden van analyses. Deze worden gekozenaan de hand van de interesse van de deelnemers, enillustreren hoe de verschillende functies voor statistischeanalyse in R kunnen gebruikt worden.Er is geen voorkennis programmeren vereist voordeze module. De nadruk ligt op het programmatorischaspect van R.Lesgever: Joris MeysData: 11, 18 en 25 september, 2, 9en 16 oktober 2013Module 2: Niet-parametrischemethodenNiet-parametrische methoden worden gekenmerktdoor hun algemene geldigheid, zonder dat distributioneleveronderstellingen (zoals normaliteit) over dedata moeten gemaakt worden.De Wilcoxon en de Mann-Whitney rank testen zijnde niet-parametrische alternatieven voor de t-testen,terwijl de Kruskal-Wallis test de niet-parametrischetegenhanger is van de F-test in een ANOVA. Dezetesten maken gebruik van de asymptotische approximatieof van de exacte permutatiedistributie.Men kan ook zinvolle informatie halen uit het vergelijkenvan volledige distributies, zodat in één moeiteook de varianties en scheefheden vergeleken kunnenworden. In een niet-parametrische statistischeanalyse is deze stap van gemiddelden naar volledigedistributies eenvoudig te zetten.In de derde les worden een aantal niet-parametrischetesten besproken voor meer complexe studies (factoriëleproeven met meerdere factoren en blokkenproeven),terwijl in de vierde les, de niet-parametrische tegenhangersvan de lineaire regressieanalyse wordentoegelicht, zoals smoothers (bv. LOESS en splines) enGAMs (generalized additive models). Vermits dezeminder restrictief zijn, zijn ze breder toepasbaar.In de vijfde les komt een algemene niet-parametrischemethode aan bod voor het bekomen van approximatievevarianties en betrouwbaarheidsintervallen:de bootstrap. Deze methode wordt geïllustreerdaan de hand van enkele voorbeelden zoals regressieen correlatiecoëfficiënt.Aangezien de oefeningen met het pakket R wordengemaakt is een basiskennis van het gebruik van ditpakket vereist.Lesgevers: Olivier Thas en Jan De NeveData: 6, 13, 20 en 27 november, 4en 11 december 2013Module 3: Multivariate methodenDeze module handelt over de meest gebruikte multivariatestatistische analysetechnieken, die dichtaanleunen bij datamining (clustering, classificatie, ...).Veelal is men niet in staat om een studie statistischoptimaal op te zetten en wordt men geconfronteerdmet observationele studies. Men dient hierin eenstructuur te herkennen om tot een interpretatie eneen besluit te komen.Een eerste techniek waarmee de dimensionaliteit vaneen dataset gereduceerd kan worden is de principalecomponentenanalyse. Er wordt gezocht naar debelangrijkste (combinatie van) variabelen. Een stapverder is de factoranalyse. Dit soort analysen komtzowel voor in industrie als in marktgerichte diensten.De canonische correlatieanalyse, die op dezelfdeprincipes gebaseerd is, is een multivariate methodedie gebruikt kan worden om verbanden op te sporentussen twee multivariate subsets. Vervolgens wordtde clusteranalyse besproken. Deze heeft o.a. totdoel groepen te onderscheiden in een multivariategegevensset.Indien er reeds meer a-priori kennis is omtrent degroepen, kan een discriminantanalyse of een classificatieboomtoegepast worden om een criterium tebepalen dat gebruikt kan worden om nieuwe observatiesin één der groepen onder te verdelen.Aangezien de oefeningen met het pakket R wordengemaakt is een basiskennis van het gebruik van ditpakket vereist.Lesgever: Heidi WoutersData: 15, 22 en 29 januari,5, 12 en 19 februari 2014Module 4: StatistischegenoomanalyseSinds het begin van het millennium heeft moleculairbiologisch onderzoek een duidelijke evolutie doorgemaaktnaar high-throughput methodes, zoals hetgebruik van microarrays, high-throughput (q)PCRen second generation sequencing. Deze nieuwetechnologieën genereren enorme hoeveelheden data,gekenmerkt door enkele typische problemen zoals dehoge kostprijs - wat het aantal herhalingen beperkt- en de aanwezigheid van veel ruis en systematischeafwijkingen. Er werden dan ook specifieke statistischemethodologieën ontwikkeld om hiermee om tegaan. Binnen deze module wordt de theorie beperkttot de onderliggende ideeën die onmiddellijk inzichtbieden in de sterktes en zwaktes van de verschillendemethoden, en staat de toepassing hiervan opconcrete datasets centraal. Deze toepassingen zullenworden uitgevoerd met behulp van Bioconductor, eenverzameling van software tools binnen het statistischeframework R.Na een introductie in Bioconductor zal wordengefocust op het gebruik van microarrays voor genexpressie,met voornamelijk aandacht voor datapreprocessing, statistical testing en false discoveryrate control. Ook de data-analyse van tiling en CGHarrayskomen hier aan bod, net zoals een introductiein pathway analyse. Verschillende methodes komenterug in een tweede deel rond de verwerking vanhigh-throughput PCR data. Aangezien array en PCRgebaseerde methodes steeds meer worden vervangendoor second generation sequencing applicaties,vormen deze de basis van het derde luik. Zowel hetnut als de gevaren van data preprocessing en deverschillende statistische testen specifiek voor kwantitatievetoepassingen als RNA-seq, ChIP-seq e.a.worden toegelicht. Andere applicaties richten zichmeer op de DNA-sequentie zelf, zoals genome-wideassociation studies (GWAS). De verwerking hiervanvormt het onderwerp van het vierde luik.Een basiskennis statistiek en moleculaire biologie isvereist. Een voorkennis van R (module 1), van nietparametrischemethoden (module 2) en van multivariatemethoden (module 3) is ten zeerste aanbevolen.Lesgever: Tim De MeyerData: 12, 19 en 26 maart, 2, 23 en 30 april,7 en 14 mei 2014MEER INFO & INSCHRIJVENwww.ivpv.ugent.be/statPROGRAMMA


DeelnemingsprijsDe deelnemingsprijs omvat lesgeld, hand-outs, frisdranken, koffie en broodjes. Betaling geschiedtna ontvangst van de factuur. Alle facturen zijn contant betaalbaar dertig dagen na dagtekening.Alle vermelde bedragen zijn vrij van BTW. Voor alle modules kan afzonderlijk ingeschreven worden.Module 1: Het pakket R € 900Module 2: Niet-parametrische methoden € 900Module 3: Multivariate methoden € 900Module 4: Statistische genoomanalyse € 1.200PRAKTISCHTwee modulesDrie modules10% korting op de modulaire prijzen15% korting op de modulaire prijzenAlle modules € 3.120Korting∂∂20 % korting bij gelijktijdige inschrijvingen van hetzelfdebedrijf, op voorwaarde dat minstens 1 deelnemer zichinschrijft voor de volledige opleiding. Facturatie geschiedtdan d.m.v. een gezamenlijke factuur.∂∂10% korting voor leden van AIG (Alumnivereniging vanIngenieurs afgestudeerd aan de Universiteit Gent) enVBIG (Verbond Afgestudeerde Bio-ingenieurs van deUniversiteit Gent)∂∂Aangepaste prijzen voor personeel van UGent engeassocieerde hogescholen.∂∂Kortingen zijn niet cumuleerbaar.AnnulerenRaadpleeg onze annulatievoorwaarden opwww.ivpv.ugent.be/annulatievoorwaardenOpleidingschequesUniversiteit Gent aanvaardt:∂∂opleidingscheques voor werknemers(http://www.vdab.be/opleidingscheques)∂∂betalingen via de KMO-portefeuille (www.kmoportefeuille.be;gebruik authorisatiecode DV.O103194).Tijdstip en locatie∂∂De lessen worden gegeven van 16u30 tot 20u, in 2 delen,gescheiden door een broodjesmaaltijd.∂∂Ze vinden plaats aan de Universiteit Gent, Instituut voorPermanente Vorming, IVPV leszaal A, Technologiepark904, 9052 Zwijnaarde.∂∂Data onder voorbehoud van wijzigingen om onvoorzieneomstandigheden.HandboekenDe opleiding wordt ondersteund door volgende handboeken:∂ ∂ ‘R for Dummies’ van Andy De Vrieze en Joris Meys:€ 25 (incl. BTW) (optioneel bij module 1)∂ ∂ ‘Introduction to Nonparametric Statistics’ van J.J. Higgins:€ 75 (incl. BTW) (optioneel bij module 2)∂ ∂ ‘Multivariate Statistical Methods’ van Bryan F.J. Manly:€ 50 (incl. BTW) (optioneel bij module 3)Deze handboeken zijn optioneel . Deze zijn niet inbegrepenin de deelnemingsprijs en worden apart gefactureerd doorde boekhandel.MEER INFO & INSCHRIJVENwww.ivpv.ugent.be/statORGANISATIEUniversiteit GentInstituut voor Permanente Vorming (IVPV)Technologiepark 904, 9052 ZwijnaardeTel: +32 9 264 55 82 / Fax: +32 9 264 56 05E-mail: ivpv@UGent.beOntwerp: www.cedricverhelst.be

More magazines by this user
Similar magazines