MADS BAGGESEN - 20042326

More documents

Recommendations

Info

Indhold Tak til... Abstract Indhold i iii iv 1 Indledning 1 2 Skjulte markovmodeller 3 2.1 Repræsentation af en HMM . . . . . . . . . . . . . . . . . . 4 2.2 Forwardalgoritmen . . . . . . . . . . . . . . . . . . . . . . . 6 2.3 Backwardalgoritmen . . . . . . . . . . . . . . . . . . . . . . 9 2.4 Viterbialgoritmen . . . . . . . . . . . . . . . . . . . . . . . . 10 2.5 Numerisk stabilitet . . . . . . . . . . . . . . . . . . . . . . . 11 3 Implementationer og eksperimenter 15 3.1 Eksperimentelt setup . . . . . . . . . . . . . . . . . . . . . . 15 3.2 En første, naiv implementation . . . . . . . . . . . . . . . . 19 3.3 Et forbedret memory layout . . . . . . . . . . . . . . . . . . 26 3.4 Multitrådet udgave . . . . . . . . . . . . . . . . . . . . . . . 30 4 Konklusion og fremtidigt arbejde 43 A Kode brugt i specialet 45 Litteratur 47 iv
Kapitel 1 Indledning Jeg vil i dette speciale undersøge hvorvidt en alternativ datarepræsentation kan give bedre udførselstider på de klassiske algoritmer for skjulte markovmodeller (herefter kaldet HMMer, fra det engelske navn Hidden Markov Models). Mit fokus ligger på tynde modeller, hvor antallet af transitioner med positiv sandsynlighed er meget mindre end O(N 2 ). Jeg vil primært undersøge hvor meget der er at vinde ved at se helt bort fra alle overgange der ikke har positiv sandsynlighed - og derudover se hvor meget denne nye repræsentation så eventuelt mister når modellerne bliver helt tætte. Baggrunden for at se på tynde HMMer er at der findes flere forskellige klasser af brugbare HMMer som i deres struktur er meget tynde. Et eksempel på sådanne modeller er profilmarkovmodeller, hvor hver tilstand kun har positive transitionssandsynligheder til et konstant antal andre tilstande. Profilmodeller bruges blandt meget andet i bioinformatik til sekvensalignment (Durbin et al., 2006, kapitel 5), og det er derfor relevant at se på hvordan tynde modeller kan håndteres. Fremgangsmåden og strukturen Dette speciale er opbygget iterativt svarende til den måde de forskellige optimeringsstrategier er blevet til på. Jeg vil derfor i kapitel 2 først præsentere skjulte markovmodeller og de klassiske algoritmer der hører til. Derfra vil jeg i afsnit 3.2 gennemgå hvordan jeg vælger at repræsentere modellerne og lave en naiv implementation som kan danne et nulpunkt for at vurdere de forbedringer jeg laver. I den resterende del af kapitel 3 vil jeg præsentere forskellige ideer til forbedring af min implementation. For hver optimering vil jeg gennemgå 1
Page 1: I M P L E M E N T A T I O N A F S K
Page 5: Abstract In this master’s thesis
Page 9 and 10: Kapitel 2 Skjulte markovmodeller Sk
Page 11 and 12: 2.1. REPRÆSENTATION AF EN HMM 5
Page 13 and 14: 2.2. FORWARDALGORITMEN 7 og en obse
Page 15 and 16: 2.3. BACKWARDALGORITMEN 9 I den kla
Page 17 and 18: 2.5. NUMERISK STABILITET 11 • Rek
Page 19 and 20: 2.5. NUMERISK STABILITET 13 Skaleri
Page 21 and 22: Kapitel 3 Implementationer og ekspe
Page 23 and 24: 3.1. EKSPERIMENTELT SETUP 17 0.1 1
Page 25 and 26: 3.2. EN FØRSTE, NAIV IMPLEMENTATIO
Page 33 and 34: 3.3. ET FORBEDRET MEMORY LAYOUT 27
Page 35 and 36: 3.3. ET FORBEDRET MEMORY LAYOUT 29
Page 37 and 38: 3.4. MULTITRÅDET UDGAVE 31 delinge
Page 39 and 40: 3.4. MULTITRÅDET UDGAVE 33 enkelte
Page 41 and 42: 3.4. MULTITRÅDET UDGAVE 35 Efter a
Page 43 and 44: 3.4. MULTITRÅDET UDGAVE 37 70000 6
Page 45 and 46: 3.4. MULTITRÅDET UDGAVE 39 Tidsfor
Page 47: 3.4. MULTITRÅDET UDGAVE 41 idet al
Page 51: Bilag A Kode brugt i specialet Jeg

MADS BAGGESEN - 20042326

Create successful ePaper yourself

Delete template?

Save as template?