MADS BAGGESEN - 20042326
MADS BAGGESEN - 20042326
MADS BAGGESEN - 20042326
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
Kapitel 1<br />
Indledning<br />
Jeg vil i dette speciale undersøge hvorvidt en alternativ datarepræsentation<br />
kan give bedre udførselstider på de klassiske algoritmer for skjulte<br />
markovmodeller (herefter kaldet HMMer, fra det engelske navn Hidden<br />
Markov Models). Mit fokus ligger på tynde modeller, hvor antallet af<br />
transitioner med positiv sandsynlighed er meget mindre end O(N 2 ). Jeg<br />
vil primært undersøge hvor meget der er at vinde ved at se helt bort<br />
fra alle overgange der ikke har positiv sandsynlighed - og derudover se<br />
hvor meget denne nye repræsentation så eventuelt mister når modellerne<br />
bliver helt tætte.<br />
Baggrunden for at se på tynde HMMer er at der findes flere forskellige<br />
klasser af brugbare HMMer som i deres struktur er meget tynde. Et eksempel<br />
på sådanne modeller er profilmarkovmodeller, hvor hver tilstand<br />
kun har positive transitionssandsynligheder til et konstant antal andre<br />
tilstande. Profilmodeller bruges blandt meget andet i bioinformatik til<br />
sekvensalignment (Durbin et al., 2006, kapitel 5), og det er derfor relevant<br />
at se på hvordan tynde modeller kan håndteres.<br />
Fremgangsmåden og strukturen<br />
Dette speciale er opbygget iterativt svarende til den måde de forskellige<br />
optimeringsstrategier er blevet til på. Jeg vil derfor i kapitel 2 først<br />
præsentere skjulte markovmodeller og de klassiske algoritmer der hører<br />
til.<br />
Derfra vil jeg i afsnit 3.2 gennemgå hvordan jeg vælger at repræsentere<br />
modellerne og lave en naiv implementation som kan danne et nulpunkt<br />
for at vurdere de forbedringer jeg laver.<br />
I den resterende del af kapitel 3 vil jeg præsentere forskellige ideer til<br />
forbedring af min implementation. For hver optimering vil jeg gennemgå<br />
1