16.11.2014 Views

MADS BAGGESEN - 20042326

MADS BAGGESEN - 20042326

MADS BAGGESEN - 20042326

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

Kapitel 1<br />

Indledning<br />

Jeg vil i dette speciale undersøge hvorvidt en alternativ datarepræsentation<br />

kan give bedre udførselstider på de klassiske algoritmer for skjulte<br />

markovmodeller (herefter kaldet HMMer, fra det engelske navn Hidden<br />

Markov Models). Mit fokus ligger på tynde modeller, hvor antallet af<br />

transitioner med positiv sandsynlighed er meget mindre end O(N 2 ). Jeg<br />

vil primært undersøge hvor meget der er at vinde ved at se helt bort<br />

fra alle overgange der ikke har positiv sandsynlighed - og derudover se<br />

hvor meget denne nye repræsentation så eventuelt mister når modellerne<br />

bliver helt tætte.<br />

Baggrunden for at se på tynde HMMer er at der findes flere forskellige<br />

klasser af brugbare HMMer som i deres struktur er meget tynde. Et eksempel<br />

på sådanne modeller er profilmarkovmodeller, hvor hver tilstand<br />

kun har positive transitionssandsynligheder til et konstant antal andre<br />

tilstande. Profilmodeller bruges blandt meget andet i bioinformatik til<br />

sekvensalignment (Durbin et al., 2006, kapitel 5), og det er derfor relevant<br />

at se på hvordan tynde modeller kan håndteres.<br />

Fremgangsmåden og strukturen<br />

Dette speciale er opbygget iterativt svarende til den måde de forskellige<br />

optimeringsstrategier er blevet til på. Jeg vil derfor i kapitel 2 først<br />

præsentere skjulte markovmodeller og de klassiske algoritmer der hører<br />

til.<br />

Derfra vil jeg i afsnit 3.2 gennemgå hvordan jeg vælger at repræsentere<br />

modellerne og lave en naiv implementation som kan danne et nulpunkt<br />

for at vurdere de forbedringer jeg laver.<br />

I den resterende del af kapitel 3 vil jeg præsentere forskellige ideer til<br />

forbedring af min implementation. For hver optimering vil jeg gennemgå<br />

1

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!