12.07.2015 Views

Bioinformatikai algoritmusok

Bioinformatikai algoritmusok

Bioinformatikai algoritmusok

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

13.3. Algoritmusok sztochasztikus nyelvtanokon £• levezetés valószínűségét,• a legvalószínűbb levezetést,• valamint annak a valószínűségét, hogy a szekvencia egy adott a i karakterét egy adottlevezetési szabály vezette le.13.3-3. Egy rejtett Markov-modellben lehetnek úgynevezett csendes vagy nem kibocsátóállapotok, melyek a rejtett Markov-modell ábrázolását elősegíthetik. Mutassuk meg, hogyminden rejtett Markov-modell, mely csendes állapotokat tartalmaz, átírható olyan rejtettMarkov-modellé, amely nem tartalmaz csendes állapotokat, és ekvivalens az eredeti modellel,azaz ugyanazon szekvenciákat ugyanakkora valószínűséggel bocsátja ki.13.3-4. A páros rejtett Markov-modellek olyan rejtett Markov-modellek, melyekben azegyes állapotok nem csak egy szekvenciába bocsátanak ki karaktereket, hanem kettőbe.Egyes állapotok csak az egyik szekvenciába, mások csak a másikba, ismét mások pedigmindkét szekvenciába bocsátanak ki karaktereket. Egy állapot egy lépésben mindegyikszekvenciába legfeljebb egy karaktert bocsáthat ki. Adjuk meg a páros rejtett MarkovfolyamatokVITERBI, ELŐRE és HÁTRA algoritmusait.13.3-5. Viterbi algoritmusában nem használtuk ki, hogy a tranzíciók és a kibocsátási valószínűségekvalószínűségek, azaz nem negatívak és eggyé összegződnek. Valamint az algoritmusakkor is működik, ha szorzás helyett összeadások vannak, és maximalizálás helyettakár minimalizálhatunk is. Adjunk meg egy olyan módosított páros rejtett Markov-modellt(amelyben a ”valószínűségek” nem feltétlenül nem negatívak, és nem feltétlenül összegződnekeggyé), melyre Viterbi algoritmusa összeadásokkal és minimalizálással ekvivalensGotoh algoritmusával.13.3-6. Másodlagos térszerkezetnek nevezzük az RNS-ek olyan bázispárosodását, amelybena bázispárosodott nukleinsavakat összekötő, a szekvencia fölött haladó ívek nem metszikegymást. A lehetséges bázispárosodások: A − U, U − A, C − G, G − C, G − U és U − G.Adjunk meg egy dinamikus programozási algoritmust, amely egy adott RNS szekvenciáramegkeresi azt a másodlagos térszerkezetet, melyben a párosodott nukleinsavak száma maximális.13.3-7. A Knudsen–Hein-nyelvtan levezetési szabályai:S → LS |L ,F → dFd|LS ,L → s|dFd ,ahol minden s terminális levezetést még helyettesíteni kell az RNS szekvenciák lehetségeskaraktereivel, a dFd kifejezésben pedig a két d terminális szimbólumot helyettesítenikell a lehetséges bázispárosodásokkal. Mutassuk meg, hogy adott szekvencia és a levezetésekadott valószínűségi eloszlása esetén meg lehet adni egy olyan dinamikus programozásialgoritmust, amely megadja a szekvencia levezetésének a valószínűségét, anélkül, hogyChomsky-féle normálformába írnánk át a nyelvtant.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!