20.07.2013 Views

BLAST 1.Wprowadzenie

BLAST 1.Wprowadzenie

BLAST 1.Wprowadzenie

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Bioinformatyka Autor: Łukasz Kościński<br />

<strong>1.Wprowadzenie</strong>:<br />

<strong>BLAST</strong><br />

<strong>BLAST</strong> (Basic Local Alignment Search Tool) – jest to narzędzie porównujące<br />

naszą badaną sekwencję z sekwencjami zdeponowanymi w bazie danych.<br />

Poszukuje on krótkich dopasowań w porównywanych sekwencjach i stara się<br />

je w miarę możliwości przedłużać.<br />

http://www.ncbi.nlm.nih.gov/blast/<br />

Jest to narzędzie na tyle uniwersalne, iż może być stosowane zarówno do<br />

porównywania sekwencji zarówno białek jak i kwasów nukleinowych. Istnieją<br />

różne odmiany <strong>BLAST</strong>a:<br />

• Blastp – porównuje sekwencję białkową z białkową bazą danych;<br />

• Blastn – porównuje sekwencję nukleotydową z nukleotydową bazą<br />

danych;<br />

• Blastx – porównuje sekwencję DNA tłumaczoną na 6 możliwych ramek<br />

odczytu do bazy białkowej<br />

• Tblastn – porównuje sekwencję białkową z bazą danych<br />

nukleotydowych (6 ramek odczytu)<br />

• Tblastx – 6 ramek odczytu porównywane z bazą również<br />

nukleotydowych ramek odczytu.<br />

• Megablast – porównuje sekwencję nukleotydową z bazą nukleotydową<br />

w poszukiwaniu wysoce podobnych sekwencji. (szybki, ale daje mało<br />

informacji).<br />

Zajęcia 5: <strong>BLAST</strong>


Bioinformatyka Autor: Łukasz Kościński<br />

Matryce PAM i BLOSUM:<br />

PAM (Percent Accepted Mutation):<br />

• matryce oparte na ewolucyjnym modelu zmian sekwencji białek<br />

• stosowane do analizy białek o tym samym rodowodzie ewolucyjnym<br />

• jednostka 1 PAM = 10 mln lat (np. matryca PAM250 – kara za otwarcie<br />

BLOSUM<br />

przerwy -12, kara za przedłużanie przerwy -1, 250% zmian w sekwencji<br />

w ciągu 2,5 mld lat)<br />

• matryce oparte na identyfikacji członków rodzin białek<br />

• oparte na małej ilości danych i modelu ewolucyjnej zmiany sekwencji<br />

• matryce skonstruowane w oparciu o sekwencje bardziej odległe<br />

ewolucyjnie<br />

• przykładowo BLOSUM 60 – grupowane sekwencje wykazują min. 60%<br />

identyczności.<br />

2.Ćwiczenia:<br />

1) W bazie CoreNucleotide znajdź inhibitor erytromycyny (ang.<br />

erythromycin), ograniczając przeszukiwanie do organizmu człowieka.<br />

2) Zapisz znalezioną sekwencję w formacie FASTA na pulpicie.<br />

3) Wejdź na stronę http://www.ncbi.nlm.nih.gov/blast/ do Nucleotide Blast i<br />

użyj programu megablast oraz w/w sekwencji do przeszukiwania w bazie<br />

„nr”. Ile uzyskano wyników?<br />

4) Korzystając z blastn wyszukaj homologi nukleotydowe powyższej<br />

sekwencji. Sekwencja jakiego innego organizmu najbardziej przypomina<br />

ludzką (nie przewidywana, lecz pewna). Jaki jest jej procent<br />

identyczności z ludzką?<br />

5) Zapisz sekwencję nukleotydową organizmu z punktu 4 w formacie<br />

FASTA na pulpicie.<br />

Zajęcia 5: <strong>BLAST</strong>


Bioinformatyka Autor: Łukasz Kościński<br />

6) Korzystając z blastx przetłumacz podaną sekwencję nukleotydową na<br />

białkową, znajdź organizm znaleziony w punkcie 4 i porównaj jego<br />

procent identyczności z wynikiem uzyskanym w poprzednim punkcie.<br />

Jeżeli wyniki różnią się wyjaśnij pokrótce dlaczego.<br />

7) Użyj narzędzia blast2seq aby porównać sekwencję ludzką z zapisaną w<br />

punkcie 5. Opisz jaka zmiana w sekwencji miała kluczowe znaczenie dla<br />

zróżnicowania wyników w punktach 4 i 6. Opcja dostępna na dole strony<br />

z <strong>BLAST</strong>EM.<br />

8) Znajdź w bazie protein sekwencję białkową o numerze dostępu<br />

AAB40343 i zapisz ją na pulpicie w formacie FASTA.<br />

9) Przy użyciu blastp przeszukaj zapisaną w poprzednim punkcie<br />

sekwencją białkową bazę danych. Po uzyskaniu wyniku nie zamykaj tego<br />

okna plizz ;).<br />

10)Zmień domyślne ustawienia blastp na matrycę PAM30 oraz karę za<br />

rozpoczęcie przerwy=5 i za wydłużenie = 2. Porównaj wyniki z<br />

uzyskanymi w punkcie 9.<br />

11)Używając PSI-Blast znajdź dalsze homologi danej sekwencji białkowej<br />

przy pomocy 3 iteracji. Ile udało Ci się znaleźć wyników w ostatniej<br />

iteracji? Na ile są one wiarygodne?<br />

Zajęcia 5: <strong>BLAST</strong>

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!