16.07.2013 Views

Tcoffee©: Çok amaçlı dizi hizalama programı - Journal of Cell and ...

Tcoffee©: Çok amaçlı dizi hizalama programı - Journal of Cell and ...

Tcoffee©: Çok amaçlı dizi hizalama programı - Journal of Cell and ...

SHOW MORE
SHOW LESS

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

Tc<strong>of</strong>fee © : <strong>Çok</strong> <strong>amaçlı</strong> <strong>dizi</strong> <strong>hizalama</strong> <strong>programı</strong><br />

Yazarlar: C. NOTREDAME, L. HOLME D.G. HIGGINS, J. HERINGA, O.<br />

O'SULLIVAN, K SUHRE, C. ABERGEL<br />

Lisans: Açık kaynak, ücretsiz yazılım<br />

Tc<strong>of</strong>fee’ye kısa bir bakış<br />

T-c<strong>of</strong>fee "Ağaç Bazlı Tutarlılık Uyum Amaç<br />

Fonksiyonunun Değerlendirilmesi" anlamına<br />

gelmektedir. <strong>Çok</strong>lu <strong>dizi</strong> <strong>hizalama</strong>sı yapmak için<br />

kullanılan yeni bir programdır. Biraz daha uzun<br />

çalışma zamanı pahasına diğer programlardan daha<br />

kesin <strong>hizalama</strong> sağlamaktadır. ClustalW gibi<br />

progresif bir program kullanmasına rağmen aynı<br />

zam<strong>and</strong>a hizalanmış bütün sekansları ifade eden<br />

bütün sekans setiyle karşılaştırmaktadır. Tc<strong>of</strong>fee<br />

sekansları <strong>hizalama</strong>k için matris yer değişimini<br />

direkt olarak kullanmamasıdır. Tc<strong>of</strong>fee ve<br />

ClustalW arasındaki ana fark Tc<strong>of</strong>fee'nin sekansları<br />

<strong>hizalama</strong>k için matris yer değişimini direkt olarak<br />

kullanmamasıdır.. Başlıca <strong>dizi</strong> ve yapıların<br />

hizalanması için EXPRESSO, bir <strong>hizalama</strong>nın<br />

kesinliğini değerlendirmek için CORE, birçok<br />

alternatif çoklu <strong>dizi</strong> <strong>hizalama</strong>larını tek olarak<br />

birleştirmek için Mc<strong>of</strong>fee gibi çok farklı<br />

uygulamalar ve modüllere sahiptir. Kısaca, Tc<strong>of</strong>fee<br />

DNA, RNA ve protein <strong>dizi</strong>leri ve yapılarının çoklu<br />

<strong>dizi</strong> <strong>hizalama</strong>sını kullanma, hesaplama ve<br />

değerlendirme için bir alet topluluğuymuş gibi<br />

tanımlanabilir.<br />

Tc<strong>of</strong>fee ve araştırmaya katkısı<br />

Son zamanlarda, moleküler biyoloji alanındaki<br />

birçok araştırmacı orijinal araştırmaları süresince<br />

çoklu <strong>dizi</strong> <strong>hizalama</strong>sı yapmak, manipüle etmek,<br />

hesaplamak ve değerlendirmek için Tc<strong>of</strong>fee<br />

modüllerini kullanmaktadır. Tc<strong>of</strong>fee birkaç yıl önce<br />

üretilmiş ve geliştirilmiş olmasına rağmen, birçok<br />

derlenmiş eşdüzey makalede atıfta bulunulmuştur.<br />

Ancak atıf sayısı hala ClustalW ile karşılaştırılamaz.<br />

Sonuçları hızlı elde etme özelliğine ilaveten,<br />

73<br />

açık kaynak ücretsiz yazılım lisansı ve çok<br />

fonksiyonlu etkili modülleri, Tc<strong>of</strong>fee’yi çoklu <strong>dizi</strong><br />

<strong>hizalama</strong>sı için en kullanışlı programlardan biri<br />

yapar.<br />

Tc<strong>of</strong>fee’nin avantajları ve dezavantajları<br />

Avantajları<br />

- Diğer metodlardan daha kesin karşılaştırmalar<br />

ortaya koyar.<br />

- Yapı <strong>hizalama</strong>, hesaplama ve <strong>hizalama</strong>ları<br />

birleştirme için CORE, Mc<strong>of</strong>fee ve EXPRESSO<br />

gibi birçok farklı aletle ve modülle donatılmıştır.<br />

- Tc<strong>of</strong>fee; FASTA, Swiss-Prot ve PIR (Protein<br />

Information Resource, Protein bilgi kaynağı) da<br />

dahil birçok input formatını düzenlemek için<br />

açabilir.<br />

- Tc<strong>of</strong>fee çeşitli fomatlarda <strong>dizi</strong> <strong>hizalama</strong>sı yapar.<br />

Bundan dolayı başka bir program için bir input<br />

olarak kullanılabilir. Ayrıca (.html) ve (pdf)<br />

formatında bu <strong>hizalama</strong>nın kalitesini belirten bir<br />

arka plan üzerinde her kalıntının göründüğü<br />

yerde renklendirilmiş bir <strong>hizalama</strong> yapar.<br />

- Neighbor Joining metodunu kullanarak Newick<br />

formatında doğru filogenetik ağaç oluşturabilir.<br />

- DNA, RNA veya Protein <strong>dizi</strong>leri listesiyle<br />

çalışabilir.<br />

- Tc<strong>of</strong>fee CORE sunucusunu kullanarak herhangi<br />

çoklu <strong>dizi</strong> <strong>hizalama</strong>sının kalitesini değerlendirebilir.<br />

Dezavantajları<br />

- <strong>Çok</strong>lu <strong>dizi</strong>leri karşılaştırmada diğer<br />

programlardan daha uzun zaman alır.<br />

- ClustalW’e göre sınırlı sayıda derlenmiş<br />

eşdüzey dergide atıfta bulunulmuştur. Ancak bu<br />

sayı her gün hızlıca artmaktadır.


74<br />

Yazılım Dizaynı<br />

T-C<strong>of</strong>fee bir açık kaynak ücretsiz yazılımdır.<br />

Verilen bir <strong>dizi</strong> seti (Protein, DNA ya da RNA) için<br />

çoklu <strong>dizi</strong> <strong>hizalama</strong>sı oluşturmaktadır. Tc<strong>of</strong>fee’nin<br />

en son versiyonu 5.65’tir. UNIX ya da Micros<strong>of</strong>t<br />

Windows/Cywin ile çalışır. Sürüm 2.00 ve üzeri<br />

yapıları ve <strong>dizi</strong>leri birleştirebilir. Bu dizaynda<br />

Bioperl kullanır. Arabirim karmaşık olmayan terim<br />

ve anlatımlarla kendiliğinden anlaşılır.<br />

EXPRESSO, Taylor ve Orengo tarafından yazılan<br />

bir program olan SAP’ı kullanarak yapıları hizaya<br />

sokar. Dizileri ve yapıları Kenji Mizuguchi’den bir<br />

<strong>dizi</strong> paketi (Cambridge üniversitesinde Tom<br />

Blundell’s Laboratuarında geliştirilen) olan<br />

FUGUE’yi kullanarak hizaya sokar.<br />

www.tc<strong>of</strong>fee.org üzerinde CORE sunucusu en<br />

yaygın formatların (MSF, ALN, FASTA ve PIR)<br />

herhangi biriyle çoklu <strong>dizi</strong> <strong>hizalama</strong> kalitesini<br />

değerlendirebilir.<br />

Kullanımda sınırlamalar<br />

- Tc<strong>of</strong>fee için input maksimum <strong>dizi</strong> sayısı 50 ve<br />

maksimum <strong>dizi</strong> uzunluğu 2000’e kadar<br />

sınırl<strong>and</strong>ırılmıştır.<br />

- Veriler sunucu üzerinde sadece dokuz gün<br />

kullanılabilir olarak kalacaktır. Sonra<br />

silinecektir.<br />

- Kaynaklarını kullanırken Tc<strong>of</strong>fee yazarlarına<br />

atıfta bulunmak önemlidir. Örneğin,<br />

Tc<strong>of</strong>fee’nin sınırlı sürümünü kullanırsanız<br />

belirtilen makaleye atfedin:-<br />

Notredame, D. Higgins, J. Heringa . T-C<strong>of</strong>fee: A<br />

novel method for multiple sequence alignments.<br />

<strong>Journal</strong> <strong>of</strong> Molecular Biology, Vol 302, pp205-<br />

217, 2000.<br />

Aksi takdirde, kull<strong>and</strong>ığınız sunucuya karşılık<br />

gelen makaleye atıfta bulunun<br />

(www.tc<strong>of</strong>fee.org üzerindeki her sunucuyla<br />

alakalı “cite” tuşuna tıklayarak).<br />

Tc<strong>of</strong>fee’nin aygıtları, belirli özellikleri ve<br />

yeni özellikler<br />

Hizalama<br />

TCOFFEE (normal ya da gelişmiş düzeyde): <strong>Çok</strong>lu<br />

<strong>dizi</strong> <strong>hizalama</strong> ve ilişkilendirilmiş filogenetik<br />

ağacı hesaplar.<br />

EXPRESSO (3DC<strong>of</strong>fee) (normal ya da gelişmiş<br />

düzeyde): Bu sunucu yapı temelli <strong>Çok</strong>lu Dizi<br />

Hizalamalarını hesaplar.<br />

MCOFFEE (normal ya da gelişmiş düzeyde):<br />

Birkaç çoklu <strong>dizi</strong> <strong>hizalama</strong> paketininin (PCMA,<br />

Poa, Mafft, Muscle, T-C<strong>of</strong>fee, ClustalW,<br />

ProbCons, DialignT) output’unu (çıkış)<br />

birleştirerek çoklu <strong>dizi</strong> <strong>hizalama</strong> ve ilişkilendirilmiş<br />

filogenetik ağacı hesaplar.<br />

COMBINE (normal ya da gelişmiş düzeyde): iki<br />

(veya daha fazla) çoklu <strong>dizi</strong> <strong>hizalama</strong>larını tek<br />

bir tanesinde birleştirir.<br />

RCOFFEE (normal ya da gelişmiş düzeyde):<br />

RNAplfold tarafından oluşturulan tahmini<br />

ikincil yapıları kullanarak Kodlanmayan RNA<br />

Dizilerinin <strong>Çok</strong>lu Dizi Hizalaması.<br />

Değerlendirme<br />

CORE (normal ya da gelişmiş düzeyde):<br />

Hizalamanızı ve kötü kısımlarının mavi iyi<br />

olanların kırmızı olduğu renkli çıktılarınızı<br />

değerlendirir. Hizalamanız en azından dört <strong>dizi</strong><br />

içermelidir.<br />

iRMSD-APDB (normal ya da gelişmiş düzeyde):<br />

İkili olarak doğru bir şekilde hizalanmış ya da<br />

yapıları bilinen <strong>dizi</strong>lerin çoklu <strong>hizalama</strong>sında<br />

sütunların oranını tahmin eden APDB<br />

kullanarak <strong>Çok</strong>lu Dizi Hizalamasını değerlendirir.<br />

Dünya çapında kullanılabilir Tc<strong>of</strong>fee<br />

sunucuları listesi<br />

- www.tc<strong>of</strong>fee.org<br />

- http://tc<strong>of</strong>fee.vital-it.ch/cgibin/Tc<strong>of</strong>fee/tc<strong>of</strong>fee_cgi/index.cgi<br />

- http://www.es.embnet.org/Services/MolBio/tc<strong>of</strong>fee/<br />

- http://www.ebi.ac.uk/t-c<strong>of</strong>fee/<br />

Ahmed MANSOUR<br />

Genetik Bölümü,<br />

Ziraat Fakültesi,<br />

Zagazig Üniversitesi, Mısır

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!