Tcoffee©: Çok amaçlı dizi hizalama programı - Journal of Cell and ...
Tcoffee©: Çok amaçlı dizi hizalama programı - Journal of Cell and ...
Tcoffee©: Çok amaçlı dizi hizalama programı - Journal of Cell and ...
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
Tc<strong>of</strong>fee © : <strong>Çok</strong> <strong>amaçlı</strong> <strong>dizi</strong> <strong>hizalama</strong> <strong>programı</strong><br />
Yazarlar: C. NOTREDAME, L. HOLME D.G. HIGGINS, J. HERINGA, O.<br />
O'SULLIVAN, K SUHRE, C. ABERGEL<br />
Lisans: Açık kaynak, ücretsiz yazılım<br />
Tc<strong>of</strong>fee’ye kısa bir bakış<br />
T-c<strong>of</strong>fee "Ağaç Bazlı Tutarlılık Uyum Amaç<br />
Fonksiyonunun Değerlendirilmesi" anlamına<br />
gelmektedir. <strong>Çok</strong>lu <strong>dizi</strong> <strong>hizalama</strong>sı yapmak için<br />
kullanılan yeni bir programdır. Biraz daha uzun<br />
çalışma zamanı pahasına diğer programlardan daha<br />
kesin <strong>hizalama</strong> sağlamaktadır. ClustalW gibi<br />
progresif bir program kullanmasına rağmen aynı<br />
zam<strong>and</strong>a hizalanmış bütün sekansları ifade eden<br />
bütün sekans setiyle karşılaştırmaktadır. Tc<strong>of</strong>fee<br />
sekansları <strong>hizalama</strong>k için matris yer değişimini<br />
direkt olarak kullanmamasıdır. Tc<strong>of</strong>fee ve<br />
ClustalW arasındaki ana fark Tc<strong>of</strong>fee'nin sekansları<br />
<strong>hizalama</strong>k için matris yer değişimini direkt olarak<br />
kullanmamasıdır.. Başlıca <strong>dizi</strong> ve yapıların<br />
hizalanması için EXPRESSO, bir <strong>hizalama</strong>nın<br />
kesinliğini değerlendirmek için CORE, birçok<br />
alternatif çoklu <strong>dizi</strong> <strong>hizalama</strong>larını tek olarak<br />
birleştirmek için Mc<strong>of</strong>fee gibi çok farklı<br />
uygulamalar ve modüllere sahiptir. Kısaca, Tc<strong>of</strong>fee<br />
DNA, RNA ve protein <strong>dizi</strong>leri ve yapılarının çoklu<br />
<strong>dizi</strong> <strong>hizalama</strong>sını kullanma, hesaplama ve<br />
değerlendirme için bir alet topluluğuymuş gibi<br />
tanımlanabilir.<br />
Tc<strong>of</strong>fee ve araştırmaya katkısı<br />
Son zamanlarda, moleküler biyoloji alanındaki<br />
birçok araştırmacı orijinal araştırmaları süresince<br />
çoklu <strong>dizi</strong> <strong>hizalama</strong>sı yapmak, manipüle etmek,<br />
hesaplamak ve değerlendirmek için Tc<strong>of</strong>fee<br />
modüllerini kullanmaktadır. Tc<strong>of</strong>fee birkaç yıl önce<br />
üretilmiş ve geliştirilmiş olmasına rağmen, birçok<br />
derlenmiş eşdüzey makalede atıfta bulunulmuştur.<br />
Ancak atıf sayısı hala ClustalW ile karşılaştırılamaz.<br />
Sonuçları hızlı elde etme özelliğine ilaveten,<br />
73<br />
açık kaynak ücretsiz yazılım lisansı ve çok<br />
fonksiyonlu etkili modülleri, Tc<strong>of</strong>fee’yi çoklu <strong>dizi</strong><br />
<strong>hizalama</strong>sı için en kullanışlı programlardan biri<br />
yapar.<br />
Tc<strong>of</strong>fee’nin avantajları ve dezavantajları<br />
Avantajları<br />
- Diğer metodlardan daha kesin karşılaştırmalar<br />
ortaya koyar.<br />
- Yapı <strong>hizalama</strong>, hesaplama ve <strong>hizalama</strong>ları<br />
birleştirme için CORE, Mc<strong>of</strong>fee ve EXPRESSO<br />
gibi birçok farklı aletle ve modülle donatılmıştır.<br />
- Tc<strong>of</strong>fee; FASTA, Swiss-Prot ve PIR (Protein<br />
Information Resource, Protein bilgi kaynağı) da<br />
dahil birçok input formatını düzenlemek için<br />
açabilir.<br />
- Tc<strong>of</strong>fee çeşitli fomatlarda <strong>dizi</strong> <strong>hizalama</strong>sı yapar.<br />
Bundan dolayı başka bir program için bir input<br />
olarak kullanılabilir. Ayrıca (.html) ve (pdf)<br />
formatında bu <strong>hizalama</strong>nın kalitesini belirten bir<br />
arka plan üzerinde her kalıntının göründüğü<br />
yerde renklendirilmiş bir <strong>hizalama</strong> yapar.<br />
- Neighbor Joining metodunu kullanarak Newick<br />
formatında doğru filogenetik ağaç oluşturabilir.<br />
- DNA, RNA veya Protein <strong>dizi</strong>leri listesiyle<br />
çalışabilir.<br />
- Tc<strong>of</strong>fee CORE sunucusunu kullanarak herhangi<br />
çoklu <strong>dizi</strong> <strong>hizalama</strong>sının kalitesini değerlendirebilir.<br />
Dezavantajları<br />
- <strong>Çok</strong>lu <strong>dizi</strong>leri karşılaştırmada diğer<br />
programlardan daha uzun zaman alır.<br />
- ClustalW’e göre sınırlı sayıda derlenmiş<br />
eşdüzey dergide atıfta bulunulmuştur. Ancak bu<br />
sayı her gün hızlıca artmaktadır.
74<br />
Yazılım Dizaynı<br />
T-C<strong>of</strong>fee bir açık kaynak ücretsiz yazılımdır.<br />
Verilen bir <strong>dizi</strong> seti (Protein, DNA ya da RNA) için<br />
çoklu <strong>dizi</strong> <strong>hizalama</strong>sı oluşturmaktadır. Tc<strong>of</strong>fee’nin<br />
en son versiyonu 5.65’tir. UNIX ya da Micros<strong>of</strong>t<br />
Windows/Cywin ile çalışır. Sürüm 2.00 ve üzeri<br />
yapıları ve <strong>dizi</strong>leri birleştirebilir. Bu dizaynda<br />
Bioperl kullanır. Arabirim karmaşık olmayan terim<br />
ve anlatımlarla kendiliğinden anlaşılır.<br />
EXPRESSO, Taylor ve Orengo tarafından yazılan<br />
bir program olan SAP’ı kullanarak yapıları hizaya<br />
sokar. Dizileri ve yapıları Kenji Mizuguchi’den bir<br />
<strong>dizi</strong> paketi (Cambridge üniversitesinde Tom<br />
Blundell’s Laboratuarında geliştirilen) olan<br />
FUGUE’yi kullanarak hizaya sokar.<br />
www.tc<strong>of</strong>fee.org üzerinde CORE sunucusu en<br />
yaygın formatların (MSF, ALN, FASTA ve PIR)<br />
herhangi biriyle çoklu <strong>dizi</strong> <strong>hizalama</strong> kalitesini<br />
değerlendirebilir.<br />
Kullanımda sınırlamalar<br />
- Tc<strong>of</strong>fee için input maksimum <strong>dizi</strong> sayısı 50 ve<br />
maksimum <strong>dizi</strong> uzunluğu 2000’e kadar<br />
sınırl<strong>and</strong>ırılmıştır.<br />
- Veriler sunucu üzerinde sadece dokuz gün<br />
kullanılabilir olarak kalacaktır. Sonra<br />
silinecektir.<br />
- Kaynaklarını kullanırken Tc<strong>of</strong>fee yazarlarına<br />
atıfta bulunmak önemlidir. Örneğin,<br />
Tc<strong>of</strong>fee’nin sınırlı sürümünü kullanırsanız<br />
belirtilen makaleye atfedin:-<br />
Notredame, D. Higgins, J. Heringa . T-C<strong>of</strong>fee: A<br />
novel method for multiple sequence alignments.<br />
<strong>Journal</strong> <strong>of</strong> Molecular Biology, Vol 302, pp205-<br />
217, 2000.<br />
Aksi takdirde, kull<strong>and</strong>ığınız sunucuya karşılık<br />
gelen makaleye atıfta bulunun<br />
(www.tc<strong>of</strong>fee.org üzerindeki her sunucuyla<br />
alakalı “cite” tuşuna tıklayarak).<br />
Tc<strong>of</strong>fee’nin aygıtları, belirli özellikleri ve<br />
yeni özellikler<br />
Hizalama<br />
TCOFFEE (normal ya da gelişmiş düzeyde): <strong>Çok</strong>lu<br />
<strong>dizi</strong> <strong>hizalama</strong> ve ilişkilendirilmiş filogenetik<br />
ağacı hesaplar.<br />
EXPRESSO (3DC<strong>of</strong>fee) (normal ya da gelişmiş<br />
düzeyde): Bu sunucu yapı temelli <strong>Çok</strong>lu Dizi<br />
Hizalamalarını hesaplar.<br />
MCOFFEE (normal ya da gelişmiş düzeyde):<br />
Birkaç çoklu <strong>dizi</strong> <strong>hizalama</strong> paketininin (PCMA,<br />
Poa, Mafft, Muscle, T-C<strong>of</strong>fee, ClustalW,<br />
ProbCons, DialignT) output’unu (çıkış)<br />
birleştirerek çoklu <strong>dizi</strong> <strong>hizalama</strong> ve ilişkilendirilmiş<br />
filogenetik ağacı hesaplar.<br />
COMBINE (normal ya da gelişmiş düzeyde): iki<br />
(veya daha fazla) çoklu <strong>dizi</strong> <strong>hizalama</strong>larını tek<br />
bir tanesinde birleştirir.<br />
RCOFFEE (normal ya da gelişmiş düzeyde):<br />
RNAplfold tarafından oluşturulan tahmini<br />
ikincil yapıları kullanarak Kodlanmayan RNA<br />
Dizilerinin <strong>Çok</strong>lu Dizi Hizalaması.<br />
Değerlendirme<br />
CORE (normal ya da gelişmiş düzeyde):<br />
Hizalamanızı ve kötü kısımlarının mavi iyi<br />
olanların kırmızı olduğu renkli çıktılarınızı<br />
değerlendirir. Hizalamanız en azından dört <strong>dizi</strong><br />
içermelidir.<br />
iRMSD-APDB (normal ya da gelişmiş düzeyde):<br />
İkili olarak doğru bir şekilde hizalanmış ya da<br />
yapıları bilinen <strong>dizi</strong>lerin çoklu <strong>hizalama</strong>sında<br />
sütunların oranını tahmin eden APDB<br />
kullanarak <strong>Çok</strong>lu Dizi Hizalamasını değerlendirir.<br />
Dünya çapında kullanılabilir Tc<strong>of</strong>fee<br />
sunucuları listesi<br />
- www.tc<strong>of</strong>fee.org<br />
- http://tc<strong>of</strong>fee.vital-it.ch/cgibin/Tc<strong>of</strong>fee/tc<strong>of</strong>fee_cgi/index.cgi<br />
- http://www.es.embnet.org/Services/MolBio/tc<strong>of</strong>fee/<br />
- http://www.ebi.ac.uk/t-c<strong>of</strong>fee/<br />
Ahmed MANSOUR<br />
Genetik Bölümü,<br />
Ziraat Fakültesi,<br />
Zagazig Üniversitesi, Mısır