Text S1: Protein sequences and alignments of all proteins found in ...

More documents

Recommendations

Info

AT1G07920 MGKEKFHINIVVIGHVDSGKSTTTGHLIYKLGGIDKRVIERFEKEAAEMNKRSFKYAWVLDKLKAERERGITIDIALWKFETTKYYCTVIDAPGHRDFIK NMITGTSQADCAVLIIDSTTGGFEAGISKDGQTREHALLAFTLGVKQMICCCNKMDATTPKYSKARYDEIIKEVSSYLKKVGYNPDKIPFVPISGFEGDN MIERSTNLDWYKGPTLLEALDQINEPKRPSDKPLRLPLQDVYKIGGIGTVPVGRVETGMIKPGMVVTFAPTGLTTEVKSVEMHHESLLEALPGDNVGFNV KNVAVKDLKRGYVASNSKDDPAKGAANFTSQVIIMNHPGQIGNGYAPVLDCHTSHIAVKFSEILTKIDRRSGKEIEKEPKFLKNGDAGMVKMTPTKPMVV ETFSEYPPLGRFAVRDMRQTVAVGVIKSVDKKDPTGAKVTKAAVKKGAK GENE ID: 1915 EEF1A1 | eukaryotic translation elongation factor 1 alpha 1 [Homo sapiens] (Over 10 PubMed links) Score = 716 bits (1848), Expect = 0.0, Method: Compositional matrix adjust. Identities = 347/457 (75%), Positives = 391/457 (85%), Gaps = 12/457 (2%) Query 1 MGKEKFHINIVVIGHVDSGKSTTTGHLIYKLGGIDKRVIERFEKEAAEMNKRSFKYAWVL 60 MGKEK HINIVVIGHVDSGKSTTTGHLIYK GGIDKR IE+FEKEAAEM K SFKYAWVL Sbjct 1 MGKEKTHINIVVIGHVDSGKSTTTGHLIYKFGGIDKRTIEKFEKEAAEMGKGSFKYAWVL 60 Query 61 DKLKAERERGITIDIALWKFETTKYYCTVIDAPGHRDFIKNMITGTSQADCAVLIIDSTT 120 DKLKAERERGITIDI+LWKFET+KYY T+IDAPGHRDFIKNMITGTSQADCAVLI+ + Sbjct 61 DKLKAERERGITIDISLWKFETSKYYVTIIDAPGHRDFIKNMITGTSQADCAVLIVAAGV 120 Query 121 GGFEAGISKDGQTREHALLAFTLGVKQMICCCNKMDATTPKYSKARYDEIIKEVSSYLKK 180 G FEAGISK+GQTREHALLA+TLGVKQ+I NKMD+T P YS+ RY+EI+KEVS+Y+KK Sbjct 121 GEFEAGISKNGQTREHALLAYTLGVKQLIVGVNKMDSTEPPYSQKRYEEIVKEVSTYIKK 180 Query 181 VGYNPDKIPFVPISGFEGDNMIERSTNLDWYKG------------PTLLEALDQINEPKR 228 +GYNPD + FVPISG+ GDNM+E S N+ W+KG TLLEALD I P R Sbjct 181 IGYNPDTVAFVPISGWNGDNMLEPSANMPWFKGWKVTRKDGNASGTTLLEALDCILPPTR 240 Query 229 PSDKPLRLPLQDVYKIGGIGTVPVGRVETGMIKPGMVVTFAPTGLTTEVKSVEMHHESLL 288 P+DKPLRLPLQDVYKIGGIGTVPVGRVETG++KPGMVVTFAP +TTEVKSVEMHHE+L Sbjct 241 PTDKPLRLPLQDVYKIGGIGTVPVGRVETGVLKPGMVVTFAPVNVTTEVKSVEMHHEALS 300 Query 289 EALPGDNVGFNVKNVAVKDLKRGYVASNSKDDPAKGAANFTSQVIIMNHPGQIGNGYAPV 348 EALPGDNVGFNVKNV+VKD++RG VA +SK+DP AA FT+QVII+NHPGQI GYAPV Sbjct 301 EALPGDNVGFNVKNVSVKDVRRGNVAGDSKNDPPMEAAGFTAQVIILNHPGQISAGYAPV 360 Query 349 LDCHTSHIAVKFSEILTKIDRRSGKEIEKEPKFLKNGDAGMVKMTPTKPMVVETFSEYPP 408 LDCHT+HIA KF+E+ KIDRRSGK++E PKFLK+GDA +V M P KPM VE+FS+YPP Sbjct 361 LDCHTAHIACKFAELKEKIDRRSGKKLEDGPKFLKSGDAAIVDMVPGKPMCVESFSDYPP 420 Query 409 LGRFAVRDMRQTVAVGVIKSVDKKDPTGAKVTKAAVK 445 LGRFAVRDMRQTVAVGVIK+VDKK KVTK+A K Sbjct 421 LGRFAVRDMRQTVAVGVIKAVDKKAAGAGKVTKSAQK 457 >AT1G09200 MARTKQTARKSTGGKAPRKQLATKAARKSAPATGGVKKPHRFRPGTVALREIRKYQKSTELLIRKLPFQRLVREIAQDFKTDLRFQSSAVAALQEAAEAY LVGLFEDTNLCAIHAKRVTIMPKDIQLARRIRGERA GENE ID: 126961 HIST2H3C | histone cluster 2, H3c [Homo sapiens] (Over 10 PubMed links) Score = 267 bits (683), Expect = 2e-71, Method: Compositional matrix adjust. Identities = 132/136 (97%), Positives = 135/136 (99%), Gaps = 0/136 (0%) Query 1 MARTKQTARKSTGGKAPRKQLATKAARKSAPATGGVKKPHRFRPGTVALREIRKYQKSTE 60 MARTKQTARKSTGGKAPRKQLATKAARKSAPATGGVKKPHR+RPGTVALREIR+YQKSTE Sbjct 1 MARTKQTARKSTGGKAPRKQLATKAARKSAPATGGVKKPHRYRPGTVALREIRRYQKSTE 60 Query 61 LLIRKLPFQRLVREIAQDFKTDLRFQSSAVAALQEAAEAYLVGLFEDTNLCAIHAKRVTI 120 LLIRKLPFQRLVREIAQDFKTDLRFQSSAV ALQEA+EAYLVGLFEDTNLCAIHAKRVTI Sbjct 61 LLIRKLPFQRLVREIAQDFKTDLRFQSSAVMALQEASEAYLVGLFEDTNLCAIHAKRVTI 120 Query 121 MPKDIQLARRIRGERA 136 MPKDIQLARRIRGERA Sbjct 121 MPKDIQLARRIRGERA 136 >AT1G09300 MQFLARNLVRRVSRTQVVSRNAYSTQTVRDIGQPTPASHPHLMAEGEVTPGIRIEEYIGRRKKLVELLPENSLAIISSAPVKMMTDVVPYTFRQDADYLY LTGCQQPGGVAVLSDERGLCMFMPESTPKDIAWEGEVAGVDAASEVFKADQAYPISKLPEILSDMIRHSSKVFHNVQSASQRYTNLDDFQNSASLGKVKT LSSLTHELRLIKSPAELKLMRESASIACQGLLKTMLHSKGFPDEGILSAQVEYECRVRGAQRMAFNPVVGGGSNASVIHYSRNDQRIKDGDLVLMDMGCE LHGYVSDLTRTWPPCGKFSSVQEELYDLILQTNKECIKQCKPGTTIRQLNTYSTELLCDGLMKMGILKSRRLYHQLNPTSIGHYLGMDVHDSSAVGYDRP LQPGFVITIEPGVYIPSSFDCPERFQGIGIRIEDDVLITETGYEVLTGSMPKEIKHIETLLNNHCHDNSARTSPVSLCKVKGLHTNRNPRRLF GENE ID: 63929 XPNPEP3 | X-prolyl aminopeptidase (aminopeptidase P) 3, putative [Homo sapiens] (10 or fewer PubMed links) Score = 347 bits (891), Expect = 2e-95, Method: Compositional matrix adjust. Identities = 185/486 (38%), Positives = 280/486 (57%), Gaps = 34/486 (6%) Query 9 VRRVSRTQVVSRNAYSTQTV-------RDIGQPTPASHPHLMAEGEVTPGIRIEEYIGRR 61 VR +S + S+ YS Q V R +GQP+P +HPHL+ GEVTPG+ EY RR Sbjct 17 VRGLSGCMLCSQRRYSLQPVPERRIPNRYLGQPSPFTHPHLLRPGEVTPGLSQVEYALRR 76 Query 62 KKLVELLPE--------NSLAIISSAPVKMMTDVVPYTFRQDADYLYLTGCQQPGGVAVL 113 KL+ L+ + + ++ S P M++ +PYTF QD ++LYL G Q+P + VL Sbjct 77 HKLMSLIQKEAQGQSGTDQTVVVLSNPTYYMSNDIPYTFHQDNNFLYLCGFQEPDSILVL 136 Query 114 SDERG-------LCMFMPESTPKDIAWEGEVAGVDAASEVFKADQAYPISKLPEILSDMI 166 G +F+P P W+G +G D A + D+AY + + +L M Sbjct 137 QSLPGKQLPSHKAILFVPRRDPSRELWDGPRSGTDGAIALTGVDEAYTLEEFQHLLPKMK 196 Query 167 RHSSKVFHNVQSASQRYTNLDDFQ-----NSASLGKVKTLSSLTHELRLIKSPAELKLMR 221 ++ V+++ S + D Q + S KV+ + L LRLIKSPAE++ M+ Sbjct 197 AETNMVWYDWMRPSHAQLHSDYMQPLTEAKAKSKNKVRGVQQLIQRLRLIKSPAEIERMQ 256 Query 222 ESASIACQGLLKTMLHSKGFPDEGILSAQVEYECRVRGAQRMAFNPVVGGGSNASVIHYS 281 + + Q ++TM SK +E L A+ E+ECR RGA +A+ PVV GG+ ++ +HY Sbjct 257 IAGKLTSQAFIETMFTSKAPVEEAFLYAKFEFECRARGADILAYPPVVAGGNRSNTLHYV 316
Query 282 Sbjct 317 Query 342 Sbjct 377 Query 396 Sbjct 437 Query 455 Sbjct 497 >AT1G12900 (GAPA2) MASATFSVAKPPSLQGFSEFSGLRNSSSALPFAKRSSSDEFVS SFVSFQTSAMRSNGGY GYRKGVTEAKIKVAIN N GFGRIGRNFLRRCWHGRKDSPLDVVVIINDTGGVKQASHLLKY YDSTLGIFDADVKPSGGDSALSVDGKIIKIV V SDRNPSNLPWGGELGIDLVIEGTGVFVVDRDGAGKHLQAGAKK KVLITAPGKGDIPTYV YVVGVNAELYSHEDTI ISNASCTTNCLLAPFVKVLDQKFGIIKKGTMTTTHSYTGDQRL LLDASHRDLRRARAAA AALNIVPTSTGAAKAV V ALVLPNLKGKLLNGIALRVPTPNVSVVVDLVVQVSKKTFAEEV VNAAFRDAAEKELKGI GILDVCDEPLVSVDFR R CSDVSSTIDSSSLTMVMGDDMVKVIAWWYDNEWGYSQRVVDLA ADIVANNWK > pdb| |1ZNQ|O Chaiin O, Crsytal St tructure Of Huma man Liver Gapdh Length=338 Score = 2289 bits (740), Expect = 1e-77 7, Method: Compoositional matrix adjust. Identitiess = 156/334 (46% %), Positives = 204/334 (61%), Gaps = 6/334 ( 1%) Query 59 Sbjct 1 Query 118 Sbjct 59 Query 178 Sbjct 118 Query 238 Sbjct 177 Query 297 Sbjct 237 Query 357 Sbjct 297 >AT1G22840 MASFDEAPPGNNAKAGEKIFRTKCAQCCHTVEAGAGHKQGPNL LNGLFGRQSGTTAGYS YSYSAANKNKAVEWEE EKALYDYLLNPKKYIP PGTKMVFPGLKKPQDRR ADLIAYLKESTTAPK GENE ID: 544205 CYCS | cytoochrome c, somat tic [Homo sapienns] (Over 10 PuubMed links) Score = 1145 bits (367), Expect = 1e-34 4, Method: Compoositional matrix adjust. Identitiess = 66/102 (64%) ), Positives = 82/102 8 (80%), Ga Gaps = 0/102 (0% ) Query 10 Sbjct 2 Query 70 EKALYDYLLNPKKYYIPGTKMVFPGLKKPQ QDRADLIAYLKEST 111 E L +YL NPKKYYIPGTKM+F G+KK ++RADLIAYLK++T + Sbjct 62 EDTLMEYLENPKKYYIPGTKMIFVGIKKKE EERADLIAYLKKAT 103 >AT1G29910 chlorophyll a/bb-binding protei in MAASTMALSSPPAFAGKAVNLSPAASEEVLGSGRVTMRKTVAK KPKGPSGSPWYGSDRV RVKYLGPFSGESPSYL LTGEFPGDYGWDTAGL LSADPETFARNRELEVV IHSRWAMLGALLGCVFPELLARNGVKFFGEAVWFKAGSQIFSD DGGLDYLGNPSLVHAQ AQSILAIWATQVILMG GAVEGYRVAGNGPLGEAEDLLYPGGSFDPLGG LATDPEAFAELLKVKELKNGRLAMFSMMFGFFVQAIVTGKGPI IENLADHLADPVNNNA NAWAFATNFVPGK GENE ID: 557589 KIAA1432 | KIAA1432 [Homo o sapiens] Score = 333.1 bits (74), Expect = 0.98, Method: Composiition-based sta ats. Identitiess = 14/38 (36%), , Positives = 25 5/38 (65%), Gapss = 1/38 (2%) Query 13 Sbjct 895 >AT1G35190 MENHTTMKVSSSLNCIDLANDDLNHSVVVSLKQACLDCGFFYV VINHGISEEFMDDVFE FEQSKKLFALPLEEKM MKVLRNEKHRGYTPVL LDELLDPKNQINGDHKK EGYYIGIEVPKKDDPHWDKPFYGPNPWWPDADVLPGWRETMEK KYHQEALRVSMAIARL RLLALALDLDVGYFDR RTEMLGKPIATMRLLR RYQGISDPSKGIYACGG AHSDFGMMTLLLATDGVMGLQICKDKNNAMPQKWEYVPPIKGA AFIVNLGDMLERWSNG NGFFKSTLHRVLGNGQ QERYSIPFFVEPNHDCLVECLPTCKSESELPP KYPPIKCSTYLLTQRYEETHANLSIYHHQQT No significcant homologies >AT1G41880 RNDQRIKDGDLVLMMDMGCELHGYVSDLTR RTWPPCGKFSSVQEELLYDLILQTNKECIKQ QCK 341 +N+Q IKDG++VL+ +D GCE YVSD+TR RTWP G+F++ Q ELLY+ +L+ ++C+ C KNNQLIKDGEMVLLLDGGCESSCYVSDITR RTWPVNGRFTAPQAELLYEAVLEIQRDCLAL LCF 376 PGTTIRQLNTYSTEELLCDGLMKMGILKSR RRLYHQLN------PTTSIGHYLGMDVHDSSAV 395 PGT++ + + L+ L +GI+K+ + + P +GHYLGMDVHD+ + PGTSLENIYSMMLTTLIGQKLKDLGIMKNI IKENNAFKAARKYCPHHHVGHYLGMDVHDTP PDM 436 GYDRPLQPGFVITIIEPGVYIPS-SFDCPE ERFQGIGIRIEDDVLIITETGYEVLTGSMPK KEI 454 PLQPG VITIIEPG+YIP D PE E+F+G+G+RIEDDV++ +T+ +L+ PK KE+ PRSLPLQPGMVITIIEPGIYIPEDDKDAPE EKFRGLGVRIEDDVVV VVTQDSPLILSADCPK KEM 496 KHIETL 460 IE + NDIEQI 502 GVTEAKIKVAINGFFGRIGRNFLRCWHGRK KDSPLDVVVINDTG-GGVKQASHLLKYDSTL LGI 117 G K+KV +NGFFGRIGR R +D+V IND + ++ +YDST G GSHMGKVKVGVNGFFGRIGRLVTRA--AFN NSGKVDIVAINDPFIDDLNYMVYMFQYDSTH HGK 58 FDADVKPSGDSALSSVDGKIIKIVSDRNPS SNLPWGELGIDLVIEGGTGVFVDRDGAGKHL LQA 177 F VK + L ++G I I +R+PS S + WG+ G + V+E TGVF + AG HL LQ FHGTVKAE-NGKLVVINGNPITIFQERDPS SKIKWGDAGAEYVVESSTGVFTTMEKAGAHL LQG 117 GAKKVLITAPGKGDDIPTYVVGVNAELYSH HEDTIISNASCTTNCLLAPFVKVLDQKFGIIKG 237 GAK+V+I+AP D P +V+GVN E Y + IISNASCTTNCLLAP KV+ FGI+ +G GAKRVIISAP-SADDAPMFVMGVNHEKYDN NSLKIISNASCTTNCLLAPLAKVIHDNFGIV VEG 176 TMTTTHSYTGDQRLLLDASHRDL-RRARAA AALNIVPTSTGAAKAV AVALVLPNLKGKLNGIAL 296 MTT H+ T Q+ +D L R R A NI+P STGAAKAV AV V+P L GKL G+ A LMTTVHAITATQKTTVDGPSGKLWRDGRGA ALQNIIPASTGAAKAV AVGKVIPELNGKLTGM MAF 236 RVPTPNVSVVDLVVVQVSKKTFAEEVNAAF FRDAAEKELKGILDVC VCDEPLVSVDFRCSDV VSS 356 RVPT NVSVVDL ++ K +++ + A+E LKGIL + +VS DF SS RVPTANVSVVDLTCCRLEKPAKYDDIKKVV VKQASEGPLKGILGYT YTEHQVVSSDFNSDTH HSS 296 TIDSSLTMVMGDDMMVKVIAWYDNEWGYSQ QRVVDL 390 T D+ + + D VK+I+WYDNE+GYS RVVDL TFDAGAGIALNDHFFVKLISWYDNEFGYSN NRVVDL 330 GNAKAGEKIFRTKCCAQCHTVEAGAGHKQG GPNLNGLFGRQSGTTAAGYSYSAANKNKAVEWE 69 G+ + G+KIF KCC+QCHTVE G HK GPNL+GLFGR++G G GYSY+AANKNK + W GDVEKGKKIFIMKCCSQCHTVEKGGKHKTG GPNLHGLFGRKTGQAP APGYSYTAANKNKGIIWG 61 FAGKAVNLSPAASEEVLGSGRVTMRKTVAK KPKGPSGSPW 50 F ++++LS +A V S + +++KT++ P GPSG W FRNRSISLSQSAENNVPAS-KFSLQKTLSM MPSGPSGKRW 931
Page 1 and 2: Text S1: Protein sequences and alig
Page 3: Query 293 Sbjct 331 Query 353 Sbjct
Page 7 and 8: E CE+A+FKMDN LIDDRRIHVDFSQSV+ Sbjct
Page 9 and 10: 301 VLEEIESSRSA RKEYVQILAE CHRLYCEQ
Page 11 and 12: AT2G21330 MASSTATMLKASPVKSDWVKGQSLL
Page 13 and 14: Query 210 DDKSKKPLALMED--GKGGVFVRGL
Page 15 and 16: Query 842 ------------LDSLPREDISTKI
Page 17 and 18: Identities = 34/66 (51%), Positives
Page 19 and 20: MRGFASSASRIIATAAAASKSLNASTSSVNPKLSK
Page 21 and 22: + QI A I GD++ +AYAHELP+YG+ VGLTNYAA
Page 23 and 24: Sbjct 309 FAHR--EDGPGIPADIKLFDIFSQQ
Page 25 and 26: +WV + +G FN LTL +AL+ LF+VP+ Y++++ +
Page 27 and 28: Query 1847 -QTSTATGRLSIEEPNLQSVEHEV
Page 29 and 30: Query 432 CPFEQLTMTLFNFIKLFKKAHEENV
Page 31 and 32: REDSESPMKERRRRYENREVELLGDWQQSGGRGKE
Page 33 and 34: Score = 200 bits (508), Expect = 5e

Text S1: Protein sequences and alignments of all proteins found in ...

Create successful ePaper yourself

Delete template?

Save as template?