Text S1: Protein sequences and alignments of all proteins found in ...

Text S1: Protein sequences and alignments of all proteins found in this study. 

(A) Alignment of Rubisco sequences from Arabidopsis thaliana, Brassica oleacera, 

Chlamydomonas rheinhardtii and Synechococcus elongatus (B) Alignment of 

Arabidopsis GAPA-2 and GAPC-2 proteins. Conserved lysine residues are 

highlighted in black. Acetylated lysine residues are red. (C) Protein sequences and 

alignments of detected proteins. Lysine acetylated peptides are highlighted in yellow 

and acetylated lysine residues are highlighted in red. 

(A) 

A.thalina -MSPQTETKASVGFKAGVKEYKLTYYTPEYETKDTDILAAFRVTPQPGVPPEEAGAAVAA 59 

B.oleacera -MSPQTETKASVGFKAGVKEYKLNYYTPEYETKDTDILAAFRVTPQPGVPPEEAGAAVAA 59 

C.rheinhardtii -MVPQTETKAGAGFKAGVKDYRLTYYTPDYVVRDTDILAAFRMTPQPGVPPEECGAAVAA 59 

Synechococcus MSYSQTQSKSGAGYDAGVQDYRLTYYAPDYTPRDTDILAAFRMTPQPGVPPEECAAAVAA 60 

.**::*:..*:.***::*:*.**:*:* :*********:**********..***** 

A.thalina ESSTGTWTTVWTDGLTSLDRYKGRCYHIEPVPGEETQFIAYVAYPLDLFEEGSVTNMFTS 119 

B.oleacera ESSTGTWTTVWTDGLTSLDRYKGRCYHIEPVPGEETQFIAYVAYPLDLFEEGSVTNMFTS 119 

C.rheinhardtii ESSTGTWTTVWTDGLTSLDRYKGRCYDIEPVPGEDNQYIAYVAYPIDLFEEGSVTNMFTS 119 

Synechococcus ESSTGTWTTVWTDLLTDMDRYRGRCYDIEPVPGEDNQYIAYVAYPLDLFEEGSVTNLLTS 120 

************* **.:***:****.*******:.*:*******:**********::** 

Catalytic residue 

A.thalina IVGNVFGFKALAALRLEDLRIPPAYTKTFQGPPHGIQVERDKLNKYGRPLLGCTIKPKLG 179 

B.oleacera IVGNVFGFKALAALRLEDLRIPPAYTKTFQGPPHGIQVERDKLNKYGRPLLGCTIKPKLG 179 

C.rheinhardtii IVGNVFGFKALRALRLEDLRIPPAYVKTFVGPPHGIQVERDKLNKYGRGLLGCTIKPKLG 179 

Synechococcus LVGNVFGFKALRALRLEDLRIPVAYVKTFQGPPHGIQVERDRINKYGRPLLGCTIKPKLG 180 

:********** ********** **.*** ***********::***** *********** 

(Carbamylation site) 

A.thalina LSAKNYGRAVYECLRGGLDFTKDDENVNSQPFMRWRDRFLFCAEAIYKSQAETGEIKGHY 239 

B.oleacera LSAKNYGRAVYECLRGGLDFTKDDENVNSQPFMRWRDRFLFCAEAIYKSQAETGEIKGHY 239 

C.rheinhardtii LSAKNYGRAVYECLRGGLDFTKDDENVNSQPFMRWRDRFLFVAEAIYKAQAETGEVKGHY 239 

Synechococcus LSAKNYGRAVYECLRGGLDFTKDDENINSQPFQRWRDRFLFVADAIHKSQAETGEIKGHY 240 

**************************:***** ******** *:**:*:******:**** 

A.thalina LNATAGTCEEMIKRAVFARELGVPIVMHDYLTGGFTANTSLSHYCRDNGLLLHIHRAMHA 299 

B.oleacera LNATAGTCEEMMKRAIFARELGVPIVMHDYLTGGFTANTSLAHYCRDNGLLLHIHRAMHA 299 

C.rheinhardtii LNATAGTCEEMMKRAVCAKELGVPIIMHDYLTGGFTANTSLAIYCRDNGLLLHIHRAMHA 299 

Synechococcus LNVTAATCEEMMKRAAYAKELEMPIVMHDFLTGGFTANTTLAHWCRDNGILLHIHRAMHA 300 

**.**.*****:*** *:** :**:***:*********:*: :*****:********** 

Catalytic residue 

A.thalina VIDRQKNHGMHFRVLAKALRLSGGDHIHAGTVVGKLEGDRESTLGFVDLLRDDYVEKDRS 359 

B.oleacera VIDRQKNHGMHFRVLAKALRLSGGDHVHAGTVVGKLEGDRESTLGFVDLLRDDYVEKDRS 359 

C.rheinhardtii VIDRQRNHGIHFRVLAKALRMSGGDHLHSGTVVGKLEGEREVTLGFVDLMRDDYVEKDRS 359 

Synechococcus VIDRQKNHGIHFRVLAKCLRMSGGDHIHTGTVVGKLEGDRAGTLGFVDLLRENYIEQDKS 360 

*****:***:*******.**:*****:*:*********:* *******:*::*:*:*:* 

A.thalina RGIFFTQDWVSLPGVLPVASGGIHVWHMPALTEIFGDDSVLQFGGGTLGHPWGNAPGAVA 419 

B.oleacera RGIFFTQDWVSLPGVLPVASGGIHVWHMPALTEIFGDDSVLQFGGGTLGHPWGNAPGAVA 419 

C.rheinhardtii RGIYFTQDWCSMPGVMPVASGGIHVWHMPALVEIFGDDACLQFGGGTLGHPWGNAPGAAA 419 

Synechococcus RGVYFTQDWASMPGVMAVASGGIHVWHMPALVEIFGDDSVLQFGGGTLGHPWGNAPGATA 420 

**::***** *:***:.**************.******: ******************.* 

A.thalina NRVALEACVQARNEGRDLAVEGNEIIREACKWSPELAAACEVWKEITFNFPTIDKLDGQE 479 

B.oleacera NRVALEACVQARNEGRDLAVEGNEIIREACKWSPELAAACEVWKEITFNFPTIDKLDGQD 479 

C.rheinhardtii NRVALEACTQARNEGRDLAREGGDVIRSACKWSPELAAACEVWKEIKFEFDTIDKL---- 475 

Synechococcus NRVALEACVQARNEGRNLAREGGDIIREACKWSPELAAACELWKEIKFEFDTVDTI---- 476 

********.*******:** **.::**.*************:****.*:* *:*.:

(B) 

GAPC2 -----------------------------------------------------------M 1 

GAPA2 MASATFSVAKPSLQGFSEFSGLRNSSALPFAKRSSSDEFVSFVSFQTSAMRSNGGYRKGV 60 

: 

GAPC2 ADKKIRIGINGFGRIGRLVARVVLQRDD--VELVAVNDPFITTEYMTYMFKYDSVHGQWK 59 

GAPA2 TEAKIKVAINGFGRIGRNFLRCWHGRKDSPLDVVVINDTGG-VKQASHLLKYDSTLGIFD 119 

:: **::.********* . * *.* :::*.:**. .: ::::****. * :. 

GAPC2 HHELKVKDDKTLLFGEKPVTVFGIRNPEDIPWGEAGADFVVESTGVFTDKDKAAAHLKGG 119 

GAPA2 -ADVKPSGDSALSVDGKIIKIVSDRNPSNLPWGELGIDLVIEGTGVFVDRDGAGKHLQAG 178 

::* ..*.:* .. * :.:.. ***.::**** * *:*:*.****.*:* *. **:.* 

GAPC2 AKKVVISAPSK-DAPMFVVGVNEHEYKSDLDIVSNASCTTNCLAPLAKVINDRFGIVEGL 178 

GAPA2 AKKVLITAPGKGDIPTYVVGVNAELYSHEDTIISNASCTTNCLAPFVKVLDQKFGIIKGT 238 

****:*:**.* * * :***** . *. : *:************:.**::::***::* 

GAPC2 MTTVHSITATQKTVDGPSMKDWRGGRAASFNIIPSSTGAAKAVGKVLPSLNGKLTGMSFR 238 

GAPA2 MTTTHSYTGDQRLLD-ASHRDLRRARAAALNIVPTSTGAAKAVALVLPNLKGKLNGIALR 297 

***.** *. *: :* .* :* * .***::**:*:********. ***.*:***.*:::* 

GAPC2 VPTVDVSVVDLTVRLEKAATYDEIKKAIKEESEGKMKGILGYTEDDVVSTDFVGDNRSSI 298 

GAPA2 VPTPNVSVVDLVVQVSKKTFAEEVNAAFRDAAEKELKGILDVCDEPLVSVDFRCSDVSST 357 

*** :******.*::.* : :*:: *::: :* ::****. :: :**.** .: ** 

GAPC2 FDAKAGIALSDKFVKLVSWYDNEWGYSSRVVDLIVHMSKA-- 338 

GAPA2 IDSSLTMVMGDDMVKVIAWYDNEWGYSQRVVDLADIVANNWK 399 

:*:. :.:.*.:**:::*********.***** ::: 

(C) 

>AT1G03860 

MSFNKVPNIPGAPALSALLKVSVIGGLGVYALTNSLYNVDGGHRAVMFNRLTGIKEKVYPEGTHFMVPWFERPIIYDVRARPYLVESTTGSHDLQMVKIG 

LRVLTRPMGDRLPQIYRTLGENYSERVLPSIIHETLKAVVAQYNASQLITQREAVSREIRKILTERASNFDIALDDVSITTLTFGKEFTAAIEAKQVAAQ 

EAERAKFIVEKAEQDRRSAVIRAQGEAKSAQLIGQAIANNQAFITLRKIEAAREIAQTIAQSANKVYLSSNDLLLNLQEMNLEPKK 

GENE ID: 11331 PHB2 | prohibitin 2 [Homo sapiens] (Over 10 PubMed links) 

Score = 310 bits (794), Expect = 4e-84, Method: Compositional matrix adjust. 

Identities = 145/273 (53%), Positives = 210/273 (76%), Gaps = 2/273 (0%) 

Query 9 IPGAP-ALSALLKVSVIGGLGVYALTNSLYNVDGGHRAVMFNRLTGIKEK-VYPEGTHFM 66 

+P P + LK+ + G Y + S++ V+GGHRA+ FNR+ G+++ + EG HF 

Sbjct 12 LPAGPRGMGTALKLLLGAGAVAYGVRESVFTVEGGHRAIFFNRIGGVQQDTILAEGLHFR 71 

Query 67 VPWFERPIIYDVRARPYLVESTTGSHDLQMVKIGLRVLTRPMGDRLPQIYRTLGENYSER 126 

+PWF+ PIIYD+RARP + S TGS DLQMV I LRVL+RP LP +Y+ LG +Y ER 

Sbjct 72 IPWFQYPIIYDIRARPRKISSPTGSKDLQMVNISLRVLSRPNAQELPSMYQRLGLDYEER 131 

Query 127 VLPSIIHETLKAVVAQYNASQLITQREAVSREIRKILTERASNFDIALDDVSITTLTFGK 186 

VLPSI++E LK+VVA++NASQLITQR VS IR+ LTERA +F + LDDV+IT L+F + 

Sbjct 132 VLPSIVNEVLKSVVAKFNASQLITQRAQVSLLIRRELTERAKDFSLILDDVAITELSFSR 191 

Query 187 EFTAAIEAKQVAAQEAERAKFIVEKAEQDRRSAVIRAQGEAKSAQLIGQAIANNQAFITL 246 

E+TAA+EAKQVA QEA+RA+F+VEKA+Q++R +++A+GEA++A+++G+A++ N +I L 

Sbjct 192 EYTAAVEAKQVAQQEAQRAQFLVEKAKQEQRQKIVQAEGEAEAAKMLGEALSKNPGYIKL 251 

Query 247 RKIEAAREIAQTIAQSANKVYLSSNDLLLNLQE 279 

RKI AA+ I++TIA S N++YL++++L+LNLQ+ 

Sbjct 252 RKIRAAQNISKTIATSQNRIYLTADNLVLNLQD 284 

>AT1g03910 

MGSHGKGKRDRSGRQKKRRDESESGSESESYTSDSDGSDDLSPPRSSRRKKGSSSRRTRRRSSSDDSSDSDGGRKSKKRSSSKDYSEEKVTEYMSKKAQK 

KALRAAKKLKTQSVSGYSNDSNPFGDSNLTETFVWRKKIEKDVHRGVPLEEFSVKAEKRRHRERMTEVEKVKKRREERAVEKARHEEEMALLARERARAE 

FHDWEKKEEEFHFDQSKVRSEIRLREGRLKPIDVLCKHLDGSDDLDIELSEPYMVFKKKKVRIGIWLNFQLSITNVYVEAEYKNDSACLLLRSRVDILLN 

KGLTVKDMEELRDDIKMYLDLDRATPTRVQYWEALIVVCDWELAEARKRDALDRARVRGEEPPAELLAQERGLHAGVEADVRKLLDGKTHAELVELQLDI 

ESQLRSGSAKVVEYWEAVLKRLEIYKAKACLKEIHAEMLRRHLHRLEQLSEGEDDVEVNPGLTRVVEENEEEINDTNLSDAEEAFSPEPVAEEEEADEAA 

EAAGSFSPELMHGDDREEAIDPEEDKKLLQMKRMIVLEKQKKRLKEAMDSKPAPVEDNLELKAMKAMGAMEEGDAIFGSNAEVNLDSEVYWWHDKYRPRK 

PKYFNRVHTGYEWNKYNQTHYDHDNPPPKIVQGYKFNIFYPDLVDKIKAPIYTIEKDGTSAETCMIRFHAGPPYEDIAFRIVNKEWEYSHKKGFKCTFER 

GILHLYFNFKRHRYRR 

GENE ID: 58509 C19orf29 | chromosome 19 open reading frame 29 [Homo sapiens] 

(Over 10 PubMed links) 



Query 116 GYSNDSNPFGDSNLTETFVWRKKIEKDVHRGVP-LEEFSVKAEKRRHRE-RMTEVEKVKK 173 

GY+N NPFGD+NL TF+W K +EK +G+ LEE +K +R +E E++KVK+ 

Sbjct 193 GYTNTDNPFGDNNLLGTFIWNKALEK---KGISHLEEKELKERNKRIQEDNRLELQKVKQ 249 

Query 174 RREERAVEKARHEEEMALLARERARAEFHDWEKKEEEFHFDQSKVRSEIRLREGRLKPID 233 

R ER EKA E+E+ +L RE+ F WE++E+ FH Q+K+RS+IR+R+GR KPID 

Sbjct 250 LRLEREREKAMREQELEMLQREKEAEHFKTWEEQEDNFHLQQAKLRSKIRIRDGRAKPID 309 

Query 234 VLCKHLDG-SDDLDIELSEPYMVFKKKKVRIGIWLNFQLSITNVYVEAEYKNDSACLLLR 292 

+L K++ DDL +E+ EPY 

Sbjct 310 LLAKYISAEDDDLAVEMHEPY--------------------------------------- 330

Query 293 

Sbjct 331 

Query 353 

Sbjct 384 

Query 412 

Sbjct 434 

Query 472 

Sbjct 490 

Query 503 

Sbjct 549 

Query 553 

Sbjct 602 

Query 613 

Sbjct 655 

Query 673 

Sbjct 715 

>AT1G04410 

MAKEPVRVLVTTGAAGQIGYALVPMIAARGIMLGADQPVILHM 

MLDIPPAAEALNGVKM KMELIDAAFPLLKGVV VATTDAVEGCTGVNVA AVMVGGFPRKEGMERKK 

DVMSKNVSIYKKSQAAALEKHAAPNCKKVLVVANPANTNALIL 

LKEFAPSIPEKNISCL CLTRLDHNRALGQISE ERLSVPVSDVKNVIIW WGNHSSSQYPDVNHAKK 

VQTSSGEKPVRRELVKDDAWLDGEFISSTVQQRGAAIIKARKL 

LSSALSAASSACDHIRRDWVLGTPEGTFVSM 

MGVYSDGSYSVPSGLIYSFPVTCRNGDWSIVV 

QGLPIDEVSRKKKMDLTAEELKEEKDLLAYSCLS 

GENE ID: 41190 

MDH1 | malatte 

dehydrogenase e 1, NAD (solublle) 

[Homo sapiens] 

(Over 10 PuubMed 

links) 

Score = 4418 

bits (1075), , Expect = 1e-1 116, Method: Commpositional 

matrix 

adjust. 

Identitiess 

= 204/330 (61% %), Positives = 249/330 (75%), Gaps = 1/330 ( 0%) 

Query 4 

Sbjct 3 

Query 64 

Sbjct 63 

Query 124 

Sbjct 123 

Query 184 

Sbjct 183 

Query 244 

Sbjct 243 

Query 303 

Sbjct 303 

>AT1G07660 

MSGRGKGGKGLLGKGGAKRHRKVLRDNNIQGITKPAIRRLARR 

RGGVKRISGLIYEETR TRGVLKIFLENVIRDA AVTYTEHARRKTVTAM MDVVYALKRQGRTLYGG 

FGG 

> gb|EEAW55528.1| 

Length=129 


HIST1H4C | histone cluster r 1, H4c [Homo ssapiens] 



Score = 2200 

bits (508), Expect = 5e-51 1, Method: Compoositional 

matrix 

adjust. 

Identitiess 

= 101/103 (98% %), Positives = 103/103 (100%), , Gaps = 0/103 (0%) 

Query 1 

Sbjct 27 

Query 61 

Sbjct 87 

SRVDILLNKGLTVKKDMEELRDDIKMYLDL 

LDRATPTRVQYWEALIIVVCDWELAEARKRD 

DAL 352 

LN GLTV DME+L +DI++Y++L L++ +W + + + E+++ RK + A 

----TFLN-GLTVAADMEDLLEDIQVYMEL 

LEQGK--NADFWRDMT MTTITEDEISKLRKLEAS 

383 

DRARVRGEEPPAELLLAQERGLHAGVEADV 

VRKLLDGKTHAELVELLQLDIESQLRSGSAK 

KV- 411 

+ P E + G++A V +DV V+ + GKT+ +L + IE ++R+G + 

GKG-------PGE----RREGVNASVSSDV 

VQSVFKGKTYNQLQVI VIFQGIEGKIRAGGPN NLD 433 

VEYWEAVLKRLEIYYKAKACLKEIHAEMLR 

RRHLHRLEQLSEGEDD DDVEVNPGLTRVVEEN NEE 471 

+ YWE++L++L + A+A L+E H ++LR R+ L++L+Q E VE P + +E + 

MGYWESLLQQLRAHHMARARLRERHQDVLR 

RQKLYKLKQ----EQG QGVESEPLFPILKQEP PQS 489 

EINDTNLSDAEEAFFSPEPVAE----EEEA 

ADEAAEA-------------------------- 

502 

DA P P +E E E D A 

PSRSLEPEDAAPT--PPGPSSEGGPAEAEV 

VDGATPTEGDGDGDGE GEGEGEGEAVLMEEDL LIQ 548 

-------AGSFSPEELMHGDDRE---EAID 

DPEEDKKLLQMKRMIVVLEKQKKRLKEAMDSKP 

552 

AG +SP L+ + ++ +P+ED + LQ+ R +Q + +A +S 

QSLDDYDAGRYSPRRLLTAHELPLDAHVLE 

EPDEDLQRLQLSR------QQLQVTGDASES-- 

601 

APVEDNLELKAMKAAMGAMEEGDAIFGSNA 

AEVNLDSEVYWWHDKY KYRPRKPKYFNRVHTG GYE 612 

ED +A + MG + +A F + E+ L + Y W DKY KYRPRKP++FNRVHTG G+E 

--AEDIFFRRAKEGGMG---QDEAQF--SV 

VEMPLTGKAYLWADKY KYRPRKPRFFNRVHTG GFE 654 

WNKYNQTHYDHDNPPPPKIVQGYKFNIFYP 

PDLVDKIKAPIYTIEKKDGTSAETCMIRFHA 

AGP 672 

WNKYNQTHYD DNPPPPKIVQGYKFNIFYP 

PDL+DK P Y +E + + ++RFHA AGP 

WNKYNQTHYDFDNPPPPKIVQGYKFNIFYP 

PDLIDKRSTPEYFLEAACADNKDFAILRFHA 

AGP 714 

PYEDIAFRIVNKEWWEYSHKKGFKCTFERG 

GILHLYFNFKRHRYRR RR 716 

PYEDIAF+IVN+EWWEYSH+ 

GF+C F GI G L+F+FKR+RYRR RR 

PYEDIAFKIVNREWWEYSHRHGFRCQFANG 

GIFQLWFHFKRYRYRR RR 758 

EPVRVLVTGAAGQIIGYALVPMIARGIMLG 

GADQPVILHMLDIPPAAAEALNGVKMELIDA 

AAF 63 

EP+RVLVTGAAGQII 

Y+L+ I G + G DQP+IL +LDI P L+GV MEL D A 

EPIRVLVTGAAGQIIAYSLLYSIGNGSVFG 

GKDQPIILVLLDITPMMMGVLDGVLMELQDC 

CAL 62 

PLLKGVVATTDAVEEGCTGVNVAVMVGGFP 

PRKEGMERKDVMSKNV NVSIYKSQAAALEKHA AAP 123 

PLLK V+AT 

++VA++VG PR+EGMERKD++ P 

NV I+KSQ AAL+K+A A 

PLLKDVIATDKEDVVAFKDLDVAILVGSMP 

PRREGMERKDLLKANV NVKIFKSQGAALDKYA AKK 122 

NCKVLVVANPANTNNALILKEFAPSIPEKN 

NISCLTRLDHNRALGQ GQISERLSVPVSDVKN NVI 183 

+ KV+VV NPANTNN 

L + APSIP++N N SCLTRLDHNRA QQI+ 

+L V +DVKN NVI 

SVKVIVVGNPANTNNCLTASKSAPSIPKEN 

NFSCLTRLDHNRAKAQ AQIALKLGVTANDVKN NVI 182 

IWGNHSSSQYPDVNNHAKVQTSSGEKPVRE 

ELVKDDAWLDGEFISTTVQQRGAAIIKARKL 

LSS 243 

IWGNHSS+QYPDVNNHAKV+ 

E V E +KDD+WL GEF++TTVQQRGAA+IKARKL 

LSS 

IWGNHSSTQYPDVNNHAKVKLQGKEVGVYE 

EALKDDSWLKGEFVTTTVQQRGAAVIKARKL 

LSS 242 

ALSAASSACDHIRDDWVLGTPEGTFVSMGV 

VYSDG-SYSVPSGLIYYSFPVTCRNGDWSIV 

VQG 302 

A+SAA + CDH+RDD 

GTPEG FVSMGV V SDG SY VP L+YYSFPV 

+N W V+G V 

AMSAAKAICDHVRDDIWFGTPEGEFVSMGV 

VISDGNSYGVPDDLLYYSFPVVIKNKTWKFV 

VEG 302 

LPIDEVSRKKMDLTTAEELKEEKDLAYSCL 

LS 332 

LPI++ SR+KMDLTTA+EL 

EEK+ A+ LS L 

LPINDFSREKMDLTTAKELTEEKESAFEFL 

LS 332 

histone 1, H4c [Homo sapiens] 

MSGRGKGGKGLGKGGGAKRHRKVLRDNIQG 

GITKPAIRRLARRGGV GVKRISGLIYEETRGV VLK 60 


GITKPAIRRLARRGGV GVKRISGLIYEETRGV VLK 


GITKPAIRRLARRGGV GVKRISGLIYEETRGV VLK 86 

IFLENVIRDAVTYTTEHARRKTVTAMDVVY 

YALKRQGRTLYGFGG G 103 

+FLENVIRDAVTYTTEHA+RKTVTAMDVVY 

YALKRQGRTLYGFGGG 

VFLENVIRDAVTYTTEHAKRKTVTAMDVVY 

YALKRQGRTLYGFGG G 129

AT1G07920 

MGKEKFHINIVVIGHVDSGKSTTTGHLIYKLGGIDKRVIERFEKEAAEMNKRSFKYAWVLDKLKAERERGITIDIALWKFETTKYYCTVIDAPGHRDFIK 

NMITGTSQADCAVLIIDSTTGGFEAGISKDGQTREHALLAFTLGVKQMICCCNKMDATTPKYSKARYDEIIKEVSSYLKKVGYNPDKIPFVPISGFEGDN 

MIERSTNLDWYKGPTLLEALDQINEPKRPSDKPLRLPLQDVYKIGGIGTVPVGRVETGMIKPGMVVTFAPTGLTTEVKSVEMHHESLLEALPGDNVGFNV 

KNVAVKDLKRGYVASNSKDDPAKGAANFTSQVIIMNHPGQIGNGYAPVLDCHTSHIAVKFSEILTKIDRRSGKEIEKEPKFLKNGDAGMVKMTPTKPMVV 

ETFSEYPPLGRFAVRDMRQTVAVGVIKSVDKKDPTGAKVTKAAVKKGAK 

GENE ID: 1915 EEF1A1 | eukaryotic translation elongation factor 1 alpha 1 

[Homo sapiens] (Over 10 PubMed links) 

Score = 716 bits (1848), Expect = 0.0, Method: Compositional matrix adjust. 


Query 1 MGKEKFHINIVVIGHVDSGKSTTTGHLIYKLGGIDKRVIERFEKEAAEMNKRSFKYAWVL 60 

MGKEK HINIVVIGHVDSGKSTTTGHLIYK GGIDKR IE+FEKEAAEM K SFKYAWVL 

Sbjct 1 MGKEKTHINIVVIGHVDSGKSTTTGHLIYKFGGIDKRTIEKFEKEAAEMGKGSFKYAWVL 60 

Query 61 DKLKAERERGITIDIALWKFETTKYYCTVIDAPGHRDFIKNMITGTSQADCAVLIIDSTT 120 

DKLKAERERGITIDI+LWKFET+KYY T+IDAPGHRDFIKNMITGTSQADCAVLI+ + 

Sbjct 61 DKLKAERERGITIDISLWKFETSKYYVTIIDAPGHRDFIKNMITGTSQADCAVLIVAAGV 120 

Query 121 GGFEAGISKDGQTREHALLAFTLGVKQMICCCNKMDATTPKYSKARYDEIIKEVSSYLKK 180 

G FEAGISK+GQTREHALLA+TLGVKQ+I NKMD+T P YS+ RY+EI+KEVS+Y+KK 

Sbjct 121 GEFEAGISKNGQTREHALLAYTLGVKQLIVGVNKMDSTEPPYSQKRYEEIVKEVSTYIKK 180 

Query 181 VGYNPDKIPFVPISGFEGDNMIERSTNLDWYKG------------PTLLEALDQINEPKR 228 

+GYNPD + FVPISG+ GDNM+E S N+ W+KG TLLEALD I P R 

Sbjct 181 IGYNPDTVAFVPISGWNGDNMLEPSANMPWFKGWKVTRKDGNASGTTLLEALDCILPPTR 240 

Query 229 PSDKPLRLPLQDVYKIGGIGTVPVGRVETGMIKPGMVVTFAPTGLTTEVKSVEMHHESLL 288 

P+DKPLRLPLQDVYKIGGIGTVPVGRVETG++KPGMVVTFAP +TTEVKSVEMHHE+L 

Sbjct 241 PTDKPLRLPLQDVYKIGGIGTVPVGRVETGVLKPGMVVTFAPVNVTTEVKSVEMHHEALS 300 

Query 289 EALPGDNVGFNVKNVAVKDLKRGYVASNSKDDPAKGAANFTSQVIIMNHPGQIGNGYAPV 348 

EALPGDNVGFNVKNV+VKD++RG VA +SK+DP AA FT+QVII+NHPGQI GYAPV 

Sbjct 301 EALPGDNVGFNVKNVSVKDVRRGNVAGDSKNDPPMEAAGFTAQVIILNHPGQISAGYAPV 360 

Query 349 LDCHTSHIAVKFSEILTKIDRRSGKEIEKEPKFLKNGDAGMVKMTPTKPMVVETFSEYPP 408 

LDCHT+HIA KF+E+ KIDRRSGK++E PKFLK+GDA +V M P KPM VE+FS+YPP 

Sbjct 361 LDCHTAHIACKFAELKEKIDRRSGKKLEDGPKFLKSGDAAIVDMVPGKPMCVESFSDYPP 420 

Query 409 LGRFAVRDMRQTVAVGVIKSVDKKDPTGAKVTKAAVK 445 

LGRFAVRDMRQTVAVGVIK+VDKK KVTK+A K 

Sbjct 421 LGRFAVRDMRQTVAVGVIKAVDKKAAGAGKVTKSAQK 457 

>AT1G09200 

MARTKQTARKSTGGKAPRKQLATKAARKSAPATGGVKKPHRFRPGTVALREIRKYQKSTELLIRKLPFQRLVREIAQDFKTDLRFQSSAVAALQEAAEAY 

LVGLFEDTNLCAIHAKRVTIMPKDIQLARRIRGERA 

GENE ID: 126961 HIST2H3C | histone cluster 2, H3c [Homo sapiens] 




Query 1 MARTKQTARKSTGGKAPRKQLATKAARKSAPATGGVKKPHRFRPGTVALREIRKYQKSTE 60 

MARTKQTARKSTGGKAPRKQLATKAARKSAPATGGVKKPHR+RPGTVALREIR+YQKSTE 

Sbjct 1 MARTKQTARKSTGGKAPRKQLATKAARKSAPATGGVKKPHRYRPGTVALREIRRYQKSTE 60 

Query 61 LLIRKLPFQRLVREIAQDFKTDLRFQSSAVAALQEAAEAYLVGLFEDTNLCAIHAKRVTI 120 

LLIRKLPFQRLVREIAQDFKTDLRFQSSAV ALQEA+EAYLVGLFEDTNLCAIHAKRVTI 

Sbjct 61 LLIRKLPFQRLVREIAQDFKTDLRFQSSAVMALQEASEAYLVGLFEDTNLCAIHAKRVTI 120 

Query 121 MPKDIQLARRIRGERA 136 

MPKDIQLARRIRGERA 

Sbjct 121 MPKDIQLARRIRGERA 136 

>AT1G09300 

MQFLARNLVRRVSRTQVVSRNAYSTQTVRDIGQPTPASHPHLMAEGEVTPGIRIEEYIGRRKKLVELLPENSLAIISSAPVKMMTDVVPYTFRQDADYLY 

LTGCQQPGGVAVLSDERGLCMFMPESTPKDIAWEGEVAGVDAASEVFKADQAYPISKLPEILSDMIRHSSKVFHNVQSASQRYTNLDDFQNSASLGKVKT 

LSSLTHELRLIKSPAELKLMRESASIACQGLLKTMLHSKGFPDEGILSAQVEYECRVRGAQRMAFNPVVGGGSNASVIHYSRNDQRIKDGDLVLMDMGCE 

LHGYVSDLTRTWPPCGKFSSVQEELYDLILQTNKECIKQCKPGTTIRQLNTYSTELLCDGLMKMGILKSRRLYHQLNPTSIGHYLGMDVHDSSAVGYDRP 

LQPGFVITIEPGVYIPSSFDCPERFQGIGIRIEDDVLITETGYEVLTGSMPKEIKHIETLLNNHCHDNSARTSPVSLCKVKGLHTNRNPRRLF 

GENE ID: 63929 XPNPEP3 | X-prolyl aminopeptidase (aminopeptidase P) 3, putative 

[Homo sapiens] (10 or fewer PubMed links) 



Query 9 VRRVSRTQVVSRNAYSTQTV-------RDIGQPTPASHPHLMAEGEVTPGIRIEEYIGRR 61 

VR +S + S+ YS Q V R +GQP+P +HPHL+ GEVTPG+ EY RR 

Sbjct 17 VRGLSGCMLCSQRRYSLQPVPERRIPNRYLGQPSPFTHPHLLRPGEVTPGLSQVEYALRR 76 

Query 62 KKLVELLPE--------NSLAIISSAPVKMMTDVVPYTFRQDADYLYLTGCQQPGGVAVL 113 

KL+ L+ + + ++ S P M++ +PYTF QD ++LYL G Q+P + VL 

Sbjct 77 HKLMSLIQKEAQGQSGTDQTVVVLSNPTYYMSNDIPYTFHQDNNFLYLCGFQEPDSILVL 136 

Query 114 SDERG-------LCMFMPESTPKDIAWEGEVAGVDAASEVFKADQAYPISKLPEILSDMI 166 

G +F+P P W+G +G D A + D+AY + + +L M 

Sbjct 137 QSLPGKQLPSHKAILFVPRRDPSRELWDGPRSGTDGAIALTGVDEAYTLEEFQHLLPKMK 196 

Query 167 RHSSKVFHNVQSASQRYTNLDDFQ-----NSASLGKVKTLSSLTHELRLIKSPAELKLMR 221 

++ V+++ S + D Q + S KV+ + L LRLIKSPAE++ M+ 

Sbjct 197 AETNMVWYDWMRPSHAQLHSDYMQPLTEAKAKSKNKVRGVQQLIQRLRLIKSPAEIERMQ 256 

Query 222 ESASIACQGLLKTMLHSKGFPDEGILSAQVEYECRVRGAQRMAFNPVVGGGSNASVIHYS 281 

+ + Q ++TM SK +E L A+ E+ECR RGA +A+ PVV GG+ ++ +HY 

Sbjct 257 IAGKLTSQAFIETMFTSKAPVEEAFLYAKFEFECRARGADILAYPPVVAGGNRSNTLHYV 316

Query 282 

Sbjct 317 

Query 342 

Sbjct 377 

Query 396 

Sbjct 437 

Query 455 

Sbjct 497 

>AT1G12900 (GAPA2) 

MASATFSVAKPPSLQGFSEFSGLRNSSSALPFAKRSSSDEFVS 

SFVSFQTSAMRSNGGY GYRKGVTEAKIKVAIN N 

GFGRIGRNFLRRCWHGRKDSPLDVVVIINDTGGVKQASHLLKY 

YDSTLGIFDADVKPSGGDSALSVDGKIIKIV 

V 

SDRNPSNLPWGGELGIDLVIEGTGVFVVDRDGAGKHLQAGAKK 

KVLITAPGKGDIPTYV YVVGVNAELYSHEDTI 

ISNASCTTNCLLAPFVKVLDQKFGIIKKGTMTTTHSYTGDQRL 

LLDASHRDLRRARAAA AALNIVPTSTGAAKAV V 

ALVLPNLKGKLLNGIALRVPTPNVSVVVDLVVQVSKKTFAEEV 

VNAAFRDAAEKELKGI GILDVCDEPLVSVDFR R 

CSDVSSTIDSSSLTMVMGDDMVKVIAWWYDNEWGYSQRVVDLA 

ADIVANNWK 

> pdb| |1ZNQ|O Chaiin 

O, Crsytal St tructure Of Huma man Liver Gapdh 

Length=338 

Score = 2289 


matrix 

adjust. 

Identitiess 


Query 59 

Sbjct 1 

Query 118 

Sbjct 59 

Query 178 

Sbjct 118 

Query 238 

Sbjct 177 

Query 297 

Sbjct 237 

Query 357 

Sbjct 297 

>AT1G22840 

MASFDEAPPGNNAKAGEKIFRTKCAQCCHTVEAGAGHKQGPNL 

LNGLFGRQSGTTAGYS YSYSAANKNKAVEWEE EKALYDYLLNPKKYIP PGTKMVFPGLKKPQDRR 

ADLIAYLKESTTAPK 

GENE ID: 544205 

CYCS | cytoochrome 

c, somat tic [Homo sapienns] 



Score = 1145 


matrix 

adjust. 

Identitiess 

= 66/102 (64%) ), Positives = 82/102 8 (80%), Ga Gaps = 0/102 (0% ) 

Query 10 

Sbjct 2 

Query 70 EKALYDYLLNPKKYYIPGTKMVFPGLKKPQ 

QDRADLIAYLKEST 111 

E L +YL NPKKYYIPGTKM+F 

G+KK ++RADLIAYLK++T 

+ 

Sbjct 62 EDTLMEYLENPKKYYIPGTKMIFVGIKKKE 

EERADLIAYLKKAT 103 

>AT1G29910 chlorophyll a/bb-binding 

protei in 

MAASTMALSSPPAFAGKAVNLSPAASEEVLGSGRVTMRKTVAK 

KPKGPSGSPWYGSDRV RVKYLGPFSGESPSYL LTGEFPGDYGWDTAGL LSADPETFARNRELEVV 

IHSRWAMLGALLGCVFPELLARNGVKFFGEAVWFKAGSQIFSD 

DGGLDYLGNPSLVHAQ AQSILAIWATQVILMG GAVEGYRVAGNGPLGEAEDLLYPGGSFDPLGG 

LATDPEAFAELLKVKELKNGRLAMFSMMFGFFVQAIVTGKGPI 

IENLADHLADPVNNNA NAWAFATNFVPGK 

GENE ID: 557589 

KIAA1432 | KIAA1432 [Homo o sapiens] 

Score = 333.1 

bits (74), Expect = 0.98, Method: Composiition-based 

sta ats. 

Identitiess 

= 14/38 (36%), , Positives = 25 5/38 (65%), Gapss 

= 1/38 (2%) 

Query 13 

Sbjct 895 

>AT1G35190 

MENHTTMKVSSSLNCIDLANDDLNHSVVVSLKQACLDCGFFYV 

VINHGISEEFMDDVFE FEQSKKLFALPLEEKM MKVLRNEKHRGYTPVL LDELLDPKNQINGDHKK 

EGYYIGIEVPKKDDPHWDKPFYGPNPWWPDADVLPGWRETMEK 

KYHQEALRVSMAIARL RLLALALDLDVGYFDR RTEMLGKPIATMRLLR RYQGISDPSKGIYACGG 

AHSDFGMMTLLLATDGVMGLQICKDKNNAMPQKWEYVPPIKGA 

AFIVNLGDMLERWSNG NGFFKSTLHRVLGNGQ QERYSIPFFVEPNHDCLVECLPTCKSESELPP 

KYPPIKCSTYLLTQRYEETHANLSIYHHQQT 

No significcant 

homologies 

>AT1G41880 

RNDQRIKDGDLVLMMDMGCELHGYVSDLTR 

RTWPPCGKFSSVQEELLYDLILQTNKECIKQ 

QCK 341 

+N+Q IKDG++VL+ +D GCE YVSD+TR RTWP G+F++ Q ELLY+ 

+L+ ++C+ C 

KNNQLIKDGEMVLLLDGGCESSCYVSDITR 

RTWPVNGRFTAPQAELLYEAVLEIQRDCLAL 

LCF 376 

PGTTIRQLNTYSTEELLCDGLMKMGILKSR 

RRLYHQLN------PTTSIGHYLGMDVHDSSAV 

395 

PGT++ + + L+ L +GI+K+ + + P +GHYLGMDVHD+ + 

PGTSLENIYSMMLTTLIGQKLKDLGIMKNI 

IKENNAFKAARKYCPHHHVGHYLGMDVHDTP 

PDM 436 

GYDRPLQPGFVITIIEPGVYIPS-SFDCPE 

ERFQGIGIRIEDDVLIITETGYEVLTGSMPK 

KEI 454 

PLQPG VITIIEPG+YIP 

D PE E+F+G+G+RIEDDV++ +T+ +L+ PK KE+ 

PRSLPLQPGMVITIIEPGIYIPEDDKDAPE 

EKFRGLGVRIEDDVVV VVTQDSPLILSADCPK KEM 496 

KHIETL 460 

IE + 

NDIEQI 502 

GVTEAKIKVAINGFFGRIGRNFLRCWHGRK 

KDSPLDVVVINDTG-GGVKQASHLLKYDSTL 

LGI 117 

G K+KV +NGFFGRIGR 

R 

+D+V IND + ++ +YDST G 

GSHMGKVKVGVNGFFGRIGRLVTRA--AFN 

NSGKVDIVAINDPFIDDLNYMVYMFQYDSTH 

HGK 58 

FDADVKPSGDSALSSVDGKIIKIVSDRNPS 

SNLPWGELGIDLVIEGGTGVFVDRDGAGKHL 

LQA 177 

F VK + L ++G I I +R+PS S + WG+ G + V+E TGVF + AG HL LQ 

FHGTVKAE-NGKLVVINGNPITIFQERDPS 

SKIKWGDAGAEYVVESSTGVFTTMEKAGAHL 

LQG 117 

GAKKVLITAPGKGDDIPTYVVGVNAELYSH 

HEDTIISNASCTTNCLLAPFVKVLDQKFGIIKG 

237 

GAK+V+I+AP D P +V+GVN E Y + IISNASCTTNCLLAP 

KV+ FGI+ +G 

GAKRVIISAP-SADDAPMFVMGVNHEKYDN 

NSLKIISNASCTTNCLLAPLAKVIHDNFGIV 

VEG 176 

TMTTTHSYTGDQRLLLDASHRDL-RRARAA 

AALNIVPTSTGAAKAV AVALVLPNLKGKLNGIAL 

296 

MTT H+ T Q+ +D L R R A NI+P STGAAKAV AV V+P L GKL G+ A 

LMTTVHAITATQKTTVDGPSGKLWRDGRGA 

ALQNIIPASTGAAKAV AVGKVIPELNGKLTGM MAF 236 

RVPTPNVSVVDLVVVQVSKKTFAEEVNAAF 

FRDAAEKELKGILDVC VCDEPLVSVDFRCSDV VSS 356 

RVPT NVSVVDL ++ K +++ + A+E LKGIL + +VS DF SS 

RVPTANVSVVDLTCCRLEKPAKYDDIKKVV 

VKQASEGPLKGILGYT YTEHQVVSSDFNSDTH HSS 296 

TIDSSLTMVMGDDMMVKVIAWYDNEWGYSQ 

QRVVDL 390 

T D+ + + D VK+I+WYDNE+GYS RVVDL 

TFDAGAGIALNDHFFVKLISWYDNEFGYSN 

NRVVDL 330 

GNAKAGEKIFRTKCCAQCHTVEAGAGHKQG 

GPNLNGLFGRQSGTTAAGYSYSAANKNKAVEWE 

69 

G+ + G+KIF KCC+QCHTVE 

G HK GPNL+GLFGR++G 

G 

GYSY+AANKNK + W 

GDVEKGKKIFIMKCCSQCHTVEKGGKHKTG 

GPNLHGLFGRKTGQAP APGYSYTAANKNKGIIWG 

61 

FAGKAVNLSPAASEEVLGSGRVTMRKTVAK 

KPKGPSGSPW 50 

F ++++LS +A V S + +++KT++ P GPSG W 

FRNRSISLSQSAENNVPAS-KFSLQKTLSM 

MPSGPSGKRW 931

MKGRQGERVRLLYVRGTVLGYKRSKSNNQYPNTSLIQIEGVNT 

TQEEVNWYKGKRLAYI YIYKAKTKKNGSHYRC CIWGKVTRPHGNSGVV VRSKFTSNLPPKSMGAA 

RVRVFMYPSNII 


RPL35A | ribbosomal 

protein L35a [Homo sapiiens] 



Score = 1108 


matrix 

adjust. 

Identitiess 


Query 10 

Sbjct 4 

Query 63 

Sbjct 64 

>AT1G44120 

MTSEMDDPEKAAAVTITRLIEQLHAKKKSSAQEKELSTARLLG 

GLAKGKKECRKIISQN QNVNAMPAFISLLRSG GTLLAKLNSASVLTVL LCKDKNVRSKILIGGCC 

IPPLLSLLKSDDSVDAKRVVAEAIYEVVSLCGMDGDNVGTKIF 

FVTEGVVPSLWDQLKT KTGKKQDKTVEGHLVG GALRNLCGDKDGFWAL LTLEDGGVDIILKLLQQ 

SSNPVSQSNAAASLLARLIRIFTSSISSKVEESGAVQVLVQLL 

LGEENSVFVRASVVNA NALEAITSKSEEAITV VARDLDGIHLLISAVV VASSKESVEEETERVLL 

QSYGTQALANLLCGGMSGLIVYLGGLSSLSPRLTEPIADILGA 

ALAYALRKFQLSCGDT DTREAFDPTLTEGILV VKLLKPRDTQLIHERILEAMESLFGNVDLSKK 

LLNNVDAKRVLLVCLTILATDGPRERMMITCLSNLCKHGDVWD 

DAIGKREGIQILIPYL YLGLSSEQHQELSVEF FLAILTDNVEESRWAV VTSAGGIPPLLQILETT 

GVSQKAKDDAVVRVILNLCCHSEEIRLLCVEKAGAIPALLGLL 

LKNGGPKSQESSANTL TLLKLIKTADPSVIEQ QVQALFLGDAPKSKTH HLIRVLGHVLASASLEE 

EFVTKGSAANNNGLRSLVQRLASSNEKKMKENAASVLADLFSS 

SRKDLCGGLGFDEDDN DNPCTKLLSGNTHAVA ATQLAHALGSLSNPTK KKKTATKKLSGPEVEVV 

IKPLIKSAKTNNPIESTENPMSTLANLLLSDPNVAAEALNDDV 

VVSALTRVLREGTLQG QGKRNASHALHQLLKH HFQVSDVFKGNEQCRF FAVSELIDLLNATDLNN 

NSAFIDVLEVLLSLLAKAKYGANLSHNNPFSAFGEVPSNLDSL 

LVRGLAEGHPLVQDKA KAIEILSRFCKTQFIL LLGRLLVTQSKSISSL LANRTINSSSPEIKVGG 

GAILLVCAAKNNDITLWAEAVEQSGYLLKTLVNTLLDMSKQNS 

SKSASYGIEIQRPRSFFITSNLCLRMDDSEM 

MVDPVTILGSTASMWL LLSIICSSHPSNRLVVV 

MEGNGLEIIAEENLQRNKSNTQENSSDDSEEKWIAMSFLAVMS 

SQEPKVVSSPATENILLQTLAPFMQSEQMID 

DGYFTAQVLAALVRHK KNDKTISEIMNSDIVEE 

TTINLVGCEESSDTRSLCALAEELSLVVQNPYEATLEVLFENE 

ERVRSGSFTKKCIPLL LLVNLLKPYADKVGGIPVAIRLLRRIADNDDLSKLLIAEAGALDALL 

AKYLSLSPQDSSTEITVSELLESLFRSSPEITRHKTAISSMKQ 

QLIGILHLASRSTRYN YNAARVLCELFSSEHIRDSELAWKALSPLIEMLNTTLESERVAALTT 

ALVKLTMGINPPRPDILTSLEGNPLDNNIYKILSLDSSSLESK 

KTSAARICRFLFTNEG EGLRTSTSAACCIVSL LISLIRTGKSTAIEAG GMFALDRLLDIKRFVEE 

VAEEHDCVNLFFYGYVASENYLISEAAAISCLTKMAKDNTPRK 

KMDLIKMGIIEKCISQQLSKSPPSSLCSVIA 

ADLFRVLTNVGVIARSQDAIKMVQPLLLILLL 

RQDLDFQGQLGGGLQAIANILEKPMVLLESLKIASSTIIMPLI 

IPLLESESIAVKNATT TTILLTSLLEMQRFQE EEITTKNLIAPLVKLV VGIRVRNLQEIALMGLL 

ERSSVTWPKEVVADTGGIQELSKVIIDDEDPQLPVYLWESAAF 

FILCNILRINPEHYYF YFTVTIPVLSKMLFST TAESTVILAIDALIIR RENQDSSSVQEMAESSS 

ALDALLDLLRSSHHCEELSARLLELILLRNPKVRETKICQFVL 

LTPLSEYILDPDTISEESAKILIAMALGDIS 

SQHEGLAKATDSPVACRALISLLEDEPSEEMM 

QMVVMRALENFFAMHSRTSRKAMAEAGGGVYWVQEMLRSSNPQ 

QVSTQAALIIKSLFSNNHTLQEYVSGEIIKS 

SLTNAMEREFWTTTAINVEIVRTLNTILTTFF 

PKLRSSEAATAACIPHLIGALKSGEQEEARDSAMDTIYTLRQS 

SWTTMPTETARSQAVL VLAADAIPVLQLMMKS SKLKSPAPSSFHERGN NSLLNCLPGSLTVAIKK 

RGDNLKRSNAFFCRLIIDNCPTKKTKVVVKRSSSPVWKESFTW 

WDFAAPPRGQFLEIVC VCKSNNIFRNKNLGKV VRIPIDKVLSEGSYSG GIFKLNDESKKDNSSDD 

RSLEIEIVWSNNQSF 


DYSF | dysfeerlin, 

limb gird dle muscular dys ystrophy 2B (autosomal 

recessive) [Homo sapiens] (Over 10 PubMed d links) 

Score = 588.2 


matrix 

adjust. 

Identitiess 


Query 20088 

SNAFCRLIIDNCPPTKKTKVVKRSSSPVW 

WKESFTWDFAAPP--RRGQFLEIVCKSNNIF 

F-RN 2064 

S+A+C + K+TKV+K S +PVW W E F WD P + +G L +V K + RN 

Sbjct 20 SDAYCSAVFAGV--KKRTKVIKNSVNPVW 

WNEGFEWDLKGIPLDQ DQGSELHVVVKDHETM MGRN 78 

Query 20655 

KNLGKVRIPIDKVVLSEGSYSGIFKLNDE 

ESKKDNSSDRSLEIEIIVWS 

2110 

+ LG+ ++P+ +VVL+ 

S S F K + SL +++ + ++ 

Sbjct 79 RFLGEAKVPLREVVLATPSLSASFNAPLL 

LDTKKQPTGASLVLQV QVSYT 124 

>AT1G52230 

MASFATIAAVQQPSAAVKGLGGSSLAGGAKLFIKPSRQSFKTK 

KSTRAGAVVAKYGDKS KSVYFDLEDLGNTTGQ QWDVYGSDAPSPYNPL LQSKFFETFAAPFTKRR 

GLLLKFLILGGGGSLLTYVSANSTGDVVLPIKRGPQEPPKLGP 

PRGKL 


homologies 

>AT1G53720 

MSVLIVTSLGDDIVIDLHSDKCPLTCKKNFLKLCKIKYYNGCL 

LFHTVQKDFTAQTGDP DPTGTGAGGDSIYKFL LYGEQARFYKDEIHLDLKHSKTGTVAMASGGG 

ENLNASQFYFTTLRDDLDYLDGKHTVFFGQIAEGFDTLTRINE 

EAYVDPKNRPYKNIRI RIKHTHILDDPFDDPP PQLAEMMPDASPEGKP PKEEVKDDVRLEDDWVV 

PMDEELGAQELLEEVIREKAAHSSAVVVLESIGDIPEAEVKPP 

PDNVLFVCKLNPVTED EDEDLHTIFSRFGTVV VSADVIRDFKTGDSLCYAFIEFENKESCEQAA 

YFKMDNALIDDDRRIHVDFSQSVSKLWWSQFRQKDSQKGKGNG 

GCFKCGSTDHIAKDCV CVGGPSSKFIVKDQNR RQHGGGEGYEMVFEGDVHETPKHNSHERERSS 

EKIQRRSPHGNNGEGKRQHRDERDDGRRRQHDREDARELERKH 

HRERKERESREDEDRR RRRRRRREESRDKESR RRERDEDDHRSHRDYK KERRRERDDRHGREARR 

HERRDR 

> emb| |CAD97776.1| 

Length=492 

GENE ID: 885313 

PPIL4 | peeptidylprolyl 

is somerase (cyclopphilin)-like 

4 

[Homo sapieens] 

(10 or feweer 

PubMed links) ) 

Score = 3369 

bits (946), Expect = 7e-10 02, Method: Comp mpositional matr rix adjust. 

Identitiess 

= 187/329 (56% %), Positives = 239/329 (72%), Gaps = 15/329 (4%) 

Query 1 

Sbjct 1 

Query 61 

Sbjct 61 

Query 121 

Sbjct 121 

Query 181 

Sbjct 179 

Query 235 

Sbjct 232 

Query 295 

RLYVRGTVLGYKRSSKSNQYPNTSLIQIEG 

GVNTQEEVNWYKGKRL RLAYIYKAKT-------K 

62 

RL+ + GYKR NQ +T+L++IEG GV ++E +Y GKR R AY+YKAK K 

RLWSKAIFAGYKRGGLRNQREHTALLKIEG 

GVYARDETEFYLGKRC RCAYVYKAKNNTVTPG GGK 63 

KNGSHYRCIWGKVTTRPHGNSGVVRSKFTS 

SNLPPKSMGARVRVFM FMYPSNI 111 

N + R IWGKVTTR 

HGNSG+VR+KF SNLP S K++G R+RV + +YPS I 

PNKT--RVIWGKVTTRAHGNSGMVRAKFRS 

SNLPAKAIGHRIRVML MLYPSRI 110 

hypothetical protein p [Homo saapiens] 

MSVLIVTSLGDIVIIDLHSDKCPLTCKNFL 

LKLCKIKYYNGCLFHT HTVQKDFTAQTGDPTG GTG 60 

M+VL+ T+LGD+VIIDL++++ 

P C NFL LKLCKIKYYN CL H VQ+DF QTGDPTG GTG 

MAVLLETTLGDVVIIDLYTEERPRACLNFL 

LKLCKIKYYNYCLIHN HNVQRDFIIQTGDPTG GTG 60 

AGGDSIYKFLYGEQQARFYKDEIHLDLKHS 

SKTGTVAMASGGENLNNASQFYFTLRDDLDY 

YLD 120 

GG+SI+ LYG+QQA 

F++ E +KH K GTV+M + G + + SQF T ++LDY YLD 

RGGESIFGQLYGDQQASFFEAEKVPRIKHK 

KKKGTVSMVNNGSDQH QHGSQFLITTGENLDY YLD 120 

GKHTVFGQIAEGFDDTLTRINEAYVDPKNR 

RPYKNIRIKHTHILDD DDPFDDPPQLAEMMPD DAS 180 

G HTVFG++ EG D + +INE +VD PY++IRI HT ILDD DD ++PD D S 

GVHTVFGEVTEGMDDIIKKINETFVDKDFV 

VPYQDIRINHTVILDD DD--PFDDPPDLLIPD DRS 178 

PEGKPKEEVKDDVRRLEDDWVPMDEEL--- 

----GAQELEEVIREKKAAHSSAVVLESIGD 

DIP 234 

PE P E D R + DEE+ A+E+EE+ EKK 

A + A++LE +GD D+P 

PE--PTREQLDSGRR-----IGADEEIDDF 

FKGRSAEEVEEIKAEKKEAKTQAILLEMVGD 

DLP 231 

EAEVKPPDNVLFVCCKLNPVTEDEDLHTIF 

FSRFGTVVSADVIRDF DFKTGDSLCYAFIEFENK 

294 

+A++KPP+NVLFVCCKLNPVT 

DEDL IF FSRFG + S +VIRD+ D+KTG+SLCYAFIEFE + 

DADIKPPENVLFVCCKLNPVTTDEDLEIIF 

FSRFGPIRSCEVIRDW DWKTGESLCYAFIEFEKE 

291 

ESCEQAYFKMDNALLIDDRRIHVDFSQSVS 

S 323

E CE+A+FKMDN LIDDRRIHVDFSQSV+ 

Sbjct 292 EDCEKAFFKMDNVLIDDRRIHVDFSQSVA 320 

>AT1G55130 

MAIRIRISGTLLLSFLFFSTLHAFYLPGVAPRDFQKGDPLYVKVNKLSSTKTQLPYDFYYLNYCKPPKILNTGENLGEVLRGDRIENSVYTFEMLEDQPC 

RVGCRVRVDAESAKNFREKIDYEYRANMILDNLPVAVLRQRKDGIQSTTYEHGYRVGFKGSYEGSKEKKYFIHNHLSFRVMYHRDQESESSRIVGFEVTP 

NSVLHEYKEWDENNPQLTTCNKDTKNLIQSNTVPQEVEEGKEIVFTYDVAFKESVIKWASRWDTYLLMNDDQIHWFSIINSLMIVLFLSGMVAMIMMRTL 

YKDISNYNQLETQDEAQEETGWKLVHGDVFRTPMNSGLLCVYVGTGVQIFGMTLVTMIFALLGFLSPSNRGGLTTAMVLLWVFMGIFAGYSSSRLHKMFK 

GNEWKRITLKTAFMFPGILFAIFFVLNTLIWGERSSGAIPFSTMFALVCLWFGISVPLVFIGSYLGHKKPAIEDPVKTNKIPRQVPEQPWYMKPGFSILI 

GGILPFGAVFIELFFILTSIWLNQFYYIFGFLFIVFLILIVTCAEITIVLCYFQLCSEDYNWCWRAYLTSGSSSLYLFLYSVFYFFTKLEISKLVSGVLY 

FGYMIIISYSFFVLTGSIGFYACLWFVRKIYSSVKID 

GENE ID: 9777 TM9SF4 | transmembrane 9 superfamily protein member 4 




Query 12 LLSFLFFSTLHAFYLPGVAPRDFQKGDPLYVKVNKLSSTKTQLPYDFYYLNYCKPPKILN 71 

LL F AFY+PGVAP +F + DP+ +K KL+S++TQLPY++Y L +C+P KI 

Sbjct 12 LLLFSLMCETSAFYVPGVAPINFHQNDPVEIKAVKLTSSRTQLPYEYYSLPFCQPSKITY 71 

Query 72 TGENLGEVLRGDRIENSVYTFEMLEDQPCRVGCR-----VRVDAESAKNFREKIDYEYRA 126 

ENLGEVLRGDRI N+ + M ++ C V C V + E ++ E+I +Y 

Sbjct 72 KAENLGEVLRGDRIVNTPFQVLMNSEKKCEVLCSQSNKPVTLTVEQSRLVAERITEDYYV 131 

Query 127 NMILDNLPVAVLRQRKDG--------IQSTTYEHGYRVGFKGSYEGSKEKKYFIHNHLSF 178 

++I DNLPVA + + +EHGYR+GF + K ++HNHLSF 

Sbjct 132 HLIADNLPVATRLELYSNRDSDDKKKEKDVQFEHGYRLGF------TDVNKIYLHNHLSF 185 

Query 179 RVMYHRDQESESS----RIVGFEVTPNSVLHEYKEWDENNPQLTTCNKDTKNLIQSNTVP 234 

+ YHR+ E R+V FEV P S+ E + DE ++C +N+ P 

Sbjct 186 ILYYHREDMEEDQEHTYRVVRFEVIPQSIRLEDLKADEK----SSCTLPEG----TNSSP 237 

Query 235 QEVEEGKE--IVFTYDVAFKESVIKWASRWDTYLLMNDDQIHWFSIINSLMIVLFLSGMV 292 

QE++ KE + FTY V ++ES IKWASRWDTYL M+D QIHWFSIINS+++V FLSG++ 

Sbjct 238 QEIDPTKENQLYFTYSVHWEESDIKWASRWDTYLTMSDVQIHWFSIINSVVVVFFLSGIL 297 

Query 293 AMIMMRTLYKDISNYNQLETQDEAQEETGWKLVHGDVFRTPMNSGLLCVYVGTGVQIFGM 352 

+MI++RTL KDI+NYN+ + ++ EE+GWKLVHGDVFR P +L +G+G+Q+F M 

Sbjct 298 SMIIIRTLRKDIANYNKEDDIEDTMEESGWKLVHGDVFRPPQYPMILSSLLGSGIQLFCM 357 

Query 353 TLVTMIFALLGFLSPSNRGGLTTAMVLLWVFMGIFAGYSSSRLHKMFKGNEWKRITLKTA 412 

L+ + A+LG LSPS+RG L T L++FMG+F G+S+ RL++ KG+ WK+ TA 

Sbjct 358 ILIVIFVAMLGMLSPSSRGALMTTACFLFMFMGVFGGFSAGRLYRTLKGHRWKKGAFCTA 417 

Query 413 FMFPGILFAIFFVLNTLIWGERSSGAIPFSTMFALVCLWFGISVPLVFIGSYLGHKKPAI 472 

++PG++F I FVLN IWG+ SSGA+PF TM AL+C+WFGIS+PLV++G Y G +K 

Sbjct 418 TLYPGVVFGICFVLNCFIWGKHSSGAVPFPTMVALLCMWFGISLPLVYLGYYFGFRKQPY 477 

Query 473 EDPVKTNKIPRQVPEQPWYMKPGFSILIGGILPFGAVFIELFFILTSIWLNQFYYIFGFL 532 

++PV+TN+IPRQ+PEQ WYM IL+ GILPFGA+FIELFFI ++IW NQFYY+FGFL 

Sbjct 478 DNPVRTNQIPRQIPEQRWYMNRFVGILMAGILPFGAMFIELFFIFSAIWENQFYYLFGFL 537 

Query 533 FIVFLILIVTCAEITIVLCYFQLCSEDYNWCWRAYLTSGSSSLYLFLYSVFYFFTKLEIS 592 

F+VF+IL+V+C++I+IV+ YFQLC+EDY W WR +L SG S+ Y+ +Y++FYF KL+I 

Sbjct 538 FLVFIILVVSCSQISIVMVYFQLCAEDYRWWWRNFLVSGGSAFYVLVYAIFYFVNKLDIV 597 

Query 593 KLVSGVLYFGYMIIISYSFFVLTGSIGFYACLWFVRKIYSSVKID 637 

+ + +LYFGY ++ SF++LTG+IGFYA FVRKIY++VKID 

Sbjct 598 EFIPSLLYFGYTALMVLSFWLLTGTIGFYAAYMFVRKIYAAVKID 642 

>AT1G56190 

MASTAATAALSIIKSTGGAAVTRSSRASFGHIPSTSVSARRLGFSAVVDSRFSVHVASKVHSVRGKGARGVITMAKKSVGDLNSVDLKGKKVFVRADLNV 

PLDDNQNITDDTRIRAAIPTIKFLIENGAKVILSTHLGRPKGVTPKFSLAPLVPRLSELLGIEVVKADDCIGPEVETLVASLPEGGVLLLENVRFYKEEE 

KNEPDFAKKLASLADLYVNDAFGTAHRAHASTEGVTKFLKPSVAGFLLQKELDYLVGAVSNPKRPFAAIVGGSKVSSKIGVIESLLEKCDILLLGGGMIF 

TFYKAQGLSVGSSLVEEDKLELATTLLAKAKARGVSLLLPTDVVIADKFAPDANSKIVPASAIPDGWMGLDIGPDSVKTFNEALDTTQTVIWNGPMGVFE 

FEKFAKGTEAVANKLAELSKKGVTTIIGGGDSVAAVEKVGVAGVMSHISTGGGASLELLEGKVLPGVVALDEATPVTV 

GENE ID: 5230 PGK1 | phosphoglycerate kinase 1 [Homo sapiens] 




Query 82 LNSVDLKGKKVFVRADLNVPLDDNQNITDDTRIRAAIPTIKFLIENGAK-VILSTHLGRP 140 

L+ +D+KGK+V +R D NVP+ +NQ IT++ RI+AA+P+IKF ++NGAK V+L +HLGRP 

Sbjct 9 LDKLDVKGKRVVMRVDFNVPMKNNQ-ITNNQRIKAAVPSIKFCLDNGAKSVVLMSHLGRP 67 

Query 141 KGVT--PKFSLAPLVPRLSELLGIEVVKADDCIGPEVETLVASLPEGGVLLLENVRFYKE 198 

GV K+SL P+ L LLG +V+ DC+GPEVE A+ G V+LLEN+RF+ E 

Sbjct 68 DGVPMPDKYSLEPVAVELKSLLGKDVLFLKDCVGPEVEKACANPAAGSVILLENLRFHVE 127 

Query 199 EE-----------KNEPD----FAKKLASLADLYVNDAFGTAHRAHASTEGVTKFLKPSV 243 

EE K EP F L+ L D+YVNDAFGTAHRAH+S GV L 

Sbjct 128 EEGKGKDASGNKVKAEPAKIEAFRASLSKLGDVYVNDAFGTAHRAHSSMVGVN--LPQKA 185 

Query 244 AGFLLQKELDYLVGAVSNPKRPFAAIVGGSKVSSKIGVIESLLEKCDILLLGGGMIFTFY 303 

GFL++KEL+Y A+ +P+RPF AI+GG+KV+ KI +I ++L+K + +++GGGM FTF 

Sbjct 186 GGFLMKKELNYFAKALESPERPFLAILGGAKVADKIQLINNMLDKVNEMIIGGGMAFTFL 245 

Query 304 KA-QGLSVGSSLVEEDKLELATTLLAKAKARGVSLLLPTDVVIADKFAPDANS-KIVPAS 361 

K + +G+SL +E+ ++ L++KA+ GV + LP D V ADKF +A + + AS 

Sbjct 246 KVLNNMEIGTSLFDEEGAKIVKDLMSKAEKNGVKITLPVDFVTADKFDENAKTGQATVAS 305 

Query 362 AIPDGWMGLDIGPDSVKTFNEALDTTQTVIWNGPMGVFEFEKFAKGTEAVANKLAELSKK 421 

IP GWMGLD GP+S K + EA+ + ++WNGP+GVFE+E FA+GT+A+ +++ + + + 

Sbjct 306 GIPAGWMGLDCGPESSKKYAEAVTRAKQIVWNGPVGVFEWEAFARGTKALMDEVVKATSR 365 

Query 422 GVTTIIGGGDSVAAVEKVGVAGVMSHISTGGGASLELLEGKVLPGVVAL 470 

G TIIGGGD+ K +SH+STGGGASLELLEGKVLPGV AL 

Sbjct 366 GCITIIGGGDTATCCAKWNTEDKVSHVSTGGGASLELLEGKVLPGVDAL 414

AT1G63660 

METPTMKPDTVLILDYGSQYTHLITRRIRSLNVFSLVISGTSSLKSITSYNPRVVILSGGPHSVHALDAPSFPEGFIEWAESNGVSVLGICYGLQLIVQK 

LGGVVVEGESKEYGKMEIEVKGKSEIFGSESGGEKQMVWMSHGDEAVKLPEGFEVVAQSAQGAVAALESRKKKIYGLQYHPEVTHSPKGMETLRHFLFDV 

CGVSADWKMEDLMEEEIKVINKTVASDEHVICALSGGVDSTVAATLVHKAIGDRLHCIFVDNGLLRYKEQERVMDTFERDLHLPVTCVDASERFLSELKG 

VVDPETKRKIIGREFINIFDQFAQELEKKHGKKPAFLVQGTLYPDVIESCPPPGTDRTHSHTIKSHHNVGGLPKDMKLKLIEPLKLLFKDEVRELGRILN 

VPVGFLKRHPFPGPGLAVRVLGDVTQGNALEVLRQVDEIFIQSIRDAGLYDSIWQAFAVFLPVRSVGVQGDKRTHSHVVALRAVTSQDGMTADWFNFEHK 

FLDDVSRKICNSVQGVNRVVLDITSKPPSTIEWE 

GENE ID: 8833 GMPS | guanine monphosphate synthetase [Homo sapiens] 




Query 11 VLILDYGSQYTHLITRRIRSLNVFSLVISGTSSLKSITSYNPRVVILSGGPHSVHALDAP 70 

V+ILD G+QY +I RR+R L V S + + +I R +I+SGGP+SV+A DAP 

Sbjct 28 VVILDAGAQYGKVIDRRVRELFVQSEIFPLETPAFAIKEQGFRAIIISGGPNSVYAEDAP 87 

Query 71 SFPEGFIEWAESNGVSVLGICYGLQLIVQKLGGVVVEGESKEYGKMEIEVKGKSEIFGSE 130 

F + G VLGICYG+Q++ + GG V + +E G I V +F 

Sbjct 88 WFDPAIF----TIGKPVLGICYGMQMMNKVFGGTVHKKSVREDGVFNISVDNTCSLFRGL 143 

Query 131 SGGEKQMVWMSHGDEAVKLPEGFEVVAQSAQGAVAALESRKKKIYGLQYHPEVTHSPKGM 190 

++++V ++HGD K+ +GF+VVA+S VA + + KK+YG Q+HPEV + G 

Sbjct 144 Q--KEEVVLLTHGDSVDKVADGFKVVARSGN-IVAGIANESKKLYGAQFHPEVGLTENGK 200 

Query 191 ETLRHFLFDVCGVSADWKMEDLMEEEIKVINKTVASDEHVICALSGGVDSTVAATLVHKA 250 

L++FL+D+ G S + +++ E I+ I + V + + V+ LSGGVDSTV L+++A 

Sbjct 201 VILKNFLYDIAGCSGTFTVQNRELECIREIKERVGTSK-VLVLLSGGVDSTVCTALLNRA 259 

Query 251 IG-DRLHCIFVDNGLLRYKEQERVMDTFERDLHLPVTCVDASERFLS------------- 296 

+ +++ + +DNG +R +E + V + ++ L + V ++A+ F + 

Sbjct 260 LNQEQVIAVHIDNGFMRKRESQSVEEALKK-LGIQVKVINAAHSFYNGTTTLPISDEDRT 318 

Query 297 -------ELKGVVDPETKRKIIGREFINIFDQFAQELEKKHGKKPAFLVQGTLYPDVIES 349 

L PE KRKIIG F+ I ++ E+ K + FL QGTL PD+IES 

Sbjct 319 PRKRISKTLNMTTSPEEKRKIIGDTFVKIANEVIGEMNLK--PEEVFLAQGTLRPDLIES 376 

Query 350 CPPPGTDRTHSHTIKSHHNVGGLPKDMKL--KLIEPLKLLFKDEVRELGRILNVPVGFLK 407 

+ + + IK+HHN L + ++ K+IEPLK KDEVR LGR L +P + 

Sbjct 377 ASLVASGK--AELIKTHHNDTELIRKLREEGKVIEPLKDFHKDEVRILGRELGLPEELVS 434 

Query 408 RHPFPGPGLAVRVL--------GDVTQGNALEVLRQVDEI---------FIQSIRDAGLY 450 

RHPFPGPGLA+RV+ D + N +L+ V + +Q ++ 

Sbjct 435 RHPFPGPGLAIRVICAEEPYICKDFPETN--NILKIVADFSASVKKPHTLLQRVKACTTE 492 

Query 451 D---------SIWQAFAVFLPVRSVGVQGDKRTHSHVVALRAVTSQDGMTADWFNFEHKF 501 

+ S+ A LP+++VGVQGD R++S+V ++S+D DW + F 

Sbjct 493 EDQEKLMQITSLHSLNAFLLPIKTVGVQGDCRSYSYVC---GISSKD--EPDWESL--IF 545 

Query 502 LDDVSRKICNSVQGVNRVVLDITSKPPSTI 531 

L + ++C++V V + +PP+ + 

Sbjct 546 LARLIPRMCHNVNRVVYIFGPPVKEPPTDV 575 

Score = 40.0 bits (92), Expect = 0.010, Method: Compositional matrix adjust. 


Query 430 LEVLRQVDEIFIQSIRDAGLYDSIWQAFAVFLPVR--SVGVQGDKRTHSHVVALRAVTSQ 487 

L LRQ D +R++G I Q + P+ +Q VV +R + 

Sbjct 585 LSTLRQADFEAHNILRESGYAGKISQMPVILTPLHFDRDPLQKQPSCQRSVV-IRTFITS 643 

Query 488 DGMTADWFNFEHKFLDDVSRKICNSVQ---GVNRVVLDITSKPPSTIEWE 534 

D MT ++ +V K+ ++ G++R++ D+TSKPP T EWE 

Sbjct 644 DFMTGIPATPGNEIPVEVVLKMVTEIKKIPGISRIMYDLTSKPPGTTEWE 693 

>AT1G67090 

MASSMLSSATMVASPAQATMVAPFNGLKSSAAFPATRKANNDITSITSNGGRVNCMQVWPPIGKKKFETLSYLPDLTDSELAKEVDYLIRNKWIPCVEFE 

LEHGFVYREHGNSPGYYDGRYWTMWKLPLFGCTDSAQVLKEVEECKKEYPNAFIRIIGFDNTRQVQCISFIAYKPPSFTG 

GENE ID: 84284 C1orf57 | chromosome 1 open reading frame 57 [Homo sapiens] 

(10 or fewer PubMed links) 



Query 22 APFNGLKSSAAFPATRKANNDITSITSNGGRVNCMQVWPPIGKKKFETLSYLPDLTDSE- 80 

P +G + R+ D+ +++ G ++ + + PP GK++ Y+ DLT E 

Sbjct 31 VPVDGFYTEEVRQGGRRIGFDVVTLSGTRGPLSRVGLEPPPGKRECRVGQYVVDLTSFEQ 90 

Query 81 ----LAKEVDYLIRNKWIP----CVE 98 

+ + V RN +P CV+ 

Sbjct 91 LALPVLRNVTKENRNHLLPDIVTCVQ 116 

>AT1g73430 

1 MATKAASSSS LPKSGAISKG YNFASTWEQS APLTEQQQAA IVSLSHAVAE 

51 RPFPANLVHE HVHRPENGLS VSVEDTHLGD SGAIEAVLVN TNQFYKWFTD 

101 LESAMKSETE EKYRHYVSTL TERIQTCDNI LHQVDETLDL FNELQLQHQG 

151 VTTKTKTLHD ACDRLLMEKQ KLMEFAEALR SKLNYFDELE NVSSNFYSPN 

201 MNVSNSNFLP LLKRLDECIS YIEDNPQYAE SSVYLLKFRQ LQSRALGMIR 

251 TYILAVLKTA ASQVQAAFRG TGGNKTSVSE GVEASVIYVR FKAAANELKP

301 VLEEIESSRSA 

RKEYVQILAE CHRLYCEQRL SLVK KGIVHQR VSDFAKKE KEAL 

351 PSLTRSGGCAY 

LMQVCHMEHQ LFTHFFPASS EEVS SSLAPLV DPLSTYLYYDI 

401 LRPKLIHHEAN 

IDLLCELVHI LKVEVLGDQS ARQS SEPLAGL RPTLQRILLAD 

451 VNERLTFFRAR 

TYIRDEIANY TPSDEDLDYP AKLE EGSPNTT SETDLRDD DDEN 

501 ADVFKTWWYPP 

LEKTLSCLSK LYRCLEQAVF TGLA AQEAVEV CSLSIQKA KASK 

551 LIIKRSTTTMD 

GQLFLIKHLL ILREQIAPFD IEFS SVTHKEL DFSHLLEHHLR 

601 RILRGQAASLF 

DWSRSTSLAR TLSPRVLESQ IDAK KKELEKC LKTTCEEFFIM 

651 SVTKLVVVDPM 

LSFVTKVTAI KVALSSGTQN HKVD DSVMAKP LKEQAFAT ATPD 

701 KVVELVQQKVY 

AAIQQELLPI LAKMKLYLQN PSTR RTILFKP IKTNIVEAAHT 

751 QVESLLKKAEY 

SAEEQANINM ISIQDLQTQL DNFL L 

> ref| |NP_113619.1| 

Score = 4462 


matrix 

adjust. 

Identitiess 


Query 27 

Sbjct 25 

Query 77 

Sbjct 85 

Query 131 

Sbjct 145 

Query 191 

Sbjct 205 

Query 251 

Sbjct 265 

Query 310 

Sbjct 319 

Query 367 

Sbjct 379 

Query 427 

Sbjct 436 

Query 484 

Sbjct 496 

Query 509 

Sbjct 556 

Query 569 

Sbjct 616 

Query 624 

Sbjct 676 

Query 684 

Sbjct 735 

Query 744 

Sbjct 788 

>AT1G73390 

MGCFASRPNDTTGGNRRKPTSIGDVSVVYVPGLRIPKPVEFSQ 

QSLGDQLPKTLVERLT LTALRTRIVVMANQEG GPTITRTRRKTQHGGSTLADLHHALEDYIPVV 

LLGLTKDGSHLLQFKVQFNWVNQEDEEEEETAMSNVWYEILSV 

VLHLMAMLQMSQANLL LLLLPRGSSDGYHPKISEENRRASIDIFLKA 

AAGYLDCAVKHVLPHFF 

STEQRRSLPIDDLAEGALRALCLQALGGQGVDIQLGMAIDSAK 

KATLAVKRRLSCEMVK VKYWQQAQDNLMNLPL LANGWGEKHMLFVKWK KYVEAKAAAYYYHGLII 

LDEGNTEKSHGGMAVAALQAADECLKEESKKASEAFNTSSPTS 

SRTPSLFGTMKYLSEK EKIPKETSSKVRINRD DLYSYEKIMETAPTLP PDFALALKPDEYQLPSS 

VDASWSEASLRRTKNTSNHI 

> gb|AAAF24980.1|AF1500882_1 

volta age-gated sodiumm 

channel alpha subunit, alternate 

splice 

variant SCNN12A-s 

[Homo sappiens] 

Length=14444 

Score = 311.2 

bits (69), Expect = 3.6, Method: M Composittional 

matrix adjust. a 

Identitiess 

= 30/147 (20%) ), Positives = 63/147 6 (42%), Ga Gaps = 19/147 (12%) 

Query 65 

Sbjct 735 

Query 125 

Sbjct 780 

Query 185 

Sbjct 838 

WEQ----SAPLTEQQQQAAIVSLSHAVAER 

RPFPANLVHEHV-------HRPENGLSVSVEDT 

76 

W++ +APLT++ +Q +++ L A P PA L E + P SV E T 

WDRRPDTTAPLTDRRQTDSVLELKAAAENL 

LPVPAELPIEDLCSLTTSQSLPIELTSVVPEST 

84 

H------LGDSGAIIEAVLVNTNQFYKWFT 

TDLESAMKSETEEKYR YRHYVSTLTERIQTCD DNI 130 

G E + QF+ WF L++ M + KYR YR L+ + CD D I 

EDILLKGFTSLGMEEEERIETAQQFFSWFA 

AKLQTQMDQDEGTKYR YRQMRDYLSGFQEQCD DAI 144 

LHQVDETLDLFNELLQLQHQGVTTKTKTLH 

HDACDRLLMEKQKLME MEFAEALRSKLNYFDELE 

190 

L+ V+ L LLQ 

Q+ V+ KT TLH H+AC++LL E+ +L++ + AE ++ KL+YF+ELE 

LNDVNSALQHLESLLQKQYLFVSNKTGTLH 

HEACEQLLKEQSELVD VDLAENIQQKLSYFNELE 

204 

NVSSNFYSPNMNVSSNSNFLPLLKRLDECI 

ISYIEDNPQYAESSVY VYLLKFRQLQSRALGM MIR 250 

+++ SP ++V+ ++ F+P+L +LD+CI I+YI +P + + +YYLLKF+Q 

S+AL + ++ 

TINTKLNSPTLSVNNSDGFIPMLAKLDDCI 

ITYISSHPNFKDYPIYYLLKFKQCLSKALHL 

LMK 264 

TYILAVLKTAASQVVQAAFRGTGGNKTSVS 

SEGVEA-SVIYVRFKA KAAANELKPVLEEIESRS 

309 

TY + L+T SQ+ + + +SV A ++ YV+F+AAAA 

+++ ++E+IE RS 

TYTVNTLQTLTSQLL------LKRDPSSVP 

PNADNAFTLFYVKFRA RAAAPKVRTLIEQIEL LRS 318 

AR-KEYVQILAECHHRLYCEQRLSLVKGIV 

VHQRVSDFAKKEALP---SLTRSGCAYLMQV 

VCH 366 

+ EY Q+L + HH+ 

Y +QR L+ + V++ + +L RSGCA+++ VC V 

EKIPEYQQLLNDIHHQCYLDQRELLLGPSI 

IACTVAELTSQNNRDH DHCALVRSGCAFMVHV VCQ 378 

MEHQLFTHFFPASSSEEVSSLAPLVDPLST 

TYLYDILRPKLIHEAN ANIDLLCELVHILKVEVL 

426 

EHQL+ FF + ++ S L L++ L LYD+ RP +IH + +++ L EL ILK EVL 

DEHQLYNEFF---TTKPTSKLDELLEKLCV 

VSLYDVFRPLIIHVIHHLETLSELCGILKNEVL 

435 

GDQSARQSEPLAGLLRPTLQRILADVNERL 

LTFRARTYIRDEIANY NYTPSDEDLDYPAKL--- 

483 

D +E L ++++L DV ERL L +R YI+ +I Y P+ DL YP KL 

EDHVQNNAEQLGAFFAAGVKQMLEDVQERL 

LVYRTHIYIQTDITGY GYKPAPGDLAYPDKLV VMM 495 

---------------------------EGS 

SPNTTSETDLRDDEN- N---------ADVFKTWY 

508 

EG N+ +++ + N AD+ WY 

EQIAQSLKDEQKKVVPSEASFSDVHLEEGE 

ESNSLTKSGSTESLNP NPRPQTTISPADLHGM MWY 555 

PPLEKTLSCLSKLYYRCLEQAVFTGLAQEA 

AVEVCSLSIQKASKLIIIKRSTTMDGQLFLIKH 

568 

P + +TL CLSKLYYRC+++AVF 

GL+QEA A+ C S+ AS+ I K T +DGQLFLIKH 

PTVRRTLVCLSKLYYRCIDRAVFQGLSQEA 

ALSACIQSLLGASESIISKNKTQIDGQLFLIKH 

615 

LLILREQIAPFDIEEFSVTHKELDFSHLLE 

EHLRRILRGQA--SLFFDWSRSTSLARTL---S 

623 

LLILREQIAPF EEF++ 

LD + +IL F + + +L L + 

LLILREQIAPFHTEEFTIKEISLDLKKTRD 

DAAFKILNPMTVPRFF FFRLNSNNALIEFLLEGT 

675 

PRVLESQIDAKKELLEKCLKTTCEEFIMSV 

VTKLVVDPMLSFVTKV KVTAIKVALSSGTQNH HKV 683 

P + E +D+KK++ +++ LK+ CE+FI TKL V+ + F+TKV KV+A+K S G + 

PEIREHYLDSKKDVVDRHLKSACEQFIQQQ 

QTKLFVEQLEEFMTKV KVSALKTMASQGGPKY YT- 734 

DSVMAKPLKEQAFAATPDKVVELVQKVYAA 

AIQQELLPILAKMKLYYLQNPSTRTILFKPIKT 

743 

L +Q +AA 

P KV +L Y I+ +L L M LYYL 

N T ILFKP+ + 

-------LSQQPWAAQPAKVSDLAATAYKT 

TIKTKLPVTLRSMSLYYLSNKDTEFILFKPV 

VRN 787 

NIVEAHTQVESLLKKAEYSAEEQANINMIS 

SIQDL 776 

NI + + +LLKK 

E+S E+ I S++ S L 

NIQQVFQKFHALLKKEEFSPEDIQIIACPS 

SMEQL 820 

MANQEGPTITRTRRRKTQHGGSTLADLHHA 

ALEDYIPVLLGLTKDG DGSHLQFKVQFNWVNQ QED 124 

+ N GPT++ R H G D H+ + +L G + 

W ++ 

LCNPTGPTVSCLRHH--WHMG----DFWHS 

SFLVVFRILCGEWIENNM---------WECM 

MQE 779 

EEEETAMSNVWYEIILSVLHLMAMLQMSQA 

ANLLLLPRGSSDGYHP HPKISEENRRASIDIF FLK 184 

+++ + + + +++V+ + +L + A LLL S++ + + E R+ + + L 

ANASSSLCVIVFILLITVIGKLVVLNLFIA 

A--LLLNSFSNEERNG NGNLEGEARKTKVQLA ALD 837 

AAGYLDCAVKHVLPPHFSTE--QRRSLP 

C V+H L HF + ++++LP 

RFRRAFCFVRHTLEEHFCHKWCRKQNLP 

conserved d oligomeric Gollgi 

complex subu unit 3 [Homo sap piens] 

209 

864 

>AT1G73430 

MATKAASSSSLLPKSGAISKGYNFASTTWEQSAPLTEQQQAAI 

IVSLSHAVAERPFPAN ANLVHEHVHRPENGLS SVSVEDTHLGDSGAIEAVLVNTNQFYKWFTDD

LESAMKSETEEKYRHYVSTLTERIQTCDNILHQVDETLDLFNELQLQHQGVTTKTKTLHDACDRLLMEKQKLMEFAEALRSKLNYFDELENVSSNFYSPN 

MNVSNSNFLPLLKRLDECISYIEDNPQYAESSVYLLKFRQLQSRALGMIRTYILAVLKTAASQVQAAFRGTGGNKTSVSEGVEASVIYVRFKAAANELKP 

VLEEIESRSARKEYVQILAECHRLYCEQRLSLVKGIVHQRVSDFAKKEALPSLTRSGCAYLMQVCHMEHQLFTHFFPASSEEVSSLAPLVDPLSTYLYDI 

LRPKLIHEANIDLLCELVHILKVEVLGDQSARQSEPLAGLRPTLQRILADVNERLTFRARTYIRDEIANYTPSDEDLDYPAKLEGSPNTTSETDLRDDEN 

ADVFKTWYPPLEKTLSCLSKLYRCLEQAVFTGLAQEAVEVCSLSIQKASKLIIKRSTTMDGQLFLIKHLLILREQIAPFDIEFSVTHKELDFSHLLEHLR 

RILRGQASLFDWSRSTSLARTLSPRVLESQIDAKKELEKCLKTTCEEFIMSVTKLVVDPMLSFVTKVTAIKVALSSGTQNHKVDSVMAKPLKEQAFATPD 

KVVELVQKVYAAIQQELLPILAKMKLYLQNPSTRTILFKPIKTNIVEAHTQVESLLKAEYSAEEQANINMISIQDLQTQLDNFL 

GENE ID: 83548 COG3 | component of oligomeric golgi complex 3 [Homo sapiens] 




Query 27 WEQ----SAPLTEQQQAAIVSLSHAVAERPFPANLVHEHV------HRPENGLSVSVEDT 76 

W++ +APLT++Q +++ L A P PA L E + P SV E T 

Sbjct 25 WDRRPDTTAPLTDRQTDSVLELKAAAENLPVPAELPIEDLCSLTSQSLPIELTSVVPEST 84 

Query 77 H------LGDSGAIEAVLVNTNQFYKWFTDLESAMKSETEEKYRHYVSTLTERIQTCDNI 130 

G E + QF+ WF L++ M + KYR L+ + CD I 

Sbjct 85 EDILLKGFTSLGMEEERIETAQQFFSWFAKLQTQMDQDEGTKYRQMRDYLSGFQEQCDAI 144 

Query 131 LHQVDETLDLFNELQLQHQGVTTKTKTLHDACDRLLMEKQKLMEFAEALRSKLNYFDELE 190 

L+ V+ L LQ Q+ V+ KT TLH+AC++LL E+ +L++ AE ++ KL+YF+ELE 

Sbjct 145 LNDVNSALQHLESLQKQYLFVSNKTGTLHEACEQLLKEQSELVDLAENIQQKLSYFNELE 204 

Query 191 NVSSNFYSPNMNVSNSNFLPLLKRLDECISYIEDNPQYAESSVYLLKFRQLQSRALGMIR 250 

+++ SP ++V++ F+P+L +LD+CI+YI +P + + +YLLKF+Q S+AL +++ 

Sbjct 205 TINTKLNSPTLSVNSDGFIPMLAKLDDCITYISSHPNFKDYPIYLLKFKQCLSKALHLMK 264 

Query 251 TYILAVLKTAASQVQAAFRGTGGNKTSVSEGVEA-SVIYVRFKAAANELKPVLEEIESRS 309 

TY + L+T SQ+ + +SV A ++ YV+F+AAA +++ ++E+IE RS 

Sbjct 265 TYTVNTLQTLTSQL------LKRDPSSVPNADNAFTLFYVKFRAAAPKVRTLIEQIELRS 318 

Query 310 AR-KEYVQILAECHRLYCEQRLSLVKGIVHQRVSDFAKKEALP--SLTRSGCAYLMQVCH 366 

+ EY Q+L + H+ Y +QR L+ + V++ + +L RSGCA+++ VC 

Sbjct 319 EKIPEYQQLLNDIHQCYLDQRELLLGPSIACTVAELTSQNNRDHCALVRSGCAFMVHVCQ 378 

Query 367 MEHQLFTHFFPASSEEVSSLAPLVDPLSTYLYDILRPKLIHEANIDLLCELVHILKVEVL 426 

EHQL+ FF ++ S L L++ L LYD+ RP +IH +++ L EL ILK EVL 

Sbjct 379 DEHQLYNEFF---TKPTSKLDELLEKLCVSLYDVFRPLIIHVIHLETLSELCGILKNEVL 435 

Query 427 GDQSARQSEPLAGLRPTLQRILADVNERLTFRARTYIRDEIANYTPSDEDLDYPAKL--- 483 

D +E L ++++L DV ERL +R YI+ +I Y P+ DL YP KL 

Sbjct 436 EDHVQNNAEQLGAFAAGVKQMLEDVQERLVYRTHIYIQTDITGYKPAPGDLAYPDKLVMM 495 

Query 484 --------------------------EGSPNTTSETDLRDDEN---------ADVFKTWY 508 

EG N+ +++ + N AD+ WY 

Sbjct 496 EQIAQSLKDEQKKVPSEASFSDVHLEEGESNSLTKSGSTESLNPRPQTTISPADLHGMWY 555 

Query 509 PPLEKTLSCLSKLYRCLEQAVFTGLAQEAVEVCSLSIQKASKLIIKRSTTMDGQLFLIKH 568 

P + +TL CLSKLYRC+++AVF GL+QEA+ C S+ AS+ I K T +DGQLFLIKH 

Sbjct 556 PTVRRTLVCLSKLYRCIDRAVFQGLSQEALSACIQSLLGASESISKNKTQIDGQLFLIKH 615 

Query 569 LLILREQIAPFDIEFSVTHKELDFSHLLEHLRRILRGQA--SLFDWSRSTSLARTL---S 623 

LLILREQIAPF EF++ LD + +IL F + + +L L + 

Sbjct 616 LLILREQIAPFHTEFTIKEISLDLKKTRDAAFKILNPMTVPRFFRLNSNNALIEFLLEGT 675 

Query 624 PRVLESQIDAKKELEKCLKTTCEEFIMSVTKLVVDPMLSFVTKVTAIKVALSSGTQNHKV 683 

P + E +D+KK++++ LK+ CE+FI TKL V+ + F+TKV+A+K S G + 

Sbjct 676 PEIREHYLDSKKDVDRHLKSACEQFIQQQTKLFVEQLEEFMTKVSALKTMASQGGPKYT- 734 

Query 684 DSVMAKPLKEQAFATPDKVVELVQKVYAAIQQELLPILAKMKLYLQNPSTRTILFKPIKT 743 

L +Q +A P KV +L Y I+ +L L M LYL N T ILFKP++ 

Sbjct 735 -------LSQQPWAQPAKVSDLAATAYKTIKTKLPVTLRSMSLYLSNKDTEFILFKPVRN 787 

Query 744 NIVEAHTQVESLLKAEYSAEEQANINMISIQDL 776 

NI + + +LLK E+S E+ I S++ L 

Sbjct 788 NIQQVFQKFHALLKEEFSPEDIQIIACPSMEQL 820 

>AT1G76180 

MAEEIKNVPEQEVPKVATEESSAEVTDRGLFDFLGKKKDETKPEETPIASEFEQKVHISEPEPEVKHESLLEKLHRSDSSSSSSSEEEGSDGEKRKKKKE 

KKKPTTEVEVKEEEKKGFMEKLKEKLPGHKKPEDGSAVAAAPVVVPPPVEEAHPVEKKGILEKIKEKLPGYHPKTTVEEEKKDKE 

No significant homologies 

>AT1G78060 

MAKQLLLLLLLFIVHGVESAPPPHSCDPSNPTTKLYQFCRTDLPIGKRARDLVSRLTIDEKISQLVNTAPGIPRLGVPAYEWWSEALHGVAYAGPGIRFN 

GTVKAATSFPQVILTAASFDSYEWFRIAQVIGKEARGVYNAGQANGMTFWAPNINIFRDPRWGRGQETPGEDPMMTGTYAVAYVRGLQGDSFDGRKTLSN 

HLQASACCKHFTAYDLDRWKGITRYVFNAQVSLADLAETYQPPFKKCIEEGRASGIMCAYNRVNGIPSCADPNLLTRTARGQWAFRGYITSDCDAVSIIY 

DAQGYAKSPEDAVADVLKAGMDVNCGSYLQKHTKSALQQKKVSETDIDRALLNLFSVRIRLGLFNGDPTKLPYGNISPNEVCSPAHQALALDAARNGIVL 

LKNNLKLLPFSKRSVSSLAVIGPNAHVVKTLLGNYAGPPCKTVTPLDALRSYVKNAVYHQGCDSVACSNAAIDQAVAIAKNADHVVLIMGLDQTQEKEDF 

DRVDLSLPGKQQELITSVANAAKKPVVLVLICGGPVDISFAANNNKIGSIIWAGYPGEAGGIAISEIIFGDHNPGGRLPVTWYPQSFVNIQMTDMRMRSA 

TGYPGRTYKFYKGPKVYEFGHGLSYSAYSYRFKTLAETNLYLNQSKAQTNSDSVRYTLVSEMGKEGCDVAKTKVTVEVENQGEMAGKHPVLMFARHERGG 

EDGKRAEKQLVGFKSIVLSNGEKAEMEFEIGLCEHLSRANEFGVMVLEEGKYFLTVGDSELPLIVNV 

GENE ID: 84503 ZNF527 | zinc finger protein 527 [Homo sapiens] 




Query 231 VSLADLAETYQPPFKKCIEEGRASGIMCAYNRVNGIPSCADP-------------NLLTR 277 

++L T + PFK C E G+ G N+ I + P + L R 

Sbjct 377 LTLHQRIHTGEKPFK-CSECGKTFGYRSHLNQHQRIHTGEKPYECIKCGKFFRTDSQLNR 435 

Query 278 TARGQWAFRGYITSDC-----DAVSIIYDAQGYAKSPEDAVADVLKAGMDVNCGSYLQKH 332 

R R + S C DA+ +I+ + +A + + K G +CGSYL +H 

Sbjct 436 HHRIHTGERPFECSKCGKAFSDALVLIHHKRSHAG---EKPYECNKCGKAFSCGSYLNQH 492 

Query 333 TKSALQQKKVSETDIDRALLNLFSVRIRLGLFNGD 367 

+ +K ++ +A + S+R+ + G+ 

Sbjct 493 QRIHTGEKPYECSECGKAFHQILSLRLHQRIHAGE 527

AT2G21330 

MASSTATMLKASPVKSDWVKGQSLLLRQPSSVSAIRSHVAPSALTVRAASAYADELVKTAKTIASPGHGIMAMDESNATCGKRLASIGLENTEANRQAYR 

TLLVSAPGLGQYISGAILFEETLYQSTTDGKKMVDVLVEQNIVPGIKVDKGLVPLVGSYDESWCQGLDGLASRTAAYYQQGARFAKWRTVVSIPNGPSAL 

AVKEAAWGLARYAAISQDSGLVPIVEPEIMLDGEHGIDRTYDVAEKVWAEVFFYLAQNNVMFEGILLKPSMVTPGAEATDRATPEQVASYTLKLLRNRIP 

PAVPGIMFLSGGQSELEATLNLNAMNQAPNPWHVSFSYARALQNTCLKTWGGKEENVKAAQDILLARAKANSLAQLGKYTGEGESEEAKEGMFVKGYT 

GENE ID: 226 ALDOA | aldolase A, fructose-bisphosphate [Homo sapiens] 




Query 55 ELVKTAKTIASPGHGIMAMDESNATCGKRLASIGLENTEANRQAYRTLLVSAPG-LGQYI 113 

EL A I +PG GI+A DES + KRL SIG ENTE NR+ YR LL++A + I 

Sbjct 69 ELSDIAHRIVAPGKGILAADESTGSIAKRLQSIGTENTEENRRFYRQLLLTADDRVNPCI 128 

Query 114 SGAILFEETLYQSTTDGKKMVDVLVEQNIVPGIKVDKGLVPLVGSYDESWCQGLDGLASR 173 

G ILF ETLYQ DG+ V+ + V GIKVDKG+VPL G+ E+ QGLDGL+ R 

Sbjct 129 GGVILFHETLYQKADDGRPFPQVIKSKGGVVGIKVDKGVVPLAGTNGETTTQGLDGLSER 188 

Query 174 TAAYYQQGARFAKWRTVVSI-PNGPSALAVKEAAWGLARYAAISQDSGLVPIVEPEIMLD 232 

A Y + GA FAKWR V+ I + PSALA+ E A LARYA+I Q +G+VPIVEPEI+ D 

Sbjct 189 CAQYKKDGADFAKWRCVLKIGEHTPSALAIMENANVLARYASICQQNGIVPIVEPEILPD 248 

Query 233 GEHGIDRTYDVAEKVWAEVFFYLAQNNVMFEGILLKPSMVTPGAEATDRATPEQVASYTL 292 

G+H + R V EKV A V+ L+ +++ EG LLKP+MVTPG T + + E++A T+ 

Sbjct 249 GDHDLKRCQYVTEKVLAAVYKALSDHHIYLEGTLLKPNMVTPGHACTQKFSHEEIAMATV 308 

Query 293 KLLRNRIPPAVPGIMFLSGGQSELEATLNLNAMNQAP--NPWHVSFSYARALQNTCLKTW 350 

LR +PPAV GI FLSGGQSE EA++NLNA+N+ P PW ++FSY RALQ + LK W 

Sbjct 309 TALRRTVPPAVTGITFLSGGQSEEEASINLNAINKCPLLKPWALTFSYGRALQASALKAW 368 

Query 351 GGKEENVKAAQDILLARAKANSLAQLGKYTGEGES-EEAKEGMFVKGY 397 

GGK+EN+KAAQ+ + RA ANSLA GKYT G++ A E +FV + 

Sbjct 369 GGKKENLKAAQEEYVKRALANSLACQGKYTPSGQAGAAASESLFVSNH 416 

>AT2G24500 

MSGLACNSCNKDFEDDAEQKFHYKSEWHRYNLKRKIAGVPGVTEALFEARQAAIAQEKVKAVEAPMLYSCGICNKGYRSSKAHEQHLKSKSHVLKASTST 

GEEDKAIIKQLPPRRVEKNNTAQLKGSIEEEESEDEWIEVDSDEDLDAEMNEDGEEEDMDEDGIEFELDPACCLMCDKKHKTIEKCMVHMHKFHGFFIPD 

IEYLKDPKGFLTYLGLKVKRDFVCLYCNELCHPFSSLEAVRKHMDAKGHCKVHYGDGGDEEDAELEEFYDYSSSYVNGDENQMVVSGESVNTVELFGGSE 

LVITKRTDNKVTSRTLGSREFMRYYKQKPAPSSQKHIVNSLTSRYKMMGLATVQSKEAIVRMKVMREMNKRGAKSSVRLGMKSNVIRNLPNNVTY 

GENE ID: 90441 ZNF622 | zinc finger protein 622 [Homo sapiens] 




Query 140 VDSDEDL---DAEMNEDGEEEDMDED----GIEFELDPAC-CLMCDKKHKTIEKCMVHMH 191 

+DSDE+L D E +D E+D +E+ G P CL C ++ K + HM 

Sbjct 213 IDSDEELECEDTEAMDDVVEQDAEEEEAEEGPPLGAIPITDCLFCSHHSSSLMKNVAHMT 272 

Query 192 KFHGFFIPDIEYLKDPKGFLTYLGLKVKRDFVCLYCNELCHPFSSLEAVRKHMDAKGHCK 251 

K H FFIPDIEYL D KG + YLG KV +CL+CNE F S EAV+ HM+ K HCK 

Sbjct 273 KDHSFFIPDIEYLSDIKGLIKYLGEKVGVGKICLWCNEKGKSFYSTEAVQAHMNDKSHCK 332 

Query 252 VHYGDGGDEEDAELE--EFYDYSSSYVNGDENQMVVSGESVNTV-ELFGGSELVITKRTD 308 

+ + DG DA LE +FYD+ SSY + E GE N EL L T 

Sbjct 333 L-FTDG----DAALEFADFYDFRSSYPDHKE------GEDPNKAEELPSEKNLEYDDETM 381 

Query 309 NKV--TSRTLGSREFMRYYKQK------PAPSSQKHIVNSLTSRYKMMGLATVQSKEAIV 360 

+ + +G R MRYYKQ+ A + + V + +Y+ +G T + A++ 

Sbjct 382 ELILPSGARVGHRSLMRYYKQRFGLSRAVAVAKNRKAVGRVLQQYRALGW-TGSTGAALM 440 

Query 361 RMKVMREMNKRGAKSSVRLGMKSNVIRNL 389 

R + M+ + + +K ++ GMK+N + + 

Sbjct 441 RERDMQYVQRMKSKWMLKTGMKNNATKQM 469 

Score = 76.3 bits (186), Expect = 1e-13, Method: Compositional matrix adjust. 


Query 1 MSGLACNSCNKDFEDDAEQKFHYKSEWHRYNLKRKIAGVPGVTEALFEAR---QAAIAQE 57 

M+ C +C F D Q+ HYK++WHRYNL+RK+A + VT F+ R Q A+A+E 

Sbjct 1 MATYTCITCRVAFRDADMQRAHYKTDWHRYNLRRKVASMAPVTAEGFQERVRAQRAVAEE 60 

Query 58 KVKAVEAPMLYSCGICNKGYRSSKAHEQHLKSKSHV 93 

+ K C +C+K + S A+E HLKS+ HV 

Sbjct 61 ESKGSAT----YCTVCSKKFASFNAYENHLKSRRHV 92 

>AT2G27280 

MEEARLSTLPFSASFNPSNPLGFLENVLDFIGKESNFLRKDTAEKEITDAVTTAKERLRETEKKTESMDVEKVRPSTLPFNASFDPSDPLGFLEKVFEFV 

GKKSNFLVKDKAVNAIITAVTDAKERLKEEEKESVKQATVKIKKYGLQIRAPSQKKQSSSRPLLRTASIFGEDDEENDVEKEISRQASKTKSLKKIEKQH 

KKAIEEDPSAFAYDEVYDDIKHEAALPRMQDREEHKSRYIQHIMKQAERREKEHEIVYERKLAKERAKDEHLYSDKEKFVTGPFKRKLEEQKKWLEEERL 

RELREERDDVTKKNDLSEFYINIGKNVAFGARDIEAREAGRLKELRKVDRLEELRKEETRKEKKRKSPEKEVSPDSGDFGLSSKKSVKPQDASIKEEAKE 

TQKATREDAIATAKERFLSRKKAKIEK 

GENE ID: 84081 CCDC55 | coiled-coil domain containing 55 [Homo sapiens] 




Query 143 KKYGLQIRAPSQKKQSSSRPLLRTASIFG---EDDEENDVEKEISRQASKTKSLKKIEKQ 199 

++YGL + P KK P+L+ S+FG +DD+E V + + R+A+K +++K+ + + 

Sbjct 6 RQYGLIL--P--KKTQQLHPVLQKPSVFGNDSDDDDETSVSESLQREAAKKQAMKQTKLE 61 

Query 200 HKKAIEEDPSAFAYDEVYDDI--KHEAALPRMQDREEHKSRYIQHIMKQAERREKEHEIV 257 

+KA+ ED + + YD +YD++ K E P++ ++ K +YI +++K E R+KE E

Sbjct 62 IQKALAEDATVYEYDSIYDEMQKKKEENNPKLLLGKDRKPKYIHNLLKAVEIRKKEQEKR 121 

Query 258 YERKLAKERAKDEHLYSDKEKFVTGPFKRKLEEQKKWLEEERLRELREERDDVTKKNDLS 317 

E+K+ +ER ++ + DKE FVT +K+KL+E+ + E E+ E DVTK+ DLS 

Sbjct 122 MEKKIQREREMEKGEFDDKEAFVTSAYKKKLQERAEEEEREKRAAALEACLDVTKQKDLS 181 

Query 318 EFYINIGKNVAFGARDI 334 

FY ++ N A G ++ 

Sbjct 182 GFYRHLL-NQAVGEEEV 197 

>AT2G28470 

MEIAAKMVKVRKMEMILLLILVIVVAATAANVTYDHRALVIDGKRKVLISGSIHYPRSTPEMWPELIQKSKDGGLDVIETYVFWSGHEPEKNKYNFEGRY 

DLVKFVKLAAKAGLYVHLRIGPYVCAEWNYGGFPVWLHFVPGIKFRTDNEPFKEEMQRFTTKIVDLMKQEKLYASQGGPIILSQIENEYGNIDSAYGAAA 

KSYIKWSASMALSLDTGVPWNMCQQTDAPDPMINTCNGFYCDQFTPNSNNKPKMWTENWSGWFLGFGDPSPYRPVEDLAFAVARFYQRGGTFQNYYMYHG 

GTNFDRTSGGPLISTSYDYDAPIDEYGLLRQPKWGHLRDLHKAIKLCEDALIATDPTITSLGSNLEAAVYKTESGSCAAFLANVDTKSDATVTFNGKSYN 

LPAWSVSILPDCKNVAFNTAKINSATESTAFARQSLKPDGGSSAELGSQWSYIKEPIGISKADAFLKPGLLEQINTTADKSDYLWYSLRTDIKGDETFLD 

EGSKAVLHIESLGQVVYAFINGKLAGSGHGKQKISLDIPINLVTGTNTIDLLSVTVGLANYGAFFDLVGAGITGPVTLKSAKGGSSIDLASQQWTYQVGL 

KGEDTGLATVDSSEWVSKSPLPTKQPLIWYKTTFDAPSGSEPVAIDFTGTGKGIAWVNGQSIGRYWPTSIAGNGGCTESCDYRGSYRANKCLKNCGKPSQ 

TLYHVPRSWLKPSGNILVLFEEMGGDPTQISFATKQTGSNLCLTVSQSHPPPVDTWTSDSKISNRNRTRPVLSLKCPISTQVIFSIKFASFGTPKGTCGS 

FTQGHCNSSRSLSLVQKACIGLRSCNVEVSTRVFGEPCRGVVKSLAVEASCS 

> gb|EAW67839.1| hCG1729998, isoform CRA_d [Homo sapiens] 

Length=653 



Query 39 LVIDGKRKVLISGSIHYPRSTPEMWPELIQKSKDGGLDVIETYVFWSGHEPEKNKYNFEG 98 

++G + ++ GSIHY R E W + + K K G + + TYV W+ HEPE+ K++F G 

Sbjct 80 FTLEGHKFLIFGGSIHYFRVPREYWRDRLLKLKACGFNTVTTYVPWNLHEPERGKFDFSG 139 

Query 99 RYDLVKFVKLAAKAGLYVHLRIGPYVCAEWNYGGFPVWLHFVPGIKFRTDNEPFKEEMQR 158 

DL FV +AA+ GL+V LR GPY+C+E + GG P WL P + RT N+ F E +++ 

Sbjct 140 NLDLEAFVLMAAEIGLWVILRPGPYICSEMDLGGLPSWLLQDPRLLLRTTNKSFIEAVEK 199 

Query 159 FTTKIVDLMKQEKLYASQGGPIILSQIENEYG--NIDSAYGA-AAKSYIKWSASMALSLD 215 

+ ++ + L Q GP+I Q+ENEYG N D Y K+ ++ L 

Sbjct 200 YFDHLIP--RVIPLQYRQAGPVIAVQVENEYGSFNKDKTYMPYLHKALLRRGIVELLLTS 257 

Query 216 TGVPWNMCQQTDAPDPMIN--TCNGFYCDQFTPNSNNKPKMWTENWSGWFLGFGDPSPYR 273 

G + T IN + +Q +KP + E W GWF +GD + 

Sbjct 258 DGEKHVLSGHTKGVLAAINLQKLHQDTFNQLHKVQRDKPLLIMEYWVGWFDRWGDKHHVK 317 

Query 274 PVEDLAFAVARFYQRGGTFQNYYMYHGGTNFDRTSGGPL------ISTSYDYDAPIDEYG 327 

+++ AV+ F + +F N YM+HGGTNF +G I TSYDYDA + E G 

Sbjct 318 DAKEVEHAVSEFIKYEISF-NVYMFHGGTNFGFMNGATYFGKHSGIVTSYDYDAVLTEAG 376 



Query 522 GKLAGSGHGKQKISLDIPINLVTGTNTIDL----------LSVTV---GLANYGAFFDLV 568 

G+L H ++ LD + + N DL L + V G N+ 

Sbjct 465 GRLRAHAHDMAQVFLDETMIGILNENNKDLHIPELRDCRYLRILVENQGRVNFSWQIQNE 524 

Query 569 GAGITGPVTLKSAKGGSSIDLASQQWTYQVGLKGEDTGLATVDSSEWVSKSPLP-TKQPL 627 

GITG V SI+ +S + L+ + + + S+ W P+P + Q 

Sbjct 525 QKGITGSV---------SINNSSLEGFTIYSLEMKMSFFERLRSATW---KPVPDSHQGP 572 

Query 628 IWYKTTFDAPSGSEPVAIDFTGTGKGIAWVNGQSIGRYWPTSIAGNGGCTESCDYRGSYR 687 

+Y T A + + G ++NG+++GRYW 

Sbjct 573 AFYCGTLKAGPSPKDTFLSLLNWNYGFVFINGRNLGRYW--------------------- 611 

Query 688 ANKCLKNCGKPSQTLYHVPRSWLKPSGNILVLFEEM 723 

N G P +TLY +P WL P N ++LFE+M 

Sbjct 612 ------NIG-PQKTLY-LPGVWLHPEDNEVILFEKM 639 

>AT2G28620 

MDSNNSKKGSSVKSPCQTPRSTEKSNRDFRVDSNSNSNPVSKNEKEKGVNIQVIVRCRPFNSEETRLQTPAVLTCNDRKKEVAVAQNIAGKQIDKTFLFD 

KVFGPTSQQKDLYHQAVSPIVFEVLDGYNCTIFAYGQTGTGKTYTMEGGARKKNGEIPSDAGVIPRAVKQIFDILEAQSAAEYSLKVSFLELYNEELTDL 

LAPEETKFADDKSKKPLALMEDGKGGVFVRGLEEEIVSTADEIYKVLEKGSAKRRTAETLLNKQSSRSHSIFSVTIHIKECTPEGEEIVKSGKLNLVDLA 

GSENISRSGAREGRAREAGEINKSLLTLGRVINALVEHSGHIPYRESKLTRLLRDSLGGKTKTCVIATVSPSVHCLEETLSTLDYAHRAKHIKNKPEVNQ 

KMMKSAIMKDLYSEIERLKQEVYAAREKNGIYIPKERYTQEEAEKKAMADKIEQMEVEGEAKDKQIIDLQELYNSEQLVTAGLREKLDKTEKKLYETEQA 

LLDLEEKHRQAVATIKEKEYLISNLLKSEKTLVDRAVELQAELANAASDVSNLFAKIGRKDKIEDSNRSLIQDFQSQLLRQLELLNNSVAGSVSQQEKQL 

QDMENVMVSFVSAKTKATETLRGSLAQLKEKYNTGIKSLDDIAGNLDKDSQSTLNDLNSEVTKHSCALEDMFKGFTSEAYTLLEGLQGSLHNQEEKLSAF 

TQQQRDLHSRSMDSAKSVSTVMLDFFKTLDTHANKLTKLAEDAQNVNEQKLSAFTKKFEESIANEEKQMLEKVAELLASSNARKKELVQIAVQDIRQGSS 

SQTGALQQEMSAMQDSASSIKVQWNSHIVQAESHHLDNISAVEVAKEDMQKMHLKCLENSKTGTQQWKTAQESLVDLEKRNVATADSIIRGAIENNEKLR 

TQFSSAVSTTLSDVDSSNREIISSIDNSLQLDKDASTDVNSTIVPCSENLKELRTHHDDNVVEIKQNTGKCLGHEYKVTRFDPFLYNHHIYMIELDKIVN 

RKLNSLKTSTQVDEATSSTPRKREYNIPTVGSIEELKTPSFEELLKAFHDCKSPKQMQNGEAKHVSNGRPPLTAIN 

GENE ID: 3832 KIF11 | kinesin family member 11 [Homo sapiens] 




Query 35 SNSNPVSKNEKEKGVNIQVIVRCRPFNSEETRLQTPAVLTCNDRKKEVAV-AQNIAGKQI 93 

S N +K ++EKG NIQV+VRCRPFN E + +++ C+ +KEV+V +A K 

Sbjct 3 SQPNSSAKKKEEKGKNIQVVVRCRPFNLAERKASAHSIVECDPVRKEVSVRTGGLADKSS 62 

Query 94 DKTFLFDKVFGPTSQQKDLYHQAVSPIVFEVLDGYNCTIFAYGQTGTGKTYTMEGGARKK 153 

KT+ FD VFG +++Q D+Y V PI+ EV+ GYNCTIFAYGQTGTGKT+TMEG R 

Sbjct 63 RKTYTFDMVFGASTKQIDVYRSVVCPILDEVIMGYNCTIFAYGQTGTGKTFTMEG-ERSP 121 

Query 154 NGEIPSD----AGVIPRAVKQIFDILEAQSAAEYSLKVSFLELYNEELTDLLAPEETKFA 209 

N E + AG+IPR + QIF+ L + E+S+KVS LE+YNEEL DLL P + 

Sbjct 122 NEEYTWEEDPLAGIIPRTLHQIFEKL-TDNGTEFSVKVSLLEIYNEELFDLLNP-----S 175

Query 210 DDKSKKPLALMED--GKGGVFVRGLEEEIVSTADEIYKVLEKGSAKRRTAETLLNKQSSR 267 

D S++ L + +D K GV ++GLEE V DE+Y++LEKG+AKR TA TL+N SSR 

Sbjct 176 SDVSER-LQMFDDPRNKRGVIIKGLEEITVHNKDEVYQILEKGAAKRTTAATLMNAYSSR 234 

Query 268 SHSIFSVTIHIKECTPEGEEIVKSGKLNLVDLAGSENISRSGAREGRAREAGEINKSLLT 327 

SHS+FSVTIH+KE T +GEE+VK GKLNLVDLAGSENI RSGA + RAREAG IN+SLLT 

Sbjct 235 SHSVFSVTIHMKETTIDGEELVKIGKLNLVDLAGSENIGRSGAVDKRAREAGNINQSLLT 294 

Query 328 LGRVINALVEHSGHIPYRESKLTRLLRDSLGGKTKTCVIATVSPSVHCLEETLSTLDYAH 387 

LGRVI ALVE + H+PYRESKLTR+L+DSLGG+T+T +IAT+SP+ LEETLSTL+YAH 

Sbjct 295 LGRVITALVERTPHVPYRESKLTRILQDSLGGRTRTSIIATISPASLNLEETLSTLEYAH 354 

Query 388 RAKHIKNKPEVNQKMMKSAIMKDLYSEIERLKQEVYAAREKNGIYIPKERYTQEEAEKKA 447 

RAK+I NKPEVNQK+ K A++K+ EIERLK+++ AAREKNG+YI +E + + 

Sbjct 355 RAKNILNKPEVNQKLTKKALIKEYTEEIERLKRDLAAAREKNGVYISEENF-------RV 407 

Query 448 MADKIEQMEVEGEAKDKQIIDL--------QELYNSEQLVTAGLREKLDKTEKKLYETEQ 499 

M+ K+ +++QI++L +EL +L + +LD+ + L Q 

Sbjct 408 MSGKL-------TVQEEQIVELIEKIGAVEEELNRVTELFMDN-KNELDQCKSDLQNKTQ 459 

Query 500 ALLDLEEKHRQ--AVATIKEKEYLISNLLKSEKTLVDRAVELQAELANAASDVSNLFAKI 557 

L+ +KH Q + +KE EY+ S L +E+ L D A +L + DVS L +K+ 

Sbjct 460 E-LETTQKHLQETKLQLVKE-EYITSALESTEEKLHDAASKLLNTVEETTKDVSGLHSKL 517 

Query 558 GRKDKIEDSNRSLIQDFQSQLLRQL-----ELLNNSVAGSVSQQEKQLQDMENVMVSFVS 612 

RK + D + + QD + L L EL+ + + + E N++ S VS 

Sbjct 518 DRKKAV-DQHNAEAQDIFGKNLNSLFNNMEELIKDGSSKQKAMLEVHKTLFGNLLSSSVS 576 

Query 613 AKTKATETLRGSLAQLKEKYNTGIKSL 639 

A T GSL + E +T + + 

Sbjct 577 ALDTITTVALGSLTSIPENVSTHVSQI 603 

>AT2G31320 

MASPHKPWRAEYAKSSRSSCKTCKSVINKENFRLGKLVQSTHFDGIMPMWNHASCILKKTKQIKSVDDVEGIESLRWEDQQKIRKYVESGAGSNTSTSTG 

TSTSSTANNAKLEYGIEVSQTSRAGCRKCSEKILKGEVRIFSKPEGPGNKGLMWHHAKCFLEMSSSTELESLSGWRSIPDSDQEALLPLVKKALPAAKTE 

TAEARQTNSRAGTKRKNDSVDNEKSKLAKSSFDMSTSGALQPCSKEKEMEAQTKELWDLKDDLKKYVTSAELREMLEVNEQSTRGSELDLRDKCADGMMF 

GPLALCPMCSGHLSFSGGLYRCHGYISEWSKCSHSTLDPDRIKGKWKIPDETENQFLLKWNKSQKSVKPKRILRPVLSGETSQGQGSKDATDSSRSERLA 

DLKVSIAGNTKERQPWKKRIEEAGAEFHANVKKGTSCLVVCGLTDIRDAEMRKARRMKVAIVREDYLVDCFKKQRKLPFDKYKIEDTSESLVTVKVKGRS 

AVHEASGLQEHCHILEDGNSIYNTTLSMSDLSTGINSYYILQIIQEDKGSDCYVFRKWGRVGNEKIGGNKVEEMSKSDAVHEFKRLFLEKTGNTWESWEQ 

KTNFQKQPGKFLPLDIDYGVNKQVAKKEPFQTSSNLAPSLIELMKMLFDVETYRSAMMEFEINMSEMPLGKLSKHNIQKGFEALTEIQRLLTESDPQPTM 

KESLLVDASNRFFTMIPSIHPHIIRDEDDFKSKVKMLEALQDIEIASRIVGFDVDSTESLDDKYKKLHCDISPLPHDSEDYRLIEKYLNTTHAPTHTEWS 

LELEEVFALEREGEFDKYAPHREKLGNKMLLWHGSRLTNFVGILNQGLRIAPPEAPATGYMFGKGIYFADLVSKSAQYCYTCKKNPVGLMLLSEVALGEI 

HELTKAKYMDKPPRGKHSTKGLGKKVPQDSEFAKWRGDVTVPCGKPVSSKVKASELMYNEYIVYDTAQVKLQFLLKVRFKHKR 

GENE ID: 142 PARP1 | poly (ADP-ribose) polymerase 1 [Homo sapiens] 




Query 3 SPHKPWRAEYAKSSRSSCKTCKSVINKENFRLGKLVQSTHFDGIMPMWNHASCILKKTKQ 62 

S K +R EYAKS R+SCK C I K++ R+ +VQS FDG +P W H SC K 

Sbjct 4 SSDKLYRVEYAKSGRASCKKCSESIPKDSLRMAIMVQSPMFDGKVPHWYHFSCFWKVGHS 63 

Query 63 IKSVD-DVEGIESLRWEDQQKIRKYVESGAGSNTSTSTGTSTSSTANNAKLEYGIEVSQT 121 

I+ D +V+G LRW+DQQK++K E+G + S A ++ E +++ 

Sbjct 64 IRHPDVEVDGFSELRWDDQQKVKKTAEAGGVTGKGQD---GIGSKAEKTLGDFAAEYAKS 120 

Query 122 SRAGCRKCSEKILKGEVRIFSK---PEGPGNKGLM--WHHAKCFL----EMSSSTELES- 171 

+R+ C+ C EKI KG+VR+ K PE P G++ W+H CF+ E+ E + 

Sbjct 121 NRSTCKGCMEKIEKGQVRLSKKMVDPEKP-QLGMIDRWYHPGCFVKNREELGFRPEYSAS 179 

Query 172 -LSGWRSIPDSDQEALLPLVKKALPAAKTETAEARQTNSRAGTKRKNDSVDNEKSKLAKS 230 

L G+ + D+EAL KK LP K+E KRK D VD + + 

Sbjct 180 QLKGFSLLATEDKEAL----KKQLPGVKSEG------------KRKGDEVDG----VDEV 219 

Query 231 SFDMSTSGALQPCSKEKEMEAQTKELWDLKDDLKKYVTSAELREMLEVNEQSTRGSELDL 290 

+ S + EK ++AQ +W++KD+LKK ++ +L+E+L N+Q E + 

Sbjct 220 AKKKSKKEKDKDSKLEKALKAQNDLIWNIKDELKKVCSTNDLKELLIFNKQQVPSGESAI 279 

Query 291 RDKCADGMMFGPLALCPMCSGHLSFSGGLYRCHGYISEWSKCSHSTLDPDRIKGKWKIPD 350 

D+ ADGM+FG L C CSG L F Y C G ++ W+KC T P+R +W P 

Sbjct 280 LDRVADGMVFGALLPCEECSGQLVFKSDAYYCTGDVTAWTKCMVKTQTPNR--KEWVTPK 337 

Query 351 E-TENQFLLKWN-KSQKSVKPKRILRPVLSGETSQGQGSKDATDSSRS--ERLADLKVSI 406 

E E +L K K Q + P V + + A +SS S + L+++K+ 

Sbjct 338 EFREISYLKKLKVKKQDRIFPPETSASVAATPPPSTASAPAAVNSSASADKPLSNMKILT 397 

Query 407 AGN-TKERQPWKKRIEEAGAEFHANVKKGTSCLVVCGLTDIRDAEMRKARRMKVAIVRED 465 

G ++ + K IE+ G + K + C+ + + +M + + + +V ED 

Sbjct 398 LGKLSRNKDEVKAMIEKLGGKLTGTANKASLCISTKKEVEKMNKKMEEVKEANIRVVSED 457 

Query 466 YLVDCFKKQRKL-------------------PFD--------------------KYKIED 486 

+L D + L P + K + + 

Sbjct 458 FLQDVSASTKSLQELFLAHILSPWGAEVKAEPVEVVAPRGKSGAALSKKSKGQVKEEGIN 517 

Query 487 TSESLVTVKVKGRSAVHEASGLQEHCHILEDGNSIYNTTLSMSDLSTGINSYYILQIIQE 546 

SE + + +KG +AV SGL+ H+LE G +++ TL + D+ G NSYY LQ++++ 

Sbjct 518 KSEKRMKLTLKGGAAVDPDSGLEHSAHVLEKGGKVFSATLGLVDIVKGTNSYYKLQLLED 577 

Query 547 DKGSDCYVFRKWGRVGNEKIGGNKVEEM-SKSDAVHEFKRLFLEKTGNTWESWEQKTNFQ 605 

DK + ++FR WGRVG IG NK+E+M SK DA+ F +L+ EKTGN W S NF 

Sbjct 578 DKENRYWIFRSWGRVGTV-IGSNKLEQMPSKEDAIEHFMKLYEEKTGNAWHS----KNFT 632 

Query 606 KQPGKFLPLDIDYGVNKQVAKKEPFQ--TSSNLAPSLIELMKMLFDVETYRSAMMEFEIN 663 

K P KF PL+IDYG +++ KK T S L + +L+KM+FDVE+ + AM+E+EI+ 

Sbjct 633 KYPKKFYPLEIDYGQDEEAVKKLTVNPGTKSKLPKPVQDLIKMIFDVESMKKAMVEYEID 692 

Query 664 MSEMPLGKLSKHNIQKGFEALTEIQRLLTESDPQPTMKESLLVDASNRFFTMIPSIH--- 720 

+ +MPLGKLSK IQ + L+E+Q+ +++ +S ++D SNRF+T+IP 

Sbjct 693 LQKMPLGKLSKRQIQAAYSILSEVQQAVSQGS-----SDSQILDLSNRFYTLIPHDFGMK 747 

Query 721 -PHIIRDEDDFKSKVKMLEALQDIEIASRIV--GFDVDSTESLDDKYKKLHCDISPLPHD 777

P ++ + D ++KV+ML+ L DIE+A ++ G D S + +D Y+KL DI + D 

Sbjct 748 KPPLLNNADSVQAKVEMLDNLLDIEVAYSLLRGGSDDSSKDPIDVNYEKLKTDIKVVDRD 807 

Query 778 SEDYRLIEKYLNTTHAPTHTEWSLELEEVFALEREGEFDKYAPHREKLGNKMLLWHGSRL 837 

SE+ +I KY+ THA TH + LE+ ++F +EREGE +Y P ++ L N+ LLWHGSR 

Sbjct 808 SEEAEIIRKYVKNTHATTHNAYDLEVIDIFKIEREGECQRYKPFKQ-LHNRRLLWHGSRT 866 

Query 838 TNFVGILNQGLRIAPPEAPATGYMFGKGIYFADLVSKSAQYCYTCKKNPVGLMLLSEVAL 897 

TNF GIL+QGLRIAPPEAP TGYMFGKGIYFAD+VSKSA YC+T + +P+GL+LL EVAL 

Sbjct 867 TNFAGILSQGLRIAPPEAPVTGYMFGKGIYFADMVSKSANYCHTSQGDPIGLILLGEVAL 926 

Query 898 GEIHELTKAKYMDKPPRGKHSTKGLGKKVPQDSEFAKWRGDVTVPCGKPVSSKVKASELM 957 

G ++EL A ++ K P+GKHS KGLGK P S G V VP G +SS V + L+ 

Sbjct 927 GNMYELKHASHISKLPKGKHSVKGLGKTTPDPSANISLDG-VDVPLGTGISSGVNDTSLL 985 

Query 958 YNEYIVYDTAQVKLQFLLKVRFKHK 982 

YNEYIVYD AQV L++LLK++F K 

Sbjct 986 YNEYIVYDIAQVNLKYLLKLKFNFK 1010 

>AT2G35630 

MSTEDEKLLKEAKKLPWEDRLGHKNWKVRNEANVDLASVFDSITDPKDPRLRDFGHLFRKTVADSNAPVQEKALDALIAFLRAADSDAGRYAKEVCDAIA 

LKCLTGRKNTVDKAQAAFLLWVELEAVDVFLDTMEKAIKNKVAKAVVPAVDVMFQALSEFGSKVIPPKRILKMLPELFDHQDQNVRASAKGVTLELCRWI 

GKDPVKSILFEKMRDTMKKELEAELANVTAGAKPTRKIRSEQDKEPEAEASSDVVGDGPSEEAVADAPQEIDEYDLMDPVDILTPLEKSGFWDGVKATKW 

SERKEAVAELTKLASTKKIAPGDFSEICRTLKKLITDVNLAVAVEAIQAIGNLACGLRTHFSASSRFMLPVLLEKLKEKKQSVTDPLTQTLQTMYKAGCL 

NLVDVIEDVKTAVKNKVPLVRSSTLTWLTFCLETSNKALILKAHKEYVPLCMECLNDGTPDVRDAAFSALAAIAKSVGMRPLERSLEKLDDVRKKKLSEM 

IAGSGGGDQAGTSSVTVQSSVGSTATGNSDASFVRKSAASMLSGKRPAPSAQASKKVGTGKPGGGKKDGSVRNEGSKSVEPPEDVEPAEMGLEEIENRLG 

SLVKPETVSQLKSSVWKERLEATLALKEEIEGLQELDKSVEILVRLLCAVPGWNEKNVQVQQQVIEIITYISSTAAKFPKKCVVLCITGTSERVADIKTR 

ASAMKCLTAFCEAVGPGFVFERLFKIMKEHKNPKVLSEGLLWMVSAVDDFGVSLLKLKDLIDFCKDVGLQSSTAATRNATIKLLGALHKFVGPDIKGFLN 

DVKPALLSALDTEYEKNPFEGTAAPKRVVKTSVSTSTSSGGLDSLPREDISTKITPNLLKGFESPDWKMRLESIEAVNKILEEANKRIQPTGTGELFGGL 

RGRLLDSNKNLVMQTLTTIGGVAAAMGPAVEKASKGILSDVLKCLGDNKKHMRECTLAALDLWLGAVHLDKMIPYIIIALTDGKMGAEGRKDLFDWLTKQ 

LTGLSDFVDAIHLLKPASTAMTDKSADVRKAAEGCISEILRVSGQEMIEKNLKDIQGPALALVLEKVRPGFVQEPFESSKAMAGPVSKGVTKISKSTSNG 

TLKQGNRSRAVPTKGSSQITSVHDIAIQSQALLNTKDSNKEDRERVVVRRIKFEELRPEQIQDLENDMMKFFREDLQKRLLSPDFKKQVDGLEILQKALP 

SVSKEIIEVLDVLLRWFVLQFCKSNTTCLLKVLEFLPELFNTLRDEEYCMTEAEAAIFLPCLAEKLGHNIEKVREKMRELMKQIIQAYSVGKTYPYILEG 

LRSKNNRTRIECTDLIGYLLETCGTEIGGLLKYLNIVASLTAERDGELRKAALNTMATGYQILGADIWKYVGKLTDAQKSMIDDRFKWKAKDMEKRREGK 

PGEARAALRRSVRDSGPEVAEQSGDISQTVPGPLFPRQSYGISEQMLERTPVPRTIAGVNGPTDWNEALDIIMFGSPEQSVEGMKVVCHELAQASNDPEE 

SAIDELVKDADGLVSCLANKVAKTFDVSLMGASSRSCKYVLNTLMQTFQNKKLAHAVKEGTLESLITELLLWLLDERVPRMEDGSQLLKALNVLMLKILD 

NADRTSSFVVLISLLRPLDPSRWPSPATAEVYAVRNQKFSDLVVKCLIKLTKLLQSTIYEVDLDRLLQSIHVYLQDLGMEEIRRRAGADDKPLRMVKTVL 

HELVKLRGAAIKGHLSLVPIDMRPQPIILAYIDLNLETLAAARMLTATGPVGQTHWTDSTANNPSPPANSADVQLKQELGAIFKKIGDKQTSTIGLYDLY 

HITKSYPKVDIFSQLQNASEAFRTYIRDGLAQVEKNAAAGRTPSSLPLSTPPPSSLALPSPDIPSLSSLDVKPLMNPRSDLYTDDIRASNMNPGVMTGTL 

DAIRERMKNMQLASSEPVSKPLMPTNDNLSMNQQSVPPSQMGQETVHTHPVVLPMDEKALSGLQARMERLKGGSLEHM 

GENE ID: 9793 CKAP5 | cytoskeleton associated protein 5 [Homo sapiens] 




Query 14 KLPWEDRLGHKNWKVRNEANVDLASVFDSITDPKDPRLRDFGHLFRKTVADSNAPVQEKA 73 

KLP + + HK WK R + +F I D K P F L +K V DSNA VQ K 

Sbjct 9 KLPVDQKCEHKLWKARLSGYEEALKIFQKIKDEKSPEWSKFLGLIKKFVTDSNAVVQLKG 68 

Query 74 LDALIAFLRAADSDAGRYAKEVCDAIALKCLTGRKNTVDKAQAAF-LLWVELEAVDVFLD 132 

L+A + ++ A AG+ EV + K K + L+++E+E + + 

Sbjct 69 LEAALVYVENAHV-AGKTTGEVVSGVVSKVFNQPKAKAKELGIEICLMYIEIEKGEAVQE 127 

Query 133 TMEKAIKNKVAKAVVPAVDVMFQALSEFGSKVIPPKRILKMLPELFDHQDQNVRASAKGV 192 

+ K + NK K +V ++ + +ALSEFGSK+I K I+K+LP+LF+ +++ VR AK + 

Sbjct 128 ELLKGLDNKNPKIIVACIETLRKALSEFGSKIILLKPIIKVLPKLFESREKAVRDEAKLI 187 

Query 193 TLELCRWIGKDPVKSILFEKMRDTMKKELEAELANV-TAGAKPTRKIRSEQDKEPEAEAS 251 

+E+ RWI +D ++ L + + KELE E + T+ +PTR +RS+Q+ E + E 

Sbjct 188 AVEIYRWI-RDALRPPL-QNINSVQLKELEEEWVKLPTSAPRPTRFLRSQQELEAKLEQQ 245 

Query 252 SDVVGDGPSEEAVADAPQEIDEYDLMDPVDILTPLEKSGFWDGVKATKWSERKEAVAELT 311 

GD D +ID Y+L++ V+IL+ L K F+D ++A KW ERKEA+ + 

Sbjct 246 QSAGGDAEGGGDDGDEVPQIDAYELLEAVEILSKLPKD-FYDKIEAKKWQERKEALESVE 304 

Query 312 KLASTKKIAPGDFSEICRTLKKLI-TDVNLAVAVEAIQAIGNLACGLRTHFSASSRFMLP 370 

L K+ GD++++ + LKK++ D N+ + A + + LA GLR F + ++P 

Sbjct 305 VLIKNPKLEAGDYADLVKALKKVVGKDTNVMLVALAAKCLTGLAVGLRKKFGQYAGHVVP 364 

Query 371 VLLEKLKEKKQSVTDPLTQTLQTMYKAGCLNLVDVIEDVKTAVKNKVPLVRSSTLTWLTF 430 

+LEK KEKK V L + + ++ L ++ EDV + NK P ++ T ++ 

Sbjct 365 TILEKFKEKKPQVVQALQEAIDAIFLTTTLQ--NISEDVLAVMDNKNPTIKQQTSLFIAR 422 

Query 431 CLETSNKALILKAH-KEYVPLCMECLNDGTPDVRDAAFSALAAIAKSVGMRPLERSLEKL 489 

+ + K+ K + ++ +ND P+VRDAAF AL K VG + ++ L + 

Sbjct 423 SFRHCTASTLPKSLLKPFCAALLKHINDSAPEVRDAAFEALGTALKVVGEKAVKPFLADV 482 

Query 490 DDVRKKKLSE------MIAGSGGGDQAGTSSVTV--QSSVGSTATGNSDASFVRKSAASM 541 

D ++ K+ E +I G G A + S A G+ D + 

Sbjct 483 DKLKLDKIKECSEKVELIHGKKAGLAADKKEFKPLPGRTAASGAAGDKDTKDISAPKPGP 542 

Query 542 LSGKRPAPSAQASKKVGTGKPGGGKKDGSVRNEGSKSVEPPEDVEPAEMGLEEIENRLGS 601 

L + AP+A+A GKP G+ + K +E E VEP E+ +E E + + 

Sbjct 543 L---KKAPAAKAGGPPKKGKPAAPGGAGNTGTKNKKGLETKEIVEP-ELSIEVCEEKASA 598 

Query 602 LVKPETVSQLKSSVWKERLEATLALKEEIEGLQELDKSVEILVRLLCAVPGWNEKNVQVQ 661 

++ P + L SS WKERL ++ +E + + + LVR+L PGW E N QV 

Sbjct 599 VLPPTCIQLLDSSNWKERLACMEEFQKAVELMDRTEMPCQALVRMLAKKPGWKETNFQVM 658 

Query 662 QQVIEIITYISSTAAKFPKKCVVLCITGTSERVADIKTRASAMKCLTAFCEAVGPGFVFE 721 

Q + I+ I+ F K + + G +++ D+K +A + +TA EA + E 

Sbjct 659 QMKLHIVALIAQKG-NFSKTSAQVVLDGLVDKIGDVKCGNNAKEAMTAIAEACMLPWTAE 717 

Query 722 RLFKIMKEHKNPKVLSEGLLWMVSAVDDFGVSLLKLKDLIDFCKDVGLQSSTAATRNATI 781 

++ + KNPK SE L W+ +A+ +FG S L +K I K L ++ A R A I 

Sbjct 718 QVVSMAFSQKNPKNQSETLNWLSNAIKEFGFSGLNVKAFISNVK-TALAATNPAVRTAAI 776 

Query 782 KLLGALHKFVGPDIKGFLNDVKPALLSALDTEYEKNPFEGTAAPKRVVKTSVSTSTSSGG 841 

LLG ++ +VGP ++ F D KPALLS +D E+EK + AP R + ++ T G 

Sbjct 777 TLLGVMYLYVGPSLRMFFEDEKPALLSQIDAEFEKMQGQSPPAPTRGISKHSTSGTDEGE 836

Query 842 ------------LDSLPREDISTKITPNLLKGFESPDWKMRLESIEAVNKILEEANKRIQ 889 

+D LPR +IS KIT L+ +WK+R E ++ V I+ +A K IQ 

Sbjct 837 DGDEPDDGSNDVVDLLPRTEISDKITSELVSKIGDKNWKIRKEGLDEVAGIINDA-KFIQ 895 

Query 890 PTGTGELFGGLRGRLLDSNKNLVMQTLTTIGGVAAAMGPAVEKASKGILSDVLKCLGDNK 949 

P GEL L+GRL DSNK LV QTL + +A AMGP +++ K + ++ LGD+K 

Sbjct 896 PN-IGELPTALKGRLNDSNKILVQQTLNILQQLAVAMGPNIKQHVKNLGIPIITVLGDSK 954 

Query 950 KHMRECTLAALDLWLGAVHLDKMIPYIIIALTDGKMGAEGRKDLFDWLTKQLTGL-SDFV 1008 

++R LA ++ W + + + ++ K R++L WL ++L L S 

Sbjct 955 NNVRAAALATVNAWAEQTGMKEWLEGEDLSEELKKENPFLRQELLGWLAEKLPTLRSTPT 1014 

Query 1009 DAIHLLKPASTAMTDKSADVRKAAEGCISEILRVSGQEMIEK---NLKDIQGPALALVLE 1065 

D I + + + D++ DVRK A+ + + G E + K LK + +LE 

Sbjct 1015 DLILCVPHLYSCLEDRNGDVRKKAQDALPFFMMHLGYEKMAKATGKLKPTSKDQVLAMLE 1074 

Query 1066 KVRPGFVQEPFESSKAMAGPVSKGVT---KISKSTSNGTLKQGNRSRAVPTKG-----SS 1117 

K + +P +KA + P+ + + + + + + P K SS 

Sbjct 1075 KAKVNMPAKPAPPTKATSKPMGGSAPAKFQPASAPAEDCISSSTEPKPDPKKAKAPGLSS 1134 

Query 1118 QITSVHDIAIQSQALL---------------NTKDSNKEDRERVVVRRIKFEELRPEQIQ 1162 

+ S + S+ L N K+ +D + + V + F R E I+ 

Sbjct 1135 KAKSAQGKKMPSKTSLKEDEDKSGPIFIVVPNGKEQRMKDEKGLKVLKWNFTTPRDEYIE 1194 

Query 1163 DLENDMMKFFREDLQKRLLSPDFKKQVDGLEILQKALPSVSKEIIEVLDVLLRWFVLQFC 1222 

L+ M + LQ + DF+ L ++ L S + +I LD++L+W L+F 

Sbjct 1195 QLKTQMSSCVAKWLQDEMFHSDFQHHNKALAVMVDHLESEKEGVIGCLDLILKWLTLRFF 1254 

Query 1223 KSNTTCLLKVLEFLPELFNTLRDEEYCMTEAEAAIFLPCLAEKLGHNIEKVREKMRELMK 1282 

+NT+ L+K LE+L LF L +EEY +TE EA+ F+P L K+G + +R+ +R ++ 

Sbjct 1255 DTNTSVLMKALEYLKLLFTLLSEEEYHLTENEASSFIPYLVVKVGEPKDVIRKDVRAILN 1314 

Query 1283 QIIQAYSVGKTYPYILEGLRSKNNRTRIECTDLIGYLLETCGTEIGGLL--KYLNIVASL 1340 

++ Y K +P+I+EG +SKN++ R EC + +G L+E+ G + K L +A 

Sbjct 1315 RMCLVYPASKMFPFIMEGTKSKNSKQRAECLEELGCLVESYGMNVCQPTPGKALKEIAVH 1374 

Query 1341 TAERDGELRKAALNTMATGYQILGADIWKYVGKLTDAQKSMIDDRFKWKAKDME----KR 1396 

+RD +R AALNT+ T Y + G ++K +G L++ SM+++R K AK K+ 

Sbjct 1375 IGDRDNAVRNAALNTIVTVYNVHGDQVFKLIGNLSEKDMSMLEERIKRSAKRPSAAPIKQ 1434 

Query 1397 REGKPGEAR-AALRRSVRDSGPEVAEQSGDISQTVPGPLFPRQSYGISE--QMLERTPVP 1453 

E KP A+ + ++ GP + S ++Q R G E QM+ R 

Sbjct 1435 VEEKPQRAQNISSNANMLRKGP-AEDMSSKLNQA-------RSMSGHPEAAQMVRR---- 1482 

Query 1454 RTIAGVNGPTDWNEALDIIMFGSPEQSVEGMKVVCHELAQASN-----DPEESAIDELVK 1508 

++ LD I + E ++V H+L +P+ A+ 

Sbjct 1483 ----------EFQLDLDEIENDNGTVRCEMPELVQHKLDDIFEPVLIPEPKIRAVSPHFD 1532 

Query 1509 DADGLVSCLANKVAKTFDVSLMGASSRSCKYVLNTLMQTFQNKKLAHAVKEGTLESLITE 1568 

D + + A T + + +S + L Q FQ + LA G L+ L+ 

Sbjct 1533 D-------MHSNTASTINFIISQVASGDINTSIQALTQLFQIESLAREASTGVLKDLMHG 1585 

Query 1569 LLLWLLDERVPRMEDGSQLLKALNVLMLKILDNADRTSSFVVLISLLRPLDPSRWPSPAT 1628 

L+ +LD R+ +E+G Q+++++N+L++K+L+ +D+T+ L+ LL+ + SP 

Sbjct 1586 LITLMLDSRIEDLEEGQQVIRSVNLLVVKVLEKSDQTNILSALLVLLQDSLLATASSP-- 1643 

Query 1629 AEVYAVRNQKFSDLVVKCLIKLTKLLQSTIYEVDLDRLLQSIHVYLQDLGMEEIRRRAGA 1688 

KFS+LV+KCL ++ +LL TI ++LDR+L IH++++ E++++ 

Sbjct 1644 ---------KFSELVMKCLWRMVRLLPDTINSINLDRILLDIHIFMKVFPKEKLKQ--CK 1692 

Query 1689 DDKPLRMVKTVLHELVKLRGAAIKGHLSLVPIDMRPQPIILAYIDLNLETLAAARMLTAT 1748 

+ P+R +KT+LH L KL+G I HL++ ID + + + A++ RM+ + 

Sbjct 1693 SEFPIRTLKTLLHTLCKLKGPKILDHLTM--IDNKNESELEAHL---------CRMMKHS 1741 

Query 1749 GPVGQTHWTDSTANNPSP-PANSADVQLKQELGAIFKKIGDKQTSTIGLYDLYHITKSYP 1807 

+ TA S A S+ ++ L IFKKIG K+ + GL +LY K Y 

Sbjct 1742 MDQTGSKSDKETAKGASRIDAKSSKAKVNDFLAEIFKKIGSKENTKEGLAELYEYKKKYS 1801 

Query 1808 KVDIFSQLQNASEAFRTYIRDGLAQVE-KNAAAGRTPSSLPLSTPPPSSLALPSPDIPSL 1866 

DI L+N+S+ F++Y+ GL +E + GR +S +S P +P+P ++ 

Sbjct 1802 DADIEPFLKNSSQFFQSYVERGLRVIEMEREGKGRISTSTGIS-PQMEVTCVPTP-TSTV 1859 

Query 1867 SSLDVKPLMNPRSDLYTDDIRASNMNPGVMTGTLDAIRER--MKNMQLASSEP----VSK 1920 

SS+ + + P V L +R+R + N + P +SK 

Sbjct 1860 SSI--------------GNTNGEEVGPSVYLERLKILRQRCGLDNTKQDDRPPLTSLLSK 1905 

Query 1921 PLMPT 1925 

P +PT 

Sbjct 1906 PAVPT 1910 

>AT2G36090 

MANSSSFSPSTTVTDLISTVHDDIIESHILTRLDGATLASVSCASSHLHHLASNEILWSKICRSTWPSCSGGSRSFFSDAYSMVETAGTVSDLDRPFPEL 

ISAVDLHYRGKLIFSRVVKTETTTAWFKSSPLRIDLVDTKDTVATPIKRRQRTEDTCRDLEKDLTLSWIVIDPIGKRAANISSHRPVSVQRNWISGEVEA 

QFATVVGAVECVITVVTCGEEEMHVREVSLKVEKMEGTHLNGRDSLVILRSVMEGKRVNGSRREVESKKRHEEFMEKKREMKEKKMRVESVFDILTVAFG 

ILGFVLLVVFCLWRTSI 

GENE ID: 26269 FBXO8 | F-box protein 8 [Homo sapiens] 




Query 29 ILTRLDGATLASVSCASSHLHHLASNEILWSKICRSTWPSCS 70 

IL+ L+ L SC LA++E+LW +C+STW CS 

Sbjct 82 ILSYLNATDLCLASCV---WQDLANDELLWQGLCKSTWGHCS 120 

>AT2G37660 

MAMMTTTTTTFFHPLLPANTYKSGAVASSFVSVPRSSSLQFRSLVSDSTSICGPSKFTGKNRRVSVTVSAAATTEPLTVLVTGAGGRTGQIVYKKLKERS 

EQFVARGLVRTKESKEKINGEDEVFIGDIRDTASIAPAVEGIDALVILTSAVPQMKPGFDPSKGGRPEFFFDDGAYPEQVDWIGQKNQIDAAKAAGVKQI 

VLVGSMGGTNINHPLNSIGNANILVWKRKAEQYLADSGIPYTIIRAGGLQDKDGGIRELLVGKDDELLETETRTIARADVAEVCVQALQLEEAKFKALDL 

ASKPEGTGTPTKDFKALFTQVTTKF 

GENE ID: 50814 NSDHL | NAD(P) dependent steroid dehydrogenase-like




Score = 433.5 


matrix 

adjust. 

Identitiess 


Query 55 

Sbjct 16 

Query 114 

Sbjct 69 

Query 173 

Sbjct 119 

>AT2G39730 Rubisco Activasse 

MAAAVSTVGAIINRAPLSLNGSGSGAVVSAPASTFLGKKVVTV 

VSRFAQSNKKSNGSFK FKVLAVKEDKQTDGDR RWRGLAYDTSDDQQDITRGKGMVDSVFQAPMM 

GTGTHHAVLSSSYEYVSQGLRQYNLDNNMMDGFYIAPAFMDKL 

LVVHITKNFLTLPNIKKVPLILGIWGGKGQG 

GKSFQCELVMAKMGIN NPIMMSAGELESGNAGG 

EPAKLIRQRYRREAADLIKKGKMCCLFFINDLDAGAGRMGGTT 

TQYTVNNQMVNATLMN MNIADNPTNVQLPGMY YNKEENARVPIICTGN NDFSTLYAPLIRDGRMM 

EKFYWAPTREDDRIGVCKGIFRTDKIKKDEDIVTLVDQFPGQS 

SIDFFGALRARVYDDE DEVRKFVESLGVEKIG GKRLVNSREGPPVFEQ QPEMTYEKLMEYGNMLL 

VMEQENVKRVQQLAETYLSQAALGDANNADAIGRGTFYGKGAQ 

QQVNLPVPEGCTDPVA VAENFDPTARSDDGTC CVYNF 

> GENE ID: 5706 PSMC6 | prroteasome 

(proso ome, macropain) 26S subunit, ATPase, A 6 




Score = 511.6 


matrix 

adjust. 

Identitiess 


Query 163 IWGGKGQGKSFQCEELVMAKMGINPIMMSA 

AGELESGNAGEPAKLIIRQRYREAADLIKKG 

GKM 222 

++G G GK+ V +++ N + + + + GE A+LIIR+ 

+ A D + 

Sbjct 172 LYGPPGTGKTLLARRAVASQLDCNFLKVVS 

SSSIVDKYIGESARLIIREMFNYARD----H 

HQP 227 

Query 223 

Sbjct 228 

Query 283 

Sbjct 278 

Query 337 

Sbjct 338 

>AT2G45990 

MGDLYALDFDGGVLCDSCGESSLSAVKKAAKVRWPDLFEGVDS 

SALEEWIVDQMHIVRP RPVVETGYENLLLVRL LLLETKIPSIRKSSVA AEGLTVDGILESWAKFF 

KPVIMEAWDEDDRDALVDLFGKVRDDWWINKDLTTWIGANRFY 

YPGVSDALKFASSKIYYIVTTKQGRFAEALL 

LREIAGVIIPSERIYG GLGSGPKVEVLKLLQDD 

KPEHQGLTLHFFVEDRLATLKNVIKEPPELDKWSLYLGTWGYN 

NTEKERAEAAGIPRIQQVIELSTFSNKLK 

GENE ID: 855459 

KIAA1731 | KIAA1731 [Homo sapiens] (10 orr 

fewer PubMed links) 

Score = 333.9 

bits (76), Expect = 0.56, Method: Composiitional 

matrix adjust. 

Identitiess 


= 7/72 (9%) 

Query 44 

Sbjct 595 

Query 102 PV-IMEAWDEDR 112 

P I E WD+D+ 

Sbjct 651 PTAISEHWDQDK 662 

>AT3G04290 

MNINCSPLGFLLISLFFIVTFLAPQVKKSRAFFVFGDSLVDNG 

GNNDYLVTTARADNYP YPYGIDYPTRRPTGRF FSNGLNIPDIISEAIG GMPSTLPYLSPHLTGEE 

NLLVGANFASAAGIGILNDTGIQFVNIIIRISKQMEYFEQYQL 

LRVSALIGPEATQQLV LVNQALVLITLGGNDF FVNNYYLIPFSARSRQ QYALPDYVVYLISEYGG 

KILRKLYELGAARRVLVTGTGAMGCAPPAELAQHSRNGECYGA 

ALQTAAALFNPQLVDL DLIASVNAEIGQDVFV VAANAYQMNMDYLSNP PEQFGFVTSKVACCGQQ 

GPYNGIGLCTPPVSNLCPNRDLYAFWDDAFHPTEKANRIIVNQ 

QILTGSSKYMHPMNLS LSTAMLLDSSKI 

GENE ID: 255981 

DNAH1 | dynnein, 

axonemal, heavy chain 1 [ [Homo sapiens] 

(10 or feweer 


Score = 322.3 



Identitiess 


Query 222 

Sbjct 395 

Query 278 

Sbjct 453 

Query 336 

Sbjct 503 

SKFTGKNRRVSVTVVSAAATTEPLTVLVTG 

GAGGRTGQIVYKKLKE KERSEQFVARGL-VRTKE 

113 

+ T +V+ + + V G G GQ 

EQ +ARG V + 

THLTEDTPKVNADIIEKVNQNQAKRCTVIG 

GGSGFLGQ-------HHMVEQLLARGYAVNV 

VFD 68 

SKEKI-NGEDEVFIIGDIRDTASIAPAVEG 

GIDALVILTSAVPQMK MKPGFDPSKGGRPEFF FFD 172 

++ N + F+ +GD+ + PA++G G++ + A P P E F+ F 

IQQGFDNPQVRFFLLGDLCSRQDLYPALKG 

GVNT--VFHCASP--------PPSSNNKELF 

FY- 118 

DGAYPEQVDWIGQKKNQIDAAKAAGVKQIV 

VLVGS 205 

+V++IG KKN 

I+ K AGV++++ +L S 

------RVNYIGTKKNVIETCKEAGVQKLI 

ILTSS 145 

CCLFINDLDAGAGRRMGGTTQYTVNNQMVN 

NATLMNIADNPTNVQL QLPGMYNKEENARVPIIC 

282 

C +F++++DA GRR 

++ T ++ + TLM + + Q+ G + RV + I 

CIIFMDEIDAIGGRRR--FSEGTSADREIQ 

QRTLMELLN-----QM QMDGF---DTLHRVKM MIM 277 

TGNDFSTLYAPLIRRDGRMEKFYWA--PTR 

REDRIGVCK----GIFFRTDKIKDEDIVTLV 

VDQ 336 

N TL L+RR 

GR+++ P + R+ + K I + +I E IV L D 

ATNRPDTLDPALLRRPGRLDRKIHIDLPNE 

EQARLDILKIHAGPITTKHGEIDYEAIVKLSDG 

337 

FPGQSI 342 

F G + 

FNGADL 343 

EEWIVDQMHIVRPVVVETGYENLLLVRLLL 

LETKIPSIRKSSVAEGGLTVDGILE--SWAK 

KFK 101 

+ ++ Q + R VET + LL + +L L+ + PS+ A L D ++ SW + 

QHQLLQQNRLHRQSSVETARKQLLEYQTML 

LKGRCPSV----SAPSSLITDSVISVPSWKSER 

650 

MGCAPAE----LAQQHSRNGECYGALQTAA 

AALFNPQLVDLIASVN VNAEIGQDVFVAANAY YQM 277 

+ C P++ +++ + S + AL T P +++ ++S+ E+ D + N ++ 

VDCMPSDGQHVISEEQSLSKIKQWALSTPR 

RMRKGPSVLEHLSSLAAREVSLDYERSMN--KI 

452 

NMDYL--SNPEQFGGFVTSKVACCGQGPYN 

NGIGLCTPVSNLCPNR NRDLYAFWDAFHPTEK KAN 335 

N D++ S PE F +VT Q P G+ + P 

Y FW+ + 

NFDHVVSSKPETFSSYVTLPKKEEEQVPER 

RGL-VSVPK----------YHFWEQKEDFTF 

FVS 502 

RIIVNQILTGSSKYYMHPMNLSTAMLLDSS 

SKI 366 

+ +++T SK N TAM L S + 

LLTRPEVITALSKVVRAECNKVTAMSLFHS 

SSL 533 

>AT3G06340 

MSINRDEALRAAKDLAEGLMKKTDFTAAARKLAMKAQKMDSSL 

LENISRMIMVCDVHCA CAATEKLFGTEMDWYG GILQVEQIANDVIIKK KQYKRLALLLHPDKNKK 

LPGAESAFKLIIGEAQRILLDREKRTLLHDNKRKTWRKPAAPP 

PYKAQQMPNYHTQPHF HFRASVNTRNIFTELR RPEIRHPFQKAQAQPA AAFTHLKTFGTSCVFCC 

RVRYEYDRAHVVNKEVTCETCKKRFTAAFEEPLQSAPQAKGPS 

SQTTYCFPQQSKFPDQ DQRACSEPHKRPENPP PTVSSSKASFPMPGSTAKHNGKRKRKNVAECC 

SESSDSESSSEESEDDVNNDTTAAQDSSGSNGGEQPRRSVRSK 

KQKVSYNENLSDDDVD VDLVNDNGEGSGKNID DTEREKETEEEKQTNENHSSTESIDMNGKIEE 

VDQVETPSGASSDSEEDLSSGSAEKPNNLINYDDPDFNDFDKL 

LREKSCFQAGQIWAVY VYDEEEGMPRFYALIK KKVTTPDFMLRYVWFEVDQDQENETPNLPVSS 

VGKFVVGNIEEETNLCSIFSHFVYSTTTKIRTRKFTVFPKKGE 

EIWALFKNWDINCSAD ADSVSPMKYEYEFVEILSDHAEGATVSVGFL 

LSKVQGFNCVFCPMPKK 

DESNTCEIPPHHEFCRFSHSIPSFRLTTGTEGRGITKGWYELD 

DPAALPASVSQNLSGE GEEAAQDRDRQSPPSG GSAS 

> pdb| |2CTP|A Chaiin 

A, Solution Structure S 

Of J-DDomain 

From Hum man Dnaj Subfamily 

B Menber 122 

Length=78 

Score = 699.3 

bits (168), 

Expect = 1e-11 1, Method: Compoositional 

matrix 

adjust.


Query 63 GTEMDWYGILQVEQIANDVIIKKQYKRLALLLHPDKNKLPGAESAFKLIGEAQRILLDRE 122 

G+ D+Y IL V + A+D +KK Y+RLAL HPDKN PGA AFK IG A +L + E 

Sbjct 4 GSSGDYYEILGVSRGASDEDLKKAYRRLALKFHPDKNHAPGATEAFKAIGTAYAVLSNPE 63 

Query 123 KRTLHD 128 

KR +D 

Sbjct 64 KRKQYD 69 

>AT3G08580 

MVDQVQHPTIAQKAAGQFMRSSVSKDVQVGYQRPSMYQRHATYGNYSNAAFQFPPTSRMLATTASPVFVQTPGEKGFTNFALDFLMGGVSAAVSKTAAAP 

IERVKLLIQNQDEMIKAGRLSEPYKGIGDCFGRTIKDEGFGSLWRGNTANVIRYFPTQALNFAFKDYFKRLFNFKKDRDGYWKWFAGNLASGGAAGASSL 

LFVYSLDYARTRLANDAKAAKKGGGGRQFDGLVDVYRKTLKTDGIAGLYRGFNISCVGIIVYRGLYFGLYDSVKPVLLTGDLQDSFFASFALGWVITNGA 

GLASYPIDTVRRRMMMTSGEAVKYKSSLDAFKQILKNEGAKSLFKGAGANILRAVAGAGVLSGYDKLQLIVFGKKYGSGGA 

GENE ID: 291 SLC25A4 | solute carrier family 25 (mitochondrial carrier; adenine 

nucleotide translocator), member 4 [Homo sapiens] (Over 10 PubMed links) 



Query 79 NFALDFLMGGVSAAVSKTAAAPIERVKLLIQNQDEMIKAGRLSEPYKGIGDCFGRTIKDE 138 

+F DFL GGV+AAVSKTA APIERVKLL+Q Q K + YKGI DC R K++ 

Sbjct 7 SFLKDFLAGGVAAAVSKTAVAPIERVKLLLQVQHAS-KQISAEKQYKGIIDCVVRIPKEQ 65 

Query 139 GFGSLWRGNTANVIRYFPTQALNFAFKDYFKRLFNFKKDRDG-YWKWFAGNLASGGAAGA 197 

GF S WRGN ANVIRYFPTQALNFAFKD +K+LF DR +W++FAGNLASGGAAGA 

Sbjct 66 GFLSFWRGNLANVIRYFPTQALNFAFKDKYKQLFLGGVDRHKQFWRYFAGNLASGGAAGA 125 

Query 198 SSLLFVYSLDYARTRLANDAKAAKKGGGGRQFDGLVDVYRKTLKTDGIAGLYRGFNISCV 257 

+SL FVY LD+ARTRLA D KG R+F GL D K K+DG+ GLY+GFN+S 

Sbjct 126 TSLCFVYPLDFARTRLAAD---VGKGAAQREFHGLGDCIIKIFKSDGLRGLYQGFNVSVQ 182 

Query 258 GIIVYRGLYFGLYDSVKPVLLTGDLQDSFFASFALGWVITNGAGLASYPIDTVRRRMMMT 317 

GII+YR YFG+YD+ K +L F S+ + +T AGL SYP DTVRRRMMM 

Sbjct 183 GIIIYRAAYFGVYDTAKG-MLPDPKNVHIFVSWMIAQSVTAVAGLVSYPFDTVRRRMMMQ 241 

Query 318 SGEA---VKYKSSLDAFKQILKNEGAKSLFKGAGANILRAVAGAGVLSGYDKLQ 368 

SG + Y ++D +++I K+EGAK+ FKGA +N+LR + GA VL YD+++ 

Sbjct 242 SGRKGADIMYTGTVDCWRKIAKDEGAKAFFKGAWSNVLRGMGGAFVLVLYDEIK 295 

Transmembrane alpha helices (green) predicted by TmConsens prediction 

1 mvdqvqhpti aqkaagqfmr ssvskdvqvg yqrpsmyqrh atygnysnaa fqfpptsrml 

61 attaspvfvq tpgekgftnf ALDFLMGGVS AAVSKTAAAP Iervklliqn qdemikagrl 

121 sepykgigdc fgrtikdegf gslwrgntan viryfptqal nfafkdyfkr lfnfkkdrdg 

181 ywkwFAGNLA SGGAAGASSL LFVYSldyar trlandakaa kkggggrqfd glvdvyrktl 

241 ktdgiaGLYR GFNISCVGII VYRGLYFgly dsvkpvlltg dlqdSFFASF ALGWVITNGA 

301 GLASYpidtv rrrmmmtsge avkyksslda fkqilknega kslfkGAGAN ILRAVAGAGV 

361 LSGYDKlqli vfgkkygsgg a 

>AT3G11710 

MEGAADQTTKALSELAMDSSTTLNAAESSAGDGAGPRSKNALKKEQKMKQKEEEKRRKDEEKAEKAKQAPKASSQKAVAADDEEMDATQYYENRLKYLAA 

EKAKGENPYPHKFAVSMSIPKYIETYGSLNNGDHVENAEESLAGRIMSKRSSSSKLFFYDLHGDDFKVQVMADASKSGLDEAEFLKLHSNAKRGDIVGVI 

GFPGKTKRGELSIFPRSFILLSHCLHMMPRKADNVNAKKPEIWVPGQTRNPEAYVLKDQESRYRQRHLDMILNVEVRQIFRTRAKIISYVRRFLDNKNFL 

EVETPMMNMIAGGAAARPFVTHHNDLDMRLYMRIAPELYLKQLIVGGLERVYEIGKQFRNEGIDLTHNPEFTTCEFYMAFADYNDLMEMTEVMLSGMVKE 

LTGGYKIKYNANGYDKDPIEIDFTPPFRRIEMIGELEKVAKLNIPKDLASEEANKYLIDACARFDVKCPPPQTTARLLDKLVGEFLEPTCVNPTFIINQP 

EIMSPLAKWHRSKSGLTERFELFINKHELCNAYTELNDPVVQRQRFADQLKDRQSGDDEAMALDETFCNALEYGLAPTGGWGLGIDRLSMLLTDSLNIKE 

VLFFPAMRPPQEESAAAQAPLTEEKK 

GENE ID: 3735 KARS | lysyl-tRNA synthetase [Homo sapiens] 




Query 23 LNAAESSAGDGAGPR-SKNALKKEQKMKQKEEEKRRKDEEKAEK-----AKQAPKASSQK 76 

+ AAE DG+ P+ SKN LK+ K ++K EK K +E +EK A ++ 

Sbjct 4 VQAAEVKV-DGSEPKLSKNELKRRLKAEKKVAEKEAKQKELSEKQLSQATAAATNHTTDN 62 

Query 77 AVAADDEEMDATQYYENRLKYLAAEKAKGENPYPHKFAVSMSIPKYIETYGSLNNGDHVE 136 

V ++E +D QYY+ R + + K GE+PYPHKF V +S+ +I+ Y L GDH+ 

Sbjct 63 GVGPEEESVDPNQYYKIRSQAIHQLKVNGEDPYPHKFHVDISLTDFIQKYSHLQPGDHLT 122 

Query 137 NAEESLAGRIMSKRSSSSKLFFYDLHGDDFKVQVMADASKSGLDEAEFLKLHSNAKRGDI 196 

+ +AGRI +KR+S KL FYDL G+ K+QVMA+ S++ E EF+ +++ +RGDI 

Sbjct 123 DITLKVAGRIHAKRASGGKLIFYDLRGEGVKLQVMAN-SRNYKSEEEFIHINNKLRRGDI 181 

Query 197 VGVIGFPGKTKRGELSIFPRSFILLSHCLHMMPRKADNVNAKKPEIWVPGQTRNPEAYVL 256 

+GV G PGKTK+GELSI P LLS CLHM+P + L 

Sbjct 182 IGVQGNPGKTKKGELSIIPYEITLLSPCLHMLPHLH---------------------FGL 220 

Query 257 KDQESRYRQRHLDMILNVEVRQIFRTRAKIISYVRRFLDNKNFLEVETPMMNMIAGGAAA 316 

KD+E+RYRQR+LD+ILN VRQ F R+KII+Y+R FLD FLE+ETPMMN+I GGA A 

Sbjct 221 KDKETRYRQRYLDLILNDFVRQKFIIRSKIITYIRSFLDELGFLEIETPMMNIIPGGAVA 280 

Query 317 RPFVTHHNDLDMRLYMRIAPELYLKQLIVGGLERVYEIGKQFRNEGIDLTHNPEFTTCEF 376 

+PF+T+HN+LDM LYMRIAPELY K L+VGG++RVYEIG+QFRNEGIDLTHNPEFTTCEF 

Sbjct 281 KPFITYHNELDMNLYMRIAPELYHKMLVVGGIDRVYEIGRQFRNEGIDLTHNPEFTTCEF 340 

Query 377 YMAFADYNDLMEMTEVMLSGMVKELTGGYKIKYNANGYDKDPIEIDFTPPFRRIEMIGEL 436 

YMA+ADY+DLME+TE M+SGMVK +TG YK+ Y+ +G + ++DFTPPFRRI M+ EL 

Sbjct 341 YMAYADYHDLMEITEKMVSGMVKHITGSYKVTYHPDGPEGQAYDVDFTPPFRRINMVEEL 400 

Query 437 EKVAKLNIPKD--LASEEANKYLIDACARFDVKCPPPQTTARLLDKLVGEFLEPTCVNPT 494 

EK + +P+ +EE K L D C V+CPPP+TTARLLDKLVGEFLE TC+NPT 

Sbjct 401 EKALGMKLPETNLFETEETRKILDDICVAKAVECPPPRTTARLLDKLVGEFLEVTCINPT 460 

Query 495 FIINQPEIMSPLAKWHRSKSGLTERFELFINKHELCNAYTELNDPVVQRQRFADQLKDRQ 554 

FI + P+IMSPLAKWHRSK GLTERFELF+ K E+CNAYTELNDP+ QRQ F +Q K +

Sbjct 461 

Query 555 

Sbjct 521 

Query 615 

Sbjct 581 

>AT3G12780 

MASAAASSAFSSLLKSTGAVASSAGTRRARASLLPIPSTSVSA 

ARPLGFSATLDSRRFS FSLHVASKVESVRGKG GSRGVVSMAKKSVGDL LTSADLKGKKVFVRADD 

LNVPLDDNQTIITDDTRIRAAIPTIKYYLIENGAKVILSTHLG 

GRPKGVTPKFSLAPLV LVPRLSELLGIEVTKA ADDCIGPEVESLVASL LPEGGVLLLENVRFYKK 

EEEKNDPEFAKKKLASLADLYVNDAFGGTAHRAHASTEGVTKF 

FLKPSVAGFLLQKELD LDYLVGAVSNPKRPFA AAIVGGSKVSSKIGVIESLLEKCDILLLGGGG 

MIFTFYKAQGLLSVGSSLVEEDKLELAATELLAKAKAKGVSLL 

LLPTDVVVADKFAPDA DANSKIVPASGIEDGW WMGLDIGPDSIKTFNEALDTTQTVIWNGPMGG 

VFEMEKFAAGTTEAIANKLAELSEKGVVTTIIGGGDSVAAVEK 

KVGVAGVMSHISTGGG GGASLELLEGKVLPGV VIALDEAIPVTV 


PGK1 | phospphoglycerate 

kin nase 1 [Homo sappiens] 



Score = 3374 

bits (961), Expect = 2e-10 03, Method: Comp mpositional matr rix adjust. 

Identitiess 


Query 85 

Sbjct 9 

Query 144 

Sbjct 68 

Query 202 

Sbjct 128 

Query 247 

Sbjct 186 

Query 307 

Sbjct 246 

Query 365 

Sbjct 306 

Query 425 

Sbjct 366 

>AT3G16040 

MSSKQGGKLKPPLKQPKSGKKEYDEHDDMELMQKKKDEEKALK 

KELRAKASQKGSFGGS GSGLKKSGKK 

> gb|EEAW99900.1| 

hCGG1644435, 

isofor rm CRA_a [Homo ssapiens] 

Length=51 

Score = 322.3 



Identitiess 


= 13/64 (20%) 

Query 1 

Sbjct 1 

Query 61 

Sbjct 48 

>AT3G16640 

MLVYQDLLTGDDELLSDSFPYKEIENGGILWEVEGKWVTVGAV 

VDVNIGANPSAEEGGE GEDEGVDDSTQKVVDIVDTFRLQEQPTYDKK 

KGFIAYIKKYIKLLTPP 

KLSEEDQAVFKKKGIEGATKFLLPRLSSDFQFFVGEGMHDDST 

TLVFAYYKEGSTNPTF TFLYFAHGLKEVKC 

> gb|AAAQ01550.1| 

Length=172 


TPT1 | tumoor 

protein, tran nslationally-conntrolled 

1 [Hom mo sapiens] 



Score = 1108 


matrix 

adjust. 

Identitiess 


Query 1 

Sbjct 1 

Query 58 

Sbjct 60 

Query 118 

Sbjct 119 

>AT3G16890 

FICDHPQIMSPLAKKWHRSKEGLTERFELF 

FVMKKEICNAYTELND NDPMRQRQLFEEQAKA AKA 520 

SGDDEAMALDETFCCNALEYGLAPTGGWGL 

LGIDRLSMLLTDSLNI NIKEVLFFPAMRPPQEES 

614 

+GDDEAM +DE FCC 

ALEYGL PT GWG+ +GIDR++M LTDS NI NIKEVL FPAM+P + + 

AGDDEAMFIDENFCCTALEYGLPPTAGWGM 

MGIDRVAMFLTDSNNI NIKEVLLFPAMKPEDK KKE 580 

AAA 617 

A 

NVA 583 

LTSADLKGKKVFVRRADLNVPLDDNQTITD 

DDTRIRAAIPTIKYLIIENGAK-VILSTHLG 

GRP 143 

L D+KGK+V +RR 

D NVP+ +NQ IT+ ++ RI+AA+P+IK+ + ++NGAK V+L +HLG GRP 

LDKLDVKGKRVVMRRVDFNVPMKNNQ-ITN 

NNQRIKAAVPSIKFCLLDNGAKSVVLMSHLG 

GRP 67 

KGVT--PKFSLAPLLVPRLSELLGIEVTKA 

ADDCIGPEVESLVASLLPEGGVLLLENVRFY 

YKE 201 

GV K+SL P+ + L LLG +V DC+GPEVE A+ G V+LLEN+RF+ E 

DGVPMPDKYSLEPVVAVELKSLLGKDVLFL 

LKDCVGPEVEKACANP NPAAGSVILLENLRFH HVE 127 

EE-----------KKNDPE----FAKKLAS 

SLADLYVNDAFGTAHR HRAHASTEGVTKFLKP PSV 246 

EE K +P F L+ L D+YVNDAFGTAHR HRAH+S GV L 

EEGKGKDASGNKVKKAEPAKIEAFRASLSK 

KLGDVYVNDAFGTAHR HRAHSSMVGVN--LPQ QKA 185 

AGFLLQKELDYLVGGAVSNPKRPFAAIVGG 

GSKVSSKIGVIESLLEEKCDILLLGGGMIFTFY 

306 

GFL++KEL+Y A+ +P+RPF AI+GG G+KV+ KI +I ++L+ +K + +++GGGM FTF 

GGFLMKKELNYFAKKALESPERPFLAILGG 

GAKVADKIQLINNMLDDKVNEMIIGGGMAFTFL 

245 

KA-QGLSVGSSLVEEEDKLELATELLAKAK 

KAKGVSLLLPTDVVVA VADKFAPDANS-KIVP PAS 364 

K + +G+SL + +E+ ++ +L++KA+ + GV + LP D V AADKF 

+A + + AS 

KVLNNMEIGTSLFDDEEGAKIVKDLMSKAE 

EKNGVKITLPVDFVTAADKFDENAKTGQATV 

VAS 305 

GIEDGWMGLDIGPDDSIKTFNEALDTTQTV 

VIWNGPMGVFEMEKFA FAAGTEAIANKLAELSEK 

424 

GI GWMGLD GP+ +S K + EA+ + ++WNGP+GVFE + 

E FA GT+A+ +++ + + + 

GIPAGWMGLDCGPEESSKKYAEAVTRAKQI 

IVWNGPVGVFEWEAFA FARGTKALMDEVVKATSR 

365 

GVTTIIGGGDSVAAAVEKVGVAGVMSHIST 

TGGGASLELLEGKVLPPGVIAL 

473 

G TIIGGGD+ K +SH+ST TGGGASLELLEGKVLPPGV 

AL 

GCITIIGGGDTATCCCAKWNTEDKVSHVST 

TGGGASLELLEGKVLPPGVDAL 

414 

MSSKQGGKLKPLKQPPKSGKKEYDEHDMELM 

MQKKKDEEKALKELRA RAKASQKGSFGGSGLK KK 60 

MS +GGK +PLKQ K KE D+ D+ QK+ + E 

G+ G+K KK 

MSGHKGGKKQPLKQHHKEQAKEMDKEDVAFK 

KQKQTEAE--------------GALDTGGVK 

KK 47 

SGKK 64 

SGKK 

SGKK 51 

TCTP [Homo sapi iens] 

MLVYQDLLTGDELLLSDSFPYKEIENGILW 

WEVEGKWV--TVGAVD VDVN-IGANPSAEEGG GED 57 

M++Y+DL++ DE+ SD + +EI +G+ EVEGK V T G +DD 

+ IG N SAE G E 

MIIYRDLISHDEMFFSDIYKIREIADGLCL 

LEVEGKMVSRTEGNIDDDSLIGGNASAE-GP 

PEG 59 

EGVDDSTQKVVDIVVDTFRLQEQPTYDKKG 

GFIAYIKKYIKLLTPKKLSEEDQAVFKKGIEGA 

117 

EG + + VDIVV 

LQE ++ K+ + YIK Y+K + KKL 

E+ K + GA 

EGTESTVITGVDIVVMNHHLQET-SFTKEA 

AYKKYIKDYMKSIKGK GKLEEQRPERVKPFMTGA 

118 

T---KFLLPRLSDFFQFFVGEGMHDDSTLV 

VFAYYKEGSTNPTFLYYFAHGLKEVKC 

168 

K +L ++ +QFF+GE M+ D + Y+E P ++ +F GLK KC 

AEQIKHILANFKNYYQFFIGENMNPDGMVA 

ALLDYREDGVTPYMIFFFKDGLKMEKC 

172

MRGFASSASRIIATAAAASKSLNASTSSVNPKLSKTLNSSGKP 

PTNPLNQRYISQVIER ERKDWFLILNQEFTTH HRIGLNTRFVISVLQN NQDNPLHSLRFYLWVSS 

NFDPVYAKDQSSLKSVLGNALFRKGPLLLLSMELLKEIRDSGY 

YRISDELMCVLIGSWG WGRLGLAKYCNDVFAQ QISFLGMKPSTRLYNA AVIDALVKSNSLDLAYY 

LKFQQMRSDGCCKPDRFTYNILIHGVCCKKGVVDEAIRLVKQM 

MEQEGNRPNVFTYTILLIDGFLIAGRVDEAL 

LKQLEMMRVRKLNPNEATIRTFVHGIFRCLPP 

PCKAFEVLVGFFMEKDSNLQRVGYDAVVLYCLSNNSMAKETGQ 

QFLRKIGERGYIPDSSSTFNAAMSCLLKGHD 

DLVETCRIFDGFVSRG GVKPGFNGYLVLVQALL 

LNAQRFSEGDRRYLKQMGVDGLLSSVYYSYNAVIDCLCKARRI 

IENAAMFLTEMQDRGI GISPNLVTFNTFLSGY YSVRGDVKKVHGVLEK KLLVHGFKPDVITFSLL 

IINCLCRAKEIIKDAFDCFKEMLEWGIIEPNEITYNILIRSCC 

CSTGDTDRSVKLFAKM KMKENGLSPDLYAYNA ATIQSFCKMRKVKKAEELLKTMLRIGLKPDNN 

FTYSTLIKALSSESGRESEAREMFSSIIERHGCVPDSYTKRLV 

VEELDLRKSGLSRETV TVSAS 

> gb|AAAH26034.1| 

Length=531 

GENE ID: 110128 

LRPPRC | lleucine-rich 

PPR R-motif containiing 

[Homo sapiens] 



Score = 600.8 


matrix 

adjust. 

Identitiess 


Query 479 

Sbjct 146 

Query 539 

Sbjct 206 

Query 599 

Sbjct 266 

Score = 577.4 


matrix 

adjust. 

Identitiess 


Query 420 

Sbjct 157 

Query 480 

Sbjct 217 

Query 540 

Sbjct 277 

Score = 499.7 


matrix 

adjust. 

Identitiess 


Query 337 

Sbjct 140 

Query 393 

Sbjct 200 

Query 453 

Sbjct 260 

Score = 433.9 


matrix 

adjust. 

Identitiess 

= 76/405 (18%) ), Positives = 158/405 1 (39%), GGaps 

= 47/405 ( 11%) 

Query 162 

Sbjct 144 

Query 221 

Sbjct 203 

Query 281 

Sbjct 263 

Query 341 

Sbjct 323 

Query 400 

Sbjct 358 

Query 460 

Sbjct 406 

Query 520 

Sbjct 464 

Score = 366.6 

bits (83), Expect = 0.11, Method: Composiitional 

matrix adjust. 

Identitiess 


Query 533 

Sbjct 165 

LRPPRC protein [Homo sapiens] 

VHGVLEKLLVHGFKKPDVITFSLIINCLCR 

RAKEIKDAFDCFKEML MLEWGIEPNEITYNIL LIR 538 

H + + L G DV ++ ++ + + D +M M E I+PN +TY LI L 

AHRIWDTLQKLGAVVYDVSHYNALLKVYLQ 

QNEYKFSPTDFLAKME MEEANIQPNRVTYQRL LIA 205 

SCCSTGDTDRSVKLLFAKMKENGLSPDLYA 

AYNATIQSFCKMRKVK VKKAEELLKTMLRIGL LKP 598 

S C+ GD + + K+ + MK L ++A + + ++ + AE +L M G+ +P 

SYCNVGDIEGASKIILGFMKTKDLPVTEAV 

VFSALVTGHARAGDME MENAENILTVMRDAGIEP 

265 

DNFTYSTLIKALSEESGRESEAREMFSSIE 

ER 628 

TY L+ A +EE 

G ++ +E E+ 

GPDTYLALLNAYAEEKGDIDHVKQTLEKVE 

EK 295 

GLLSSVYSYNAVIDDCLCKARRIENAAMFL 

LTEMQDRGISPNLVTFFNTFLSGYSVRGDVK 

KKV 479 

G + V YNA++ + + FL L +M++ I PN VT+ + ++ Y GD++ 

GAVYDVSHYNALLKKVYLQNEYKFSPTDFL 

LAKMEEANIQPNRVTYYQRLIASYCNVGDIEGA 

216 

HGVLEKLLVHGFKPPDVITFSLIINCLCRA 

AKEIKDAFDCFKEMLEEWGIEPNEITYNILIRS 

539 

+L + 

FS ++ RA A ++++A + M + GIEP TY L+ + 

SKILGFMKTKDLPVVTEAVFSALVTGHARA 

AGDMENAENILTVMRD RDAGIEPGPDTYLALL LNA 276 

CCSTGDTDRSVKLFFAKMKENGL 

561 

GD D + K++++ L 

YAEKGDIDHVKQTLLEKVEKSEL 

298 

KETGQFLRKIGER-----GYIPDSSTFNAA 

AMSCLLKGHDLVETCRRIFDGFVSRGVKPGF 

FNG 392 

+E +F +I + G + D S +NA + L+ 

++P 

EERTEFAHRIWDTLLQKLGAVYDVSHYNAL 

LLKVYLQNEYKFSPTDDFLAKMEEANIQPNR 

RVT 199 

YLVLVQALLNAQRFFSEGDRYLKQMGVDGL 

LLSSVYSYNAVIDCLCCKARRIENAAMFLTEMQ 

452 

Y L+ + N + L M L + ++A++ +A +ENA LT M+ 

YQRLIASYCNVGDIIEGASKILGFMKTKDL 

LPVTEAVFSALVTGHA HARAGDMENAENILTV VMR 259 

DRGISPNLVTFNTFFLSGYSVRGDVKKVHG 

GVLEKL 486 

D GI P T+ L+ Y+ +GD+ V LEK+ 

DAGIEPGPDTYLALLLNAYAEKGDIDHVKQ 

QTLEKV 293 

KYCNDVFAQISFLGGMKPSTRLYNAVIDAL 

LVKSNSLDLAYLKF-QQQMRSDGCKPDRFTY 

YNI 220 

++ + ++ + LGG 

YNA++ ++ N + F +M +P+R TY Y 

EFAHRIWDTLQKLGGAVYDVSHYNALLKVY 

YLQ-NEYKFSPTDFLAAKMEEANIQPNRVTY 

YQR 202 

LIHGVCKKGVVDEAAIRLVKQMEQEGNRPN 

NVFTYTILIDGFLIAG AGRVDEALKQLEMMRV VRK 280 

LI C G ++ A +++ M+ + ++ L+ G AG ++ A L +MR 

LIASYCNVGDIEGAASKILGFMKTKDLPVT 

TEAVFSALVTGHARAG AGDMENAENILTVMRD DAG 262 

LNPNEATIRTFVHGGIFRCLPPCKAFEVLV 

VGFMEKDSNLQRVGYD YDAVLYCLSNNSMAKETG 

340 

+ P T ++ 

+ L + + +L +++ S + 

IEPGPDTYLALLNAAYAEKGDIDHVKQTLE 

EKVEKSELHLMDRDLLLQIIFSFSKAGYPQY 

YVS 322 

QFLRKIG-ERGYIPPDSSTFNAAMSCLLKG 

GHDLVETCRIFDGFVS VSRGVKPGFNGYLVLV VQA 399 

+ L K+ ER YIPPD 

AM+ +L L+ T ++ D 

V + Q 

EILEKVTCERRYIPPD------AMNLIL-- 

---LLVTEKLED----------------VAL 

LQI 357 

LLNAQRFSEGDRYLLKQMGVDGLLSSVYSY 

YNAVIDCLCKARRIENNAAMFLTEMQDRGISPN 

459 

LL E 

DG SV+ + C+ +E + ++++ + 

LLACPVSKE-----------DG--PSVFGS 

SFFLQHCVTMNTPVEKKLTDYCKKLKEVQMH 

HSF 405 

LVTFNTFLSGYSVRRGDVKKVHGVLEKLLV 

VHGFKPDVITFSLIINNCLCRAKEIKDAFDC 

CFK 519 

+ F + + + D+ K +++ + GF F ++ + K ++ + K 

PLQFTLHCALLANKKTDLAK--ALMKAVKE 

EEGFPIRPHYFWPLLVVGRRKEKNVQGIIEILK 

463 

EMLEWGIEPNEITYYNILIRSCCSTGDTDR 

RSVKLFAKMKENGLSPPD 

564 

M E G+ P++ TYY 

+ C + ++ R++ R ++ENG D 

GMQELGVHPDQETYYTDYVIPCFDSVNSAR 

RAI-----LQENGCLSSD 

503 

YNILIRSCCSTGDTTDRSVKLFAKMKENGL 

LSPDLYAYNATIQSFC FCKMRKVKKAEELLKTML 

592 

YN L++ 

AKM+E + P+ Y I S+CC 

+ ++ A ++L M 

YNALLKVYLQNEYKKFSPTDFLAKMEEANI 

IQPNRVTYQRLIASYC YCNVGDIEGASKILGF FMK 224

Query 593 RIGLKPDNFTYSTLIKALSESGRESEAREMFSSIERHGCV--PDSY 636 

L +S L+ + +G A + + + G PD+Y 

Sbjct 225 TKDLPVTEAVFSALVTGHARAGDMENAENILTVMRDAGIEPGPDTY 270 



Query 493 PDVITFSLIINCLCRAKEIKDAFDCFKEMLEWGIEPNEITYNILIRSCCSTGDTDRSVKL 552 

P V + +C+ ++ D K++ E ++ + + TD + L 

Sbjct 369 PSVFGSFFLQHCVTMNTPVEKLTDYCKKLKE--VQMHSFPLQFTLHCALLANKTDLAKAL 426 

Query 553 FAKMKENGLSPDLYAYNATIQSFCKMRKVKKAEELLKTMLRIGLKPDNFTYSTLIKALSE 612 

+KE G + + + K + V+ E+LK M +G+ PD TY+ + + 

Sbjct 427 MKAVKEEGFPIRPHYFWPLLVGRRKEKNVQGIIEILKGMQELGVHPDQETYTDYVIPCFD 486 

Query 613 SGRESEAREMFSSIERHGCVPDS 635 

S + A ++ +GC+ DS 

Sbjct 487 SVNSARA-----ILQENGCLSDS 504 

>AT3G17820 

MSLLSDLVNLNLTDATGKIIAEYIWIGGSGMDIRSKARTLPGPVTDPSKLPKWNYDGSSTGQAAGEDSEVILYPQAIFKDPFRKGNNILVMCDAYTPAGD 

PIPTNKRHNAAKIFSHPDVAKEEPWYGIEQEYTLMQKDVNWPIGWPVGGYPGPQGPYYCGVGADKAIGRDIVDAHYKACLYAGIGISGINGEVMPGQWEF 

QVGPVEGISSGDQVWVARYLLERITEISGVIVSFDPKPVPGDWNGAGAHCNYSTKTMRNDGGLEVIKKAIGKLQLKHKEHIAAYGEGNERRLTGKHETAD 

INTFSWGVANRGASVRVGRDTEKEGKGYFEDRRPASNMDPYVVTSMIAETTILG 

GENE ID: 2752 GLUL | glutamate-ammonia ligase [Homo sapiens] 




Query 18 KIIAEYIWIGGSGMDIRSKARTLPGPVTDPSKLPKWNYDGSSTGQAAGEDSEVILYPQAI 77 

K+ A YIWI G+G +R K RTL +LP+WN+DGSST Q+ G +S++ L P A+ 

Sbjct 25 KVQAMYIWIDGTGEGLRCKTRTLDSEPKCVEELPEWNFDGSSTLQSEGSNSDMYLVPAAM 84 

Query 78 FKDPFRKGNNILVMCDAYTPAGDPIPTNKRHNAAKIFSHPDVAKEEPWYGIEQEYTLMQK 137 

F+DPFRK N LV+C+ + P TN RH +I V+ + PW+G+EQEYTLM 

Sbjct 85 FRDPFRKDPNKLVLCEVFKYNRRPAETNLRHTCKRIMDM--VSNQHPWFGMEQEYTLMGT 142 

Query 138 DVNWPIGWPVGGYPGPQGPYYCGVGADKAIGRDIVDAHYKACLYAGIGISGINGEVMPGQ 197 

D + P GWP G+PGPQGPYYCGVGAD+A GRDIV+AHY+ACLYAG+ I+G N EVMP Q 

Sbjct 143 DGH-PFGWPSNGFPGPQGPYYCGVGADRAYGRDIVEAHYRACLYAGVKIAGTNAEVMPAQ 201 

Query 198 WEFQVGPVEGISSGDQVWVARYLLERITEISGVIVSFDPKPVPGDWNGAGAHCNYSTKTM 257 

WEFQ+GP EGIS GD +WVAR++L R+ E GVI +FDPKP+PG+WNGAG H N+STK M 

Sbjct 202 WEFQIGPCEGISMGDHLWVARFILHRVCEDFGVIATFDPKPIPGNWNGAGCHTNFSTKAM 261 

Query 258 RNDGGLEVIKKAIGKLQLKHKEHIAAY----GEGNERRLTGKHETADINTFSWGVANRGA 313 

R + GL+ I++AI KL +H+ HI AY G N RRLTG HET++IN FS GVANR A 

Sbjct 262 REENGLKYIEEAIEKLSKRHQYHIRAYDPKGGLDNARRLTGFHETSNINDFSAGVANRSA 321 

Query 314 SVRVGRDTEKEGKGYFEDRRPASNMDPYVVTSMIAETTIL 353 

S+R+ R +E KGYFEDRRP++N DP+ VT + T +L 

Sbjct 322 SIRIPRTVGQEKKGYFEDRRPSANCDPFSVTEALIRTCLL 361 

>AT3G23150 

MVKEIASWLLILSMVVFVSPVLAINGGGYPRCNCEDEGNSFWSTENILETQRVSDFLIAVAYFSIPIELLYFVSCSNVPFKWVLFEFIAFIVLCGMTHLL 

HGWTYSAHPFRLMMAFTVFKMLTALVSCATAITLITLIPLLLKVKVREFMLKKKAHELGREVGLILIKKETGFHVRMLTQEIRKSLDRHTILYTTLVELS 

KTLGLQNCAVWMPNDGGTEMDLTHELRGRGGYGGCSVSMEDLDVVRIRESDEVNVLSVDSSIARASGGGGDVSEIGAVAAIRMPMLRVSDFNGELSYAIL 

VCVLPGGTPRDWTYQEIEIVKVVADQVTVALDHAAVLEESQLMREKLAEQNRALQMAKRDALRASQARNAFQKTMSEGMRRPMHSILGLLSMIQDEKLSD 

EQKMIVDTMVKTGNVMSNLVGDSMDVPDGRFGTEMKPFSLHRTIHEAACMARCLCLCNGIRFLVDAEKSLPDNVVGDERRVFQVILHIVGSLVKPRKRQE 

GSSLMFKVLKERGSLDRSDHRWAAWRSPASSADGDVYIRFEMNVENDDSSSQSFASVSSRDQEVGDVRFSGGYGLGQDLSFGVCKKVVQLIHGNISVVPG 

SDGSPETMSLLLRFRRRPSISVHGSSESPAPDHHAHPHSNSLLRGLQVLLVDTNDSNRAVTRKLLEKLGCDVTAVSSGFDCLTAIAPGSSSPSTSFQVVV 

LDLQMAEMDGYEVAMRIRSRSWPLIVATTVSLDEEMWDKCAQIGINGVVRKPVVLRAMESELRRVLLQADQLL 

GENE ID: 6197 RPS6KA3 | ribosomal protein S6 kinase, 90kDa, polypeptide 3 




Query 546 NDDSSSQSFASVSSRDQEV--GDVRFSGGYGLGQDL---SFGVCKKVVQL---IHGNISV 597 

+D+S + V S Q++ ++F+ GY L +D+ S+ VCK+ + + + + 

Sbjct 392 DDESQAMQTVGVHSIVQQLHRNSIQFTDGYELKEDIGVGSYSVCKRCIHKATNMEFAVKI 451 

Query 598 VPGSDGSP-ETMSLLLRFRRRPSI 620 

+ S P E + +LLR+ + P+I 

Sbjct 452 IDKSKRDPTEEIEILLRYGQHPNI 475 

>AT3G25520 

MVFVKSTKSNAYFKRYQVKFRRRRDGKTDYRARIRLINQDKNKYNTPKYRFVVRFTNKDIVAQIVSASIAGDIVKASAYAHELPQYGLTVGLTNYAAAYC 

TGLLLARRVLKMLEMDDEYEGNVEATGEDFSVEPTDSRRPFRALLDVGLIRTTTGNRVFGALKGALDGGLDIPHSDKRFAGFHKENKQLDAEIHRNYIYG 

GHVSNYMKLLGEDEPEKLQTHFSAYIKKGVEAESIEELYKKVHAAIRADPNPKKTVKPAPKQHKRYNLKKLTYEERKNKLIERVKALNGAGGDDDDEDDE 

E 

GENE ID: 6125 RPL5 | ribosomal protein L5 [Homo sapiens] (Over 10 PubMed links) 



Query 1 MVFVKSTKSNAYFKRYQVKFRRRRDGKTDYRARIRLINQDKNKYNTPKYRFVVRFTNKDI 60 

M FVK K+ AYFKRYQVKFRRRR+GKTDY AR RL+ QDKNKYNTPKYR +VR TN+DI 

Sbjct 1 MGFVKVVKNKAYFKRYQVKFRRRREGKTDYYARKRLVIQDKNKYNTPKYRMIVRVTNRDI 60 

Query 61 VAQIVSASIAGDIVKASAYAHELPQYGLTVGLTNYAAAYCTGLLLARRVLKMLEMDDEYE 120

+ QI A I GD++ +AYAHELP+YG+ VGLTNYAAAYCTGLLLARR+L MD YE 

Sbjct 61 ICQIAYARIEGDMIVCAAYAHELPKYGVKVGLTNYAAAYCTGLLLARRLLNRFGMDKIYE 120 

Query 121 GNVEATGEDFSVEPTDSRR-PFRALLDVGLIRTTTGNRVFGALKGALDGGLDIPHSDKRF 179 

G VE TG++++VE D + F LD GL RTTTGN+VFGALKGA+DGGL IPHS KRF 

Sbjct 121 GQVEVTGDEYNVESIDGQPGAFTCYLDAGLARTTTGNKVFGALKGAVDGGLSIPHSTKRF 180 

Query 180 AGFHKENKQLDAEIHRNYIYGGHVSNYMKLLGEDEPEKLQTHFSAYIKKGVEAESIEELY 239 

G+ E+K+ +AE+HR +I G +V++YM+ L E++ + + FS YIK V + +EE+Y 

Sbjct 181 PGYDSESKEFNAEVHRKHIMGQNVADYMRCLMEEDEDAYKKQFSQYIKNSVTPDMMEEMY 240 

Query 240 KKVHAAIRADPNPKKTVKPAPKQHKRYNLKKLTYEERKNKLIER 283 

KK HAAIR +P + + KR+N K++ ++K+++ ++ 

Sbjct 241 KKAHAAIRENP-VYEKKPKKEVKKKRWNRPKMSLAQKKDRVAQK 283 

>AT3G46000 

MANAASGMAVHDDCKLKFMELKAKRTFRTIVYKIEDKQVIVEKLGEPEQSYDDFAASLPADDCRYCIYDFDFVTAENCQKSKIFFIAWSPDTAKVRDKMI 

YASSKDRFKRELDGIQVELQATDPTEMGLDVFKSRTN 

GENE ID: 1073 CFL2 | cofilin 2 (muscle) [Homo sapiens] (Over 10 PubMed links) 



Query 5 ASGMAVHDDCKLKFMELKAKRTF--------------------RTIVYKIEDKQVIVEKL 44 

ASG+ V+D+ F ++K +++ R I+ + E KQ++V + 

Sbjct 2 ASGVTVNDEVIKVFNDMKVRKSSTQEEIKKRKKAVLFCLSDDKRQIIVE-EAKQILVGDI 60 

Query 45 GEP-EQSYDDFAASLPADDCRYCIYDFDFVTAENCQKSKIFFIAWSPDTAKVRDKMIYAS 103 

G+ E Y F LP +DCRY +YD + T E+ +K + FI W+P++A ++ KMIYAS 

Sbjct 61 GDTVEDPYTSFVKLLPLNDCRYALYDATYETKES-KKEDLVFIFWAPESAPLKSKMIYAS 119 

Query 104 SKDRFKRELDGIQVELQATDPTEMGLDVFKSRTN 137 

SKD K++ GI+ E Q GLD K R+ 

Sbjct 120 SKDAIKKKFTGIKHEWQVN-----GLDDIKDRST 148 

>AT3G46030 

MAPKAEKKPAEKKPVEEKSKAEKAPAEKKPKAGKKLPKEAGAGGDKKKKMKKKSVETYKIYIFKVLKQVHPDIGISSKAMGIMNSFINDIFEKLASESSK 

LARYNKKPTITSREIQTAVRLVLPGELAKHAVSEGTKAVTKFTSS 

GENE ID: 8340 HIST1H2BL | histone cluster 1, H2bl [Homo sapiens] 




Query 21 AEKAPAEKKPKAGKK--LPKEAGAGGDKKKKMKKKSVETYKIYIFKVLKQVHPDIGISSK 78 

A+ APA PK G K + K G K+K+ +K E+Y +Y++KVLKQVHPD GISSK 

Sbjct 5 AKSAPA---PKKGSKKAVTKAQKKDGKKRKRSRK---ESYSVYVYKVLKQVHPDTGISSK 58 

Query 79 AMGIMNSFINDIFEKLASESSKLARYNKKPTITSREIQTAVRLVLPGELAKHAVSEGTKA 138 

AMGIMNSF+NDIFE++ASE+S+LA YNK+ TITSREIQTAVRL+LPGELAKHAVSEGTKA 

Sbjct 59 AMGIMNSFVNDIFERIASEASRLAHYNKRSTITSREIQTAVRLLLPGELAKHAVSEGTKA 118 

Query 139 VTKFTSS 145 

VTK+TSS 

Sbjct 119 VTKYTSS 125 

>AT3G46440 

MASSDKQTSPKPPPSPSPLRNSKFCQSNMRILISGGAGFIGSHLVDKLMENEKNEVIVADNYFTGSKDNLKKWIGHPRFELIRHDVTEPLLIEVDQIYHL 

ACPASPIFYKYNPVKTIKTNVIGTLNMLGLAKRVGARILLTSTSEVYGDPLIHPQPESYWGNVNPIGVRSCYDEGKRVAETLMFDYHRQHGIEIRIARIF 

NTYGPRMNIDDGRVVSNFIAQALRGEALTVQKPGTQTRSFCYVSDMVDGLMRLMEGDDTGPINIGNPGEFTMVELAETVKELINPSIEIKMVENTPDDPR 

QRKPDITKAKEVLGWEPKVKLREGLPLMEEDFRLRLGVHKN 

GENE ID: 80146 UXS1 | UDP-glucuronate decarboxylase 1 [Homo sapiens] 




Query 30 RILISGGAGFIGSHLVDKLMENEKNEVIVADNYFTGSKDNLKKWIGHPRFELIRHDVTEP 89 

RILI+GGAGF+GSHL DKLM + +EV V DN+FTG K N++ WIGH FELI HDV EP 

Sbjct 95 RILITGGAGFVGSHLTDKLMM-DGHEVTVVDNFFTGRKRNVEHWIGHENFELINHDVVEP 153 

Query 90 LLIEVDQIYHLACPASPIFYKYNPVKTIKTNVIGTLNMLGLAKRVGARILLTSTSEVYGD 149 

L IEVDQIYHLA PASP Y YNP+KT+KTN IGTLNMLGLAKRVGAR+LL STSEVYGD 

Sbjct 154 LYIEVDQIYHLASPASPPNYMYNPIKTLKTNTIGTLNMLGLAKRVGARLLLASTSEVYGD 213 

Query 150 PLIHPQPESYWGNVNPIGVRSCYDEGKRVAETLMFDYHRQHGIEIRIARIFNTYGPRMNI 209 

P +HPQ E YWG+VNPIG R+CYDEGKRVAET+ + Y +Q G+E+R+ARIFNT+GPRM++ 

Sbjct 214 PEVHPQSEDYWGHVNPIGPRACYDEGKRVAETMCYAYMKQEGVEVRVARIFNTFGPRMHM 273 

Query 210 DDGRVVSNFIAQALRGEALTVQKPGTQTRSFCYVSDMVDGLMRLMEGDDTGPINIGNPGE 269 

+DGRVVSNFI QAL+GE LTV G+QTR+F YVSD+V+GL+ LM + + P+N+GNP E 

Sbjct 274 NDGRVVSNFILQALQGEPLTVYGSGSQTRAFQYVSDLVNGLVALMNSNVSSPVNLGNPEE 333 

Query 270 FTMVELAETVKELINPSIEIKMVENTPDDPRQRKPDITKAKEVLGWEPKVKLREGLPLME 329 

T++E A+ +K L+ EI+ + DDP++RKPDI KAK +LGWEP V L EGL 

Sbjct 334 HTILEFAQLIKNLVGSGSEIQFLSEAQDDPQKRKPDIKKAKLMLGWEPVVPLEEGLNKAI 393 

Query 330 EDFRLRLGVHKN 341 

FR L N 

Sbjct 394 HYFRKELEYQAN 405 

>AT3G49890 

MAKRELSGGDSSSEDEDPKWRAAINSIATTTVYGASATKPAATQSHNYGDFRLKPKKLTHGQIKVKNLLNEMVEKTLDFVEDPVNIPEDKPENDCGVRLF 

KRCATGIVFDHVDEIRGPKKKPNLRPDKGVEGSSKEFKKRVKSIAVDGSDILTAAVEAAKKASARLDAKEVAAKDKAKKEEERIAELKKVRGEKWLPSIE 

RAMKKEMKRIKHTAWKSAMS


>AT3G49950 

MTKTRILNPTRFPSPKPLRGCGDANFMEQLLLHCATAIDSNDAALTHQILWVLNNIAPPDGDSTQRLTSAFLRALLSRAVSKTPTLSSTISFLPQADELH 

RFSVVELAAFVDLTPWHRFGFIAANAAILTAVEGYSTVHIVDLSLTHCMQIPTLIDAMASRLNKPPPLLKLTVVSSSDHFPPFINISYEELGSKLVNFAT 

TRNITMEFTIVPSTYSDGFSSLLQQLRIYPSSFNEALVVNCHMMLRYIPEEPLTSSSSSLRTVFLKQLRSLNPRIVTLIEEDVDLTSENLVNRLKSAFNY 

FWIPFDTTDTFMSEQRRWYEAEISWKIENVVAKEGAERVERTETKRRWIERMREAEFGGVRVKEDAVADVKAMLEEHAVGWGMKKEDDDESLVLTWKGHS 

VVFATVWVPI 

GENE ID: 5819 PVRL2 | poliovirus receptor-related 2 (herpesvirus entry mediator 

B) [Homo sapiens] (Over 10 PubMed links) 



Query 150 QIPTLIDAMASRLNKPPPLLKLTVVSSSDHFPPFINISYEELGSKLVNFATTRNITMEFT 209 

Q PT + S+ +PP +++ +SS D +S A T +T FT 

Sbjct 175 QDPTTVALCISKEGRPP--ARISWLSSLDWEAKETQVSG--------TLAGTVTVTSRFT 224 

Query 210 IVPSTYSDGFSSLLQQLRIYPSSFNEALVVNCHMMLRYIPE 250 

+VPS +DG + ++ SF E ++ + +RY PE 

Sbjct 225 LVPSGRADGVTVT---CKVEHESFEEPALIPVTLSVRYPPE 262 

>AT3G50960 

MDPDAVKSTLSNLAFGNVMAAAARNYQKEVLANEKAQGSNPVNEEVDLDELMDDPELERLHADRIAALKREVEKRESFKRQGHGEYREVSEGDFLGEVTR 

SEKVICHFYHKEFYRCKIMDKHLKTLAPRHVDTKFIKVDAENAPFFVTKLAIKTLPCVVLFSKGVAMDRLVGFQDLGTKDDFTTNKLENVLLKKGMLSKK 

KKEEDDEDAEYQESIRRSVRSSENLDSDSD 

GENE ID: 10190 TXNDC9 | thioredoxin domain containing 9 [Homo sapiens] 




Query 1 MDPDAVKSTLSNLAFGNVMAAAARNYQKEVLANEKAQGSNPVNEEVD-----LDELMDDP 55 

M ++ L+++ FG + A A+ + +VL ++ Q + V E +D LD+ MD+ 

Sbjct 1 MSQKSLAPRLNSVPFGRMEADASVDMFSKVLEHQLLQTTKLVEEHLDSEIQKLDQ-MDED 59 

Query 56 ELERLHADRIAALKREVEKRESFKRQGHGEYREV-SEGDFLGEVTRSEKVICHFYHKEFY 114 

ELERL R+ AL++ ++++ + +GHGEYRE+ SE DF EV SE V+CHFY + 

Sbjct 60 ELERLKEKRLQALRKAQQQKQEWLSKGHGEYREIPSERDFFQEVKESENVVCHFYRDSTF 119 

Query 115 RCKIMDKHLKTLAPRHVDTKFIKVDAENAPFFVTKLAIKTLPCVVLFSKGVAMDRLVGFQ 174 

RCKI+D+HL L+ +H++TKF+K++ E APF +L IK +P + L G D +VGF 

Sbjct 120 RCKILDRHLAILSKKHLETKFLKLNVEKAPFLCERLHIKVIPTLALLKDGKTQDYVVGFT 179 

Query 175 DLGTKDDFTTNKLE 188 

DLG DDFTT LE 

Sbjct 180 DLGNTDDFTTETLE 193 

>AT3G51310 

MIADDDEKWLAAAIAAVKQNAFYMQRAIDSNNLKDALKFSAQMLSELRTSKLSPHKYYELYMRVFNELGTLEIFFKEETGRGCSIAELYELVQHAGNILP 

RLYLLCTIGSVYIKSKDVTATDILKDLVEMCRAVQHPLRGLFLRSYLAQVTRDKLPSIGSDLEGDGDAHMNALEFVLQNFTEMNKLWVRMQHQGPSREKE 

KREKERNELRDLVGKNLHVLSQLEGVDLGIYRDTVLPRILEQVVNCKDELAQCYLMDCIIQVFPDDFHLQTLDVLLGACPQLQPSVDIKTVLSGLMERLS 

NYAASSVEALPNFLQVEAFSKLNYAIGKVVEAQADLPAAASVTLYLFLLKFTLHVYSDRLDYVDQVLGSCVTQLSATGKLCDDKAAKQIVAFLSAPLEKY 

NNVVTILKLTNYPLVMEYLDRETNKAMAIILVQSVFKNNTHIATADEVDALFELAKGLMKDFDGTIDDEIDEEDFQEEQNLVARLVNKLYIDDPEEMSKI 

IFTVRKHIVAGGPKRLPLTIPPLVFSALKLIRRLRGGDENPFGDDASATPKRILQLLSETVEVLSDVSAPDLALRLYLQCAQAANNCELETVAYEFFTKA 

YLLYEEEISDSKAQVTALRLIIGTLQRMRVFNVENRDTLTHKATGYSARLLRKPDQCRAVYECAHLFWADECENLKDGERVVLCLKRAQRIADAVQQMAN 

ASRGTSSTGSVSLYVELLNKYLYFLEKGNQQVTGDTIKSLAELIKSETKKVESGAEPFINSTLRYIEFQRQQEDGGMNEKYEKIKMEWFE 

GENE ID: 55737 VPS35 | vacuolar protein sorting 35 homolog (S. cerevisiae) 




Query 4 DDDEKWLAAAIAAVKQNAFYMQRAIDSNNLKDALKFSAQMLSELRTSKLSPHKYYELYMR 63 

D+ EK L AI AVK +F M+R +D N L DALK ++ ML ELRTS LSP YYELYM 

Sbjct 10 DEQEKLLDEAIQAVKVQSFQMKRCLDKNKLMDALKHASNMLGELRTSMLSPKSYYELYMA 69 

Query 64 VFNELGTLEIFFKEETGRGCSIAELYELVQHAGNILPRLYLLCTIGSVYIKSKDVTATDI 123 

+ +EL LE++ +E +G +A+LYELVQ+AGNI+PRLYLL T+G VY+KS + DI 

Sbjct 70 ISDELHYLEVYLTDEFAKGRKVADLYELVQYAGNIIPRLYLLITVGVVYVKSFPQSRKDI 129 

Query 124 LKDLVEMCRAVQHPLRGLFLRSYLAQVTRDKLPSIG--SDLEGDGDAHMNALEFVLQNFT 181 

LKDLVEMCR VQHPLRGLFLR+YL Q TR+ LP G +D E GD ++++FVL NF 

Sbjct 130 LKDLVEMCRGVQHPLRGLFLRNYLLQCTRNILPDEGEPTDEETTGDIS-DSMDFVLLNFA 188 

Query 182 EMNKLWVRMQHQGPSREKEKREKERNELRDLVGKNLHVLSQLEGVDLGIYRDTVLPRILE 241 

EMNKLWVRMQHQG SR++EKRE+ER ELR LVG NL LSQLEGV++ Y+ VL ILE 

Sbjct 189 EMNKLWVRMQHQGHSRDREKRERERQELRILVGTNLVRLSQLEGVNVERYKQIVLTGILE 248 

Query 242 QVVNCKDELAQCYLMDCIIQVFPDDFHLQTLDVLLGACPQLQPSVDIKTVLSGLMERLSN 301 

QVVNC+D LAQ YLM+CIIQVFPD+FHLQTL+ L AC +L +V++K ++ L++RL+ 

Sbjct 249 QVVNCRDALAQEYLMECIIQVFPDEFHLQTLNPFLRACAELHQNVNVKNIIIALIDRLAL 308 

Query 302 YAASSVEALPNF-LQVEAFSKLNYAIGKVVEAQADLPAAASVTLYLFLLKFTLHVYSDRL 360 

+A E P ++ F + + V++++ D+P+ V+L + L+ + Y DR+

Sbjct 309 FAHR--EDGPGIPADIKLFDIFSQQVATVIQSRQDMPSEDVVSLQVSLINLAMKCYPDRV 366 

Query 361 DYVDQVLGSCV---TQLSATGKLCDDKAAKQIVAFLSAPLEKYNNVVTILKLTNYPLVME 417 

DYVD+VL + V +L+ +K++ L P++ YNN++T+LKL ++ + E 

Sbjct 367 DYVDKVLETTVEIFNKLNLEHIATSSAVSKELTRLLKIPVDTYNNILTVLKLKHFHPLFE 426 

Query 418 YLDRETNKAMAIILVQSVFKNNTHIATADEVDALFELAKGLMKDFDGTIDDEIDEEDFQE 477 

Y D E+ K+M+ ++ +V NT I + D+VD++ L L++D ++ D EDF + 

Sbjct 427 YFDYESRKSMSCYVLSNVLDYNTEIVSQDQVDSIMNLVSTLIQDQPDQPVEDPDPEDFAD 486 

Query 478 EQNLVARLVNKLYIDDPEEMSKIIFTVRKHIVAGGPKRLPLTIPPLVFSALKLIRRLRGG 537 

EQ+LV R ++ L +DP++ I+ T RKH AGG +R+ T+PPLVF+A +L R + 

Sbjct 487 EQSLVGRFIHLLRSEDPDQQYLILNTARKHFGAGGNQRIGFTLPPLVFAAYQLAFRYK-- 544 

Query 538 DENPFGDDA-SATPKRILQLLSETVEVLSDVSAPDLALRLYLQCAQAANNCEL---ETVA 593 

EN DD ++I +T+ L +L LRL+LQ A AA ETVA 

Sbjct 545 -ENSKVDDKWEKKCQKIFSFAHQTISALIKAELAELPLRLFLQGALAAGEIGFENHETVA 603 

Query 594 YEFFTKAYLLYEEEISDSKAQVTALRLIIGTLQRMRVFNVENRDTLTHKATGYSARLLRK 653 

YEF ++A+ LYE+EISDSKAQ+ A+ LIIGT +RM+ F+ EN + L + +++LL+K 

Sbjct 604 YEFMSQAFSLYEDEISDSKAQLAAITLIIGTFERMKCFSEENHEPLRTQCALAASKLLKK 663 

Query 654 PDQCRAVYECAHLFWA-----DECENLKDGERVVLCLKRAQRIADAVQQMANASRGTSST 708 

PDQ RAV CAHLFW+ E L GERV+ CLK+A +IA+ + + 

Sbjct 664 PDQGRAVSTCAHLFWSGRNTDKNGEELHGGERVMECLKKALKIAN---------QCMDPS 714 

Query 709 GSVSLYVELLNKYLYFLEKGNQQVTGDTIKSLAELIKSETKKVESGAEP-----FINSTL 763 

V L++E+LN+Y+YF EK N VT + L + I+ + +ES E ++TL 

Sbjct 715 LQVQLFIEILNRYIYFYEKENDAVTIQVLNQLIQKIREDLPNLESSEETEQINKHFHNTL 774 

Query 764 RYIEFQRQ 771 

++ +R+ 

Sbjct 775 EHLRLRRE 782 

>AT3G52930 

MSAFTSKFADELIANAAYIGTPGKGILAADESTGTIGKRLASINVENVETNRRNLRELLFTAPGALPCLSGVILFEETLYQKSSDGKLFVDILKEGGVLP 

GIKVDKGTVELAGTDGETTTQGLDGLGDRCKKYYEAGARFAKWRAVLKIGENEPSEHSIHENAYGLARYAVICQENGLVPIVEPEILVDGSHDIQKCAAV 

TERVLAACYKALSDHHVLLEGTLLKPNMVTPGSDSPKVSPEVIAEHTVRALQRTVPAAVPAIVFLSGGQSEEEATRNLNAMNQLKTKKPWSLSFSFGRAL 

QQSTLKTWAGKEENVKAAQEALYVRCKANSEATLGTYKGDAKLGDGAAESLHVKDYKY 




Query 3 AFTSKFADELIANAAYIGTPGKGILAADESTGTIGKRLASINVENVETNRRNLRELLFTA 62 

A T + EL A I PGKGILAADESTG+I KRL SI EN E NRR R+LL TA 

Sbjct 61 ALTPEQKKELSDIAHRIVAPGKGILAADESTGSIAKRLQSIGTENTEENRRFYRQLLLTA 120 

Query 63 PGAL-PCLSGVILFEETLYQKSSDGKLFVDILKEGGVLPGIKVDKGTVELAGTDGETTTQ 121 

+ PC+ GVILF ETLYQK+ DG+ F ++K G + GIKVDKG V LAGT+GETTTQ 

Sbjct 121 DDRVNPCIGGVILFHETLYQKADDGRPFPQVIKSKGGVVGIKVDKGVVPLAGTNGETTTQ 180 

Query 122 GLDGLGDRCKKYYEAGARFAKWRAVLKIGENEPSEHSIHENAYGLARYAVICQENGLVPI 181 

GLDGL +RC +Y + GA FAKWR VLKIGE+ PS +I ENA LARYA ICQ+NG+VPI 

Sbjct 181 GLDGLSERCAQYKKDGADFAKWRCVLKIGEHTPSALAIMENANVLARYASICQQNGIVPI 240 

Query 182 VEPEILVDGSHDIQKCAAVTERVLAACYKALSDHHVLLEGTLLKPNMVTPG-SDSPKVSP 240 

VEPEIL DG HD+++C VTE+VLAA YKALSDHH+ LEGTLLKPNMVTPG + + K S 

Sbjct 241 VEPEILPDGDHDLKRCQYVTEKVLAAVYKALSDHHIYLEGTLLKPNMVTPGHACTQKFSH 300 

Query 241 EVIAEHTVRALQRTVPAAVPAIVFLSGGQSEEEATRNLNAMNQLKTKKPWSLSFSFGRAL 300 

E IA TV AL+RTVP AV I FLSGGQSEEEA+ NLNA+N+ KPW+L+FS+GRAL 

Sbjct 301 EEIAMATVTALRRTVPPAVTGITFLSGGQSEEEASINLNAINKCPLLKPWALTFSYGRAL 360 

Query 301 QQSTLKTWAGKEENVKAAQEALYVRCKANSEATLGTYKGDAKLGDGAAESLHVKDYKY 358 

Q S LK W GK+EN+KAAQE R ANS A G Y + G A+ESL V ++ Y 

Sbjct 361 QASALKAWGGKKENLKAAQEEYVKRALANSLACQGKYTPSGQAGAAASESLFVSNHAY 418 

>AT3G54870 

MSSSNSSSAVRSSAKHAAERIQQHLPPNSNHAVSLSSSSLNLPARTSIVAPGIAHSSRLKDRPSASSSSSSSSVSASSPSTRRSGTPVRRSQSKDFDDDN 

DPGRVRVSVRVRPRNGEELISDADFADLVELQPEIKRLKLRKNNWNSESYKFDEVFTDTASQKRVYEGVAKPVVEGVLSGYNGTIMAYGQTGTGKTYTVG 

KIGKDDAAERGIMVRALEDILLNASSASISVEISYLQLYMETIQDLLAPEKNNISINEDAKTGEVSVPGATVVNIQDLDHFLQVLQVGETNRHAANTKMN 

TESSRSHAILTVYVRRAMNEKTEKAKPESLGDKAIPRVRKSKLLIVDLAGSERINKSGTDGHMIEEAKFINLSLTSLGKCINALAEGSSHIPTRDSKLTR 

LLRDSFGGSARTSLIITIGPSARYHAETTSTIMFGQRAMKIVNMVKLKEEFDYESLCRKLETQVDHLTAEVERQNKLRNSEKHELEKRLRECENSFAEAE 

KNAVTRSKFLEKENTRLELSMKELLKDLQLQKDQCDLMHDKAIQLEMKLKNTKQQQLENSAYEAKLADTSQVYEKKIAELVQRVEDEQARSTNAEHQLTE 

MKNILSKQQKSIHEQEKGNYQYQRELAETTHTYESKIAELQKKLEGENARSNAAEDQLRQMKRLISDRQVISQENEEANELKIKLEELSQMYESTVDELQ 

TVKLDYDDLLQQKEKLGEEVRDMKERLLLEEKQRKQMESELSKLKKNLRESENVVEEKRYMKEDLSKGSAESGAQTGSQRSQGLKKSLSGQRATMARLCE 

EVGIQKILQLIKSEDLEVQIQAVKVVANLAAEEANQVKIVEEGGVEALLMLVQSSQNSTILRVASGAIANLAMNEKSQDLIMNKGGAQLLAKMVTKTDDP 

QTLRMVAGALANLCGNGKHKIKNFASDDFQYSLYNLCVKIY 

GENE ID: 3799 KIF5B | kinesin family member 5B [Homo sapiens] 




Query 105 VRVSVRVRPRN------GEELISDADFADLVELQPEIKRLKLRKNNWNSESYKFDEVFTD 158 

++V R RP N G++ I+ D V + S+ Y FD VF 

Sbjct 9 IKVMCRFRPLNESEVNRGDKYIAKFQGEDTVVIA--------------SKPYAFDRVFQS 54 

Query 159 TASQKRVYEGVAKPVVEGVLSGYNGTIMAYGQTGTGKTYTV-GKIGKDDAAERGIMVRAL 217 

+ SQ++VY AK +V+ VL GYNGTI AYGQT +GKT+T+ GK+ D GI+ R + 

Sbjct 55 STSQEQVYNDCAKKIVKDVLEGYNGTIFAYGQTSSGKTHTMEGKLH--DPEGMGIIPRIV 112 

Query 218 EDILLNASSAS----ISVEISYLQLYMETIQDLLAPEKNNISINEDAKTGEVSVPGATVV 273 

+DI S +++SY ++Y++ I+DLL K N+S++ED K V G T 

Sbjct 113 QDIFNYIYSMDENLEFHIKVSYFEIYLDKIRDLLDVSKTNLSVHED-KNRVPYVKGCTER 171 

Query 274 NIQDLDHFLQVLQVGETNRHAANTKMNTESSRSHAILTVYVRRAMNEKTEKAKPESLGDK 333 

+ D + + G++NRH A T MN SSRSH+I + V++ N +TE+ 

Sbjct 172 FVCSPDEVMDTIDEGKSNRHVAVTNMNEHSSRSHSIFLINVKQE-NTQTEQKLS------ 224

Query 334 AIPRVRKSKLLIVDLAGSERINKSGTDGHMIEEAKFINLSLTSLGKCINALAEGSSHIPT 393 

KL +VDLAGSE+++K+G +G +++EAK IN SL++LG I+ALAEGS+++P 

Sbjct 225 -------GKLYLVDLAGSEKVSKTGAEGAVLDEAKNINKSLSALGNVISALAEGSTYVPY 277 

Query 394 RDSKLTRLLRDSFGGSARTSLIITIGPSARYHAETTSTIMFGQRAMKIVNMV 445 

RDSK+TR+L+DS GG+ RT+++I PS+ +ET ST++FGQRA I N V 

Sbjct 278 RDSKMTRILQDSLGGNCRTTIVICCSPSSYNESETKSTLLFGQRAKTIKNTV 329 

>AT3G59820 

MASRAIVRRKNIISDYLNVYARSIQSFQYIGNSSQTVHSHAYHSGINRPPVETKPVTEHKSFTRRDGLLLLSRNGYFNRSFHGFHSSGFGYGSSEVGPSL 

GMRYMSLSIRNATTVAAKKPEEEDKKVDELAKNRKEASPEECDQAVESLSSVKAKAKAKRLQESKKVARSIVQRAWAIVLKIGPAIKAVASMNRADWAKK 

LTHWKHEFVSTLKHYWLGTKLLWADTRISSRLLLKLAGGKSLSRRERQQLTRTTADIFRLVPFAVFILVPFMEFLLPVFLKLFPNMLPSTFQDKMKEEEA 

LKRKLLARIEYAKFLQETAREMAKEVKHSRTGEVKQTAEDLDEFLDKVRRGQIVHNDELLGFAKLFNDELTLDNISRPRLVSMCKYMGISPYGTDAYLRY 

MLRKRLRSIKEDDKLIRAEGVDSLSEAELREDCRERGMLGLVSVEEMRQQLRDWMDLSLNHSVPSSLLILSRAFTVAGRVKAEDAVRATLSSLPDEVVDT 

VGITSLPSEDPVSERRRKLEYLEMQEELIKEEEEKEEEELTRIKDVKGGDEDKALQEMTIPTASEAQEQARARVLEQQDDLCKLSRALGVLASASSVCRE 

REEFLRLVKKEVEFYNTMVEREDVDGEKAAMKAYKAARVDIDQADEVAEADEVSSALMEKVDGLIQNLEKEIDDVDIKIGKGWQLLDRDRDGKVTPDEVA 

AAAMYLKDTLANDGLQQLISSLSKDKGKNYGGRHCKVGEIGKQARRKCNGRRIKLKEIIL 

GENE ID: 3954 LETM1 | leucine zipper-EF-hand containing transmembrane protein 1 




Query 212 LKHYWLGTKLLWADTRISSRLLLKLAGGKSLSRRERQQLTRTTADIFRLVPFAVFILVPF 271 

LKHY+ G +LLW DT+I++R+L ++ G SL+RRER+Q R AD+FRLVPF VF++VPF 

Sbjct 161 LKHYYHGFRLLWIDTKIAARMLWRILNGHSLTRRERRQFLRICADLFRLVPFLVFVVVPF 220 

Query 272 MEFLLPVFLKLFPNMLPSTFQDKMKEEEALKRKLLARIEYAKFLQETAREMAKEVKHSRT 331 

MEFLLPV +KLFPNMLPSTF+ + +EE LK++L ++E AKFLQ+T EMA + K ++ 

Sbjct 221 MEFLLPVAVKLFPNMLPSTFETQSLKEERLKKELRVKLELAKFLQDTIEEMALKNKAAKG 280 

Query 332 GEVKQTAEDLDEFLDKVRR-GQIVHNDELLGFAKLFNDELTLDNISRPRLVSMCKYMGIS 390 

K D F K+R G+ N+E++ F+KLF DELTLDN++RP+LV++CK + + 

Sbjct 281 SATK----DFSVFFQKIRETGERPSNEEIMRFSKLFEDELTLDNLTRPQLVALCKLLELQ 336 

Query 391 PYGTDAYLRYMLRKRLRSIKEDDKLIRAEGVDSLSEAELREDCRERGMLGL-VSVEEMRQ 449 

GT+ +LR+ L RLRSIK DDKLI EGVDSL+ EL+ CR RGM L V+ + +R 

Sbjct 337 SIGTNNFLRFQLTMRLRSIKADDKLIAEEGVDSLNVKELQAACRARGMRALGVTEDRLRG 396 

Query 450 QLRDWMDLSLNHSVPSSLLILSRAFTVAGRVKAEDAVRATLSSLPDEVVDTVGITSLPSE 509 

QL+ W+DL L+ +P+SLLILSRA + + D +++TL +LP+ V + E 

Sbjct 397 QLKQWLDLHLHQEIPTSLLILSRAMYLPDTLSPADQLKSTLQTLPEIVAKEAQVKVAEVE 456 

Query 510 DPVSERRRKLEYLEMQEELIKEEEEKEEE 538 

+ + KLE +QEE ++E +E+E 

Sbjct 457 GEQVDNKAKLEA-TLQEEAAIQQEHREKE 484 

>AT3G63140 

MAALSSSSLFFSSKTTSPISNLLIPPSLHRFSLPSSSSSFSSLSSSSSSSSSLLTFSLRTSRRLSPQKFTVKASSVGEKKNVLIVNTNSGGHAVIGFYFA 

KELLSAGHAVTILTVGDESSEKMKKPPFNRFSEIVSGGGKTVWGNPANVANVVGGETFDVVLDNNGKDLDTVRPVVDWAKSSGVKQFLFISSAGIYKSTE 

QPPHVEGDAVKADAGHVVVEKYLAETFGNWASFRPQYMIGSGNNKDCEEWFFDRIVRDRAVPIPGSGLQLTNISHVRDLSSMLTSAVANPEAASGNIFNC 

VSDRAVTLDGMAKLCAAAAGKTVEIVHYDPKAIGVDAKKAFLFRNMHFYAEPRAAKDLLGWESKTNLPEDLKERFEEYVKIGRDKKEIKFELDDKILEAL 

KTPVAA 

GENE ID: 64375 IKZF4 | IKAROS family zinc finger 4 (Eos) [Homo sapiens] 




Query 41 SSLSSSSSSSSSL--LTFSLRTSRRLSPQKFTVKASSVGEKK-----NVLIVNTNSGGHA 93 

S L SSS + + L SL +R +PQKF VGEK+ + L + NSGG+ 

Sbjct 199 SMLHSSSERPTFIDRLANSLTKRKRSTPQKF------VGEKQMRFSLSDLPYDVNSGGYE 252 

Query 94 VIGFYFAKELLSAGHAVTILTVGDESSEKMKKPPFNRFSEIV 135 

A L G ++ VG E ++ PP N SE+ 

Sbjct 253 KDVELVAHHSLEPGFGSSLAFVGAEHLRPLRLPPTNCISELT 294 

>AT4G02380 

MLSSGKRGYAATAAQGSVSSGGRSGAVASAVMKKKGVEESTQKISWVPDPKTGYYRPETGSNEIDAAELRAALLNNKQ 


>AT4G23630 

MAEEHKHDESVIAPEPAVEVVERESLMDKISEKIHHGGDSSSSSSSSDDEDEKKKTKKPSSPSSSMKSKVYRLFGREQPVHKVLGGGKPADIFMWKNKKM 

SGGVLGGATAAWVVFELMEYHLLTLLCHVMIVVLAVLFLWSNATMFINKSPPKIPEVHIPEEPILQLASGLRIEINRGFSSLREIASGRDLKKFLIAIAG 

LWVLSILGGCFNFLTLAYIALVLLFTVPLAYDKYEDKVDPLGEKAMIELKKQYAVLDEKVLSKIPLGPLKNKKKD 

GENE ID: 57142 RTN4 | reticulon 4 [Homo sapiens] (Over 10 PubMed links) 



Query 91 DIFMWKNKKMSGGVLGGATAAWVVFELMEYHLLTLLCHVMIVVLAVLF---LWSNATMFI 147 

D+ W++ K +G V G + +++ L + ++++ ++ + +L+V ++ I 

Sbjct 775 DLLYWRDIKKTGVVFGASL--FLLLSLTVFSIVSVTAYIALALLSVTISFRIYKGVIQAI 832 

Query 148 NKSPPKIP-------EVHIPEEPILQLASGLRIEINRGFSSLREIASGRDLKKFLIAIAG 200 

KS P EV I EE + + ++ +N LR + DL L 

Sbjct 833 QKSDEGHPFRAYLESEVAISEELVQKYSNSALGHVNCTIKELRRLFLVDDLVDSLKFAVL 892 

Query 201 LWVLSILGGCFNFLTLAYIALVLLFTVPLAYDKYEDKVD 239

+WV + +G FN LTL +AL+ LF+VP+ Y++++ ++D 

Sbjct 893 MWVFTYVGALFNGLTLLILALISLFSVPVIYERHQAQID 931 

>AT4G26110 

MSNDKDSFNVSDLTAALKDEDRAGLVNALKNKLQNLAGQRSDVLENLTPNVRKRVDALRDIQSQHDELEAKFREERAILEAKYQTLYQPLYVKRYEIVNG 

TTEVELAPEDDTKVDQGEEKTAEEKGVPSFWLTALKNNDVISEEVTERDEGALKYLKDIKWCKIEEPKGFKLEFFFDTNPYFKNTVLTKSYHMIDEDEPL 

LEKAMGTEIDWYPGKCLTQKILKKKPKKGSKNTKPITKLEDCESFFNFFSPPEVPDEDEDIDEERAEDLQNLMEQDYDIGSTIREKIIPRAVSWFTGEAM 

EAEDFEIDDDEEDDIDEDEDEEDEEDEEDDDDEDEEESKTKKKPSIGNKKGGRSQIVGEGKQDERPPECKQQ 

GENE ID: 4673 NAP1L1 | nucleosome assembly protein 1-like 1 [Homo sapiens] 




Query 25 LVNALKNKLQNLAGQRSDVLENLTPNVRKRVDALRDIQSQHDELEAKFREERAILEAKYQ 84 

++ AL+ +L L + +E+L V++RV+AL+++Q + ++EAKF EE LE KY 

Sbjct 7 ILAALQERLDGLVETPTGYIESLPRVVKRRVNALKNLQVKCAQIEAKFYEEVHDLERKYA 66 

Query 85 TLYQPLYVKRYEIVNGTTE-----VELAPEDDTKVDQGEEKT-----------AEEKGVP 128 

LYQPL+ KR+EI+N E E P+++ ++ + +EK + KG+P 

Sbjct 67 VLYQPLFDKRFEIINAIYEPTEEECEWKPDEEDEISELKEKAKIEDEKKDEEKEDPKGIP 126 

Query 129 SFWLTALKNNDVISEEVTERDEGALKYLKDIK--WCKIEEPKGFKLEFFFDTNPYFKNTV 186 

FWLT KN D++S+ V E DE LK+LKDIK + +P F LEF F+ N YF N V 

Sbjct 127 EFWLTVFKNVDLLSDMVQEHDEPILKHLKDIKVKFSDAGQPMSFVLEFHFEPNEYFTNEV 186 

Query 187 LTKSYHMIDE---------DEPLLEKAMGTEIDWYPGKCLT-QKILKKKPKKGSKNTKPI 236 

LTK+Y M E D P + G +IDW GK +T + I KK+ KG + + 

Sbjct 187 LTKTYRMRSEPDDSDPFSFDGPEIMGCTGCQIDWKKGKNVTLKTIKKKQKHKGRGTVRTV 246 

Query 237 TKLEDCESFFNFFSPPEVPDEDEDIDEERAEDLQNLMEQDYDIGSTIREKIIPRAVSWFT 296 

TK +SFFNFF+PPEVP E D+D+ D + ++ D++IG +RE+IIPR+V +FT 

Sbjct 247 TKTVSNDSFFNFFAPPEVP-ESGDLDD----DAEAILAADFEIGHFLRERIIPRSVLYFT 301 

>AT4G34490 

MEEDLIKRLEAAVTRLEGISSNGGGVVSLSRGGDFSSAAGIDIASSDPSILAYEDLISQCVGRALTAAEKIGGPVLDVTKIVAEAFASQKELLVRIKQTQ 

KPDLAGLAGFLKPLNDVTMKANAMTEGKRSDFFNHLKAACDSLSALAWIAFTGKDCGMSMPIAHVEESWQMAEFYNNKVLVEYRNKDADHVEWAKALKEL 

YLPGLREYVKSHYPLGPVWNASGKPASAPAKGPPGAPAPPPAPLFSAESSKPSSSSNQKQGMSAVFQQLSSGAVTSGLRKVTDDMKTKNRADRSGAVSAV 

EKETRTSKPAFSKTGPPKMELQMGRKWAVENQIGKKDLVISECDSKQSVYIYGCKDSVLQIQGKVNNITIDKCTKVGVVFTDVVAAFEIVNCNNVEVQCQ 

GSAPTVSVDNTTGCQLYLNKDSLETAITTAKSSEINVMVPGATPDGDWVEHALPQQYNHVFTEGKFETTPVSHSGA 

GENE ID: 10486 CAP2 | CAP, adenylate cyclase-associated protein, 2 (yeast) 




Query 5 LIKRLEAAVTRLEGISSNGGGVVSLSRGGDFSSAAGIDIASSDPSILAYEDLISQCVGRA 64 

L++RLE AV+RLE +S+ S G+ G+ IA PS+ A++ L+ V 

Sbjct 7 LVERLERAVSRLESLSAE-----SHRPPGNCGEVNGV-IAGVAPSVEAFDKLMDSMVAEF 60 

Query 65 LTAAEKIGGPVLDVTKIVAEAFASQKELLVRIKQTQKPDLAGLAGFLKPLNDVTMKANAM 124 

L + + G V ++V AF +Q+ L+ Q Q+P +A LKP+++ + 

Sbjct 61 LKNSRILAGDVETHAEMVHSAFQAQRAFLLMASQYQQPHENDVAALLKPISEKIQEIQTF 120 

Query 125 TEGKR-SDFFNHLKAACDSLSALAWIAFTGKDCGMSMPIAHVEESWQMAEFYNNKVLVEY 183 

E R S+ FNHL A +S+ AL WIA + K P +V+E A FY N+VL +Y 

Sbjct 121 RERNRGSNMFNHLSAVSESIPALGWIAVSPK------PGPYVKEMNDAATFYTNRVLKDY 174 

Query 184 RNKDADHVEWAKALKELYLPGLREYVKSHYPLGPVWNASGKPASAPA------------K 231 

++ D HV+W K+ ++ L+ Y+K H+ G W+ +G AS + 

Sbjct 175 KHSDLRHVDWVKSYLNIW-SELQAYIKEHHTTGLTWSKTGPVASTVSAFSVLSSGPGLPP 233 

Query 232 GPPGAPAPPPAPLFSAESSKPSSSSNQKQGMSAVFQQLSSG-AVTSGLRKVTDDMKT-KN 289 

PP P P P PLF E K SS ++ SA+F QL+ G A+T GLR VTDD KT KN 

Sbjct 234 PPPPLPPPGPPPLFENEGKKEESSPSR----SALFAQLNQGEAITKGLRHVTDDQKTYKN 289 

Query 290 RADRS-GAVSAVEKETRTSKPAFSKTGP-----PKMELQMGRKWAVENQIGKKDLVISEC 343 

+ R+ G + ++ T P K+ P P +EL+ G+KW VE Q + DLVISE 

Sbjct 290 PSLRAQGGQTQSPTKSHTPSPTSPKSYPSQKHAPVLELE-GKKWRVEYQEDRNDLVISET 348 

Query 344 DSKQSVYIYGCKDSVLQIQGKVNNITIDKCTKVGVVFTDVVAAFEIVNCNNVEVQCQGSA 403 

+ KQ YI+ C+ S +QI+GKVN+I ID C K+G+VF +VV E++N ++++Q G 

Sbjct 349 ELKQVAYIFKCEKSTIQIKGKVNSIIIDNCKKLGLVFDNVVGIVEVINSQDIQIQVMGRV 408 

Query 404 PTVSVDNTTGCQLYLNKDSLETAITTAKSSEINVMVPGATPDGDWVEHALPQQYNHVFTE 463 

PT+S++ T GC +YL++D+L+ I +AKSSE+N+++P DGD+ E +P+Q+ + 

Sbjct 409 PTISINKTEGCHIYLSEDALDCEIVSAKSSEMNILIPQ---DGDYREFPIPEQFKTAWDG 465 

Query 464 GKFETTP 470 

K T P 

Sbjct 466 SKLITEP 472

At4g32700 

MDSDSSKSRIDQFYVSKKRKHQSPNLKSGRNEKNVKVTGERSPGDKGTLDSYLKASLDDKSTTNSGLQARQEAFTRKLDLEVSASSVGQNIHPCLPKPVS 

FATFKECLGQNGSQDLHKEGVAAETHATDGLLCANQKDNSELRDFATSFLSLYCSGVQSVVGSPPHQKENELKRRSSSSSLAQDIQISHKRRCESENIPS 

LDDLTNPLGSKPESLARNGNNRDKPVSDPTKKMPSNESVEIPMGLRKCSKAPESSAHLTEFHTPGSAIKSCPVGTPKSGCGSSMFSPGEAFWNEAIQVAD 

GLTIPIENFGSVEAKVRDQHVTILSCSKKTDKCTEKLERSLDLDEIRVKDKDAIGFSKVVEKHGRDFNKEVYQLPVKNLELLFQDKNINGGIQERCASFD 

QNNITLGSSRISESAFVGNKGCENLDIANNAQADKGLIGKMYPEPEGKKVLLCEENRGVRSVSMISNMRKPVGSSESEESHTPSSSHRNYDGLSLSTWLP 

SEVCSVYNKKGISKLYPWQVECLQVDGVLQKRNLVYCASTSAGKSFVAEVLMLRRVIRTGKMALLVLPYVSICAEKAEHLEVLLEPLGKHVRSYYGNQGG 

GTLPKDTSVAVCTIEKANSLINRLLEEGRLSELGIIVIDELHMVGDQHRGYLLELMLTKLRYAAGEGSSESSSGESSGTSSGKADPAHGLQIVGMSATMP 

NVGAVADWLQAALYQTEFRPVPLEEYIKVGSTIYNKKMEVVRTIPKAADMGGKDPDHIVELCNEVVQEGNSVLIFCSSRKGCESTARHISKLIKNVPVNV 

DGENSEFMDIRSAIDALRRSPSGVDPVLEETLPSGVAYHHAGLTVEEREIVETCYRKGLVRVLTATSTLAAGVNLPARRVIFRQPMIGRDFIDGTRYKQM 

SGRAGRTGIDTKGDSVLICKPGELKRIMALLNETCPPLQSCLSEDKNGMTHAILEVVAGGIVQTAKDIHRYVRCTLLNSTKPFQDVVKSAQDSLRWLCHR 

KFLEWNEETKLYTTTPLGRGSFGSSLCPEESLIVLDDLLRAREGLVMASDLHLVYLVTPINVGVEPNWELYYERFMELSPLEQSVGNRVGVVEPFLMRMA 

HGATVRTLNRPQDVKKNLRGEYDSRHGSTSMKMLSDEQMLRVCKRFFVALILSKLVQEASVTEVCEAFKVARGMVQALQENAGRFSSMVSVFCERLGWHD 

LEGLVAKFQNRVSFGVRAEIVELTSIPYIKGSRARALYKAGLRTSQAIAEASIPEIVKALFESSAWAAEGTGQRRIHLGLAKKIKNGARKIVLEKAEEAR 

AAAFSAFKSLGLDVNELSKPLPLAPASSLNGQETTERDISRGSVGPDGLQQSIEGHMECENFDMDNHREKPSEVLGDATLGVSSEINLTSRLPNFRPIGT 

AVGTNGPSAVSILSSDTFPIPVYDNREIKPKDNVEQHLTRNDHIPLSSNKDGTGEKGPVTAGNISGGFDSFLELWGSAGEFFFDLHYNKLQDLNSRISYE 

IHGIAICWNCSPVYYVNLNKDLPNLECVEKQKLIEDAVIGKSEVLASHNMLDVIKSRWNKISKIMGNVNTRKFTWNLKVQIQVLKSPAISIQRCTRLNLP 

EGIRDELVDGSWLMMPPLHTSHTIDMSIVIWILWPDEERHSNPNIDKEVKKRLSPEAAEAANRSGRWRNQIRRVAHNGCCRRVAQTRALCSALWKILVSE 

ELLQALTTIEMPLVNVLADMELWGIGIDIEGCLRARNILRDKLRSLEKKAFELAGMTFSLHNPADIANVLFGQLKLPIPENQSKGKLHPSTDKHCLDLLR 

NEHPVVPIIKEHRTLAKLLNCTLGSICSLAKLRLSTQRYTLHGRWLQTSTATGRLSIEEPNLQSVEHEVEFKLDKNGRDVSSDADRYKINARDFFVPTQE 

NWLLLTADYSQIELRLMAHFSRDSSLISKLSQPEGDVFTMIAAKWTGKAEDSVSPHDRDQTKRLIYGILYGMGANRLAEQLECTSDEAKEKIRSFKSSFP 

AVTSWLNETISFCQEKGYIQTLKGRRRFLSKIKFGNAKEKSKAQRQAVNSMCQGSAADIIKIAMINIYSAIAEDVDTAASSSSSETRFHMLKGRCRILLQ 

VHDELVLEVDPSYVKLAAMLLQTSMENAVSLLVPLHVKLKVGKTWGSLEPFQTD 

GENE ID: 10721 POLQ | polymerase (DNA directed), theta [Homo sapiens] 




Query 483 PSSSHRNYDGLSLSTW-LPSEVCSVYNKKGISKLYPWQVECLQVDGVLQKRNLVYCASTS 541 

P+ D L L+ W LP V Y+ G+ K++ WQ ECL + VL+ +NLVY A TS 

Sbjct 59 PTVPDYEIDKLLLANWGLPKAVLEKYHSFGVKKMFEWQAECLLLGQVLEGKNLVYSAPTS 118 

Query 542 AGKSFVAEVLMLRRVIRTGKMALLVLPYVSICAEKAEHLEVLLEPLGKHVRSYYGNQGGG 601 

AGK+ VAE+L+L+RV+ K AL +LP+VS+ EK +L+ L + +G V Y G+ 

Sbjct 119 AGKTLVAELLILKRVLEMRKKALFILPFVSVAKEKKYYLQSLFQEVGIKVDGYMGSTSPS 178 

Query 602 TLPKDTSVAVCTIEKANSLINRLLEEGRLSELGIIVIDELHMVGDQHRGYLLELMLTKLR 661 

+AVCTIE+AN LINRL+EE ++ LG++V+DELHM+GD HRGYLLEL+LTK+ 

Sbjct 179 RHFSSLDIAVCTIERANGLINRLIEENKMDLLGMVVVDELHMLGDSHRGYLLELLLTKIC 238 

Query 662 YAAGEGSSESSSGESSGTSSGKADPAHGLQIVGMSATMPNVGAVADWLQAALYQTEFRPV 721 

Y + +S+S ++ SS ++ +QIVGMSAT+PN+ VA WL A LY T+FRPV 

Sbjct 239 YI----TRKSASCQADLASS----LSNAVQIVGMSATLPNLELVASWLNAELYHTDFRPV 290 

Query 722 PLEEYIKVGSTIYNKKMEVVRTIPKAADMGGKDPDHIVELCNEVVQEGNSVLIFCSSRKG 781 

PL E +KVG++IY+ M++VR + G D DH+V LC E + + +SVL+FC S+K 

Sbjct 291 PLLESVKVGNSIYDSSMKLVREFEPMLQVKG-DEDHVVSLCYETICDNHSVLLFCPSKKW 349 

Query 782 CESTARHISKLIKNVPVNVDG------------ENSEFMDIRSAIDALRRSPSGVDPVLE 829 

CE A I++ N+ +G E E +++ +D LRR PSG+D VL+ 

Sbjct 350 CEKLADIIAREFYNLHHQAEGLVKPSECPPVILEQKELLEV---MDQLRRLPSGLDSVLQ 406 

Query 830 ETLPSGVAYHHAGLTVEEREIVETCYRKGLVRVLTATSTLAAGVNLPARRVIFRQPMIGR 889 

+T+P GVA+HHAGLT EER+I+E +R+GL+RVL ATSTL++GVNLPARRVI R P+ G 

Sbjct 407 KTVPWGVAFHHAGLTFEERDIIEGAFRQGLIRVLAATSTLSSGVNLPARRVIIRTPIFGG 466 

Query 890 DFIDGTRYKQMSGRAGRTGIDTKGDSVLICKPGELKRIMALLNETCPPLQSCLS-----E 944 

+D YKQM GRAGR G+DT G+S+LICK E + +ALL + P++SCL E 

Sbjct 467 RPLDILTYKQMVGRAGRKGVDTVGESILICKNSEKSKGIALLQGSLKPVRSCLQRREGEE 526 

Query 945 DKNGMTHAILEVVAGGIVQTAKDIHRYVRCTLL-NSTKPFQDVVKSAQDSLR-------- 995 

M AILE++ GG+ T++D+H Y CT L S K + ++ Q+S++ 

Sbjct 527 VTGSMIRAILEIIVGGVASTSQDMHTYAACTFLAASMKEGKQGIQRNQESVQLGAIEACV 586 

Query 996 -WLCHRKFLEWNE-----ETKLYTTTPLGRGSFGSSLCPEESLIVLDDLLRAREGLVMAS 1049 

WL +F++ E E K+Y T LG + SSL P ++L + DL RA +G V+ + 

Sbjct 587 MWLLENEFIQSTEASDGTEGKVYHPTHLGSATLSSSLSPADTLDIFADLQRAMKGFVLEN 646 

Query 1050 DLHLVYLVTPI-NVGVEPNWELYYERFMELSPLEQSVGNRVGVVEPFLMRMAHGATVRTL 1108 

DLH++YLVTP+ +W ++ + +L + V VGV E FL R G V 

Sbjct 647 DLHILYLVTPMFEDWTTIDWYRFFCLWEKLPTSMKRVAELVGVEEGFLARCVKGKVVART 706 

Query 1109 NRPQDVKKNLRGEYDSRHGSTSMKMLSDEQMLRVCKRFFVALILSKLVQEASVTEVCEAF 1168 

R + + + KRFF +L+L L+ E + E+ + + 

Sbjct 707 ER-------------------------QHRQMAIHKRFFTSLVLLDLISEVPLREINQKY 741 

Query 1169 KVARGMVQALQENAGRFSSMVSVFCERLGWHDLEGLVAKFQNRVSFGVRAEIVELTSIPY 1228 

RG +Q+LQ++A ++ M++VF RLGWH++E L+++FQ R++FG++ E+ +L + 

Sbjct 742 GCNRGQIQSLQQSAAVYAGMITVFSNRLGWHNMELLLSQFQKRLTFGIQRELCDLVRVSL 801 

Query 1229 IKGSRARALYKAGLRTSQAIAEASIPEI 1256 

+ RAR LY +G T +A A+I E+ 

Sbjct 802 LNAQRARVLYASGFHTVADLARANIVEV 829 



Query 1696 ILVSEELLQALTTIEMPLVNVLADMELWGIGIDIEGCLRARNILRDKLRSLEKKAFELAG 1755 

+L E L +EMP LA +EL GIG C ++I++ KL ++E +A++LAG 

Sbjct 2063 LLQKENLQDVFRKVEMPSQYCLALLELNGIGFSTAECESQKHIMQAKLDAIETQAYQLAG 2122 

Query 1756 MTFSLHNPADIANVLFGQLKLP----IPENQSKGKL-----------------HPSTDKH 1794 

+FS + DIA VLF +LKLP + SK L ST K 

Sbjct 2123 HSFSFTSSDDIAEVLFLELKLPPNREMKNQGSKKTLGSTRRGIDNGRKLRLGRQFSTSKD 2182 

Query 1795 CLDLLRNEHPVVPIIKEHRTLAKLLNCTLGSICSLAKLRLSTQRYTLHGRWL-------- 1846 

L+ L+ HP+ +I E R + ++ K+ QR +L 

Sbjct 2183 VLNKLKALHPLPGLILEWRRITN----------AITKVVFPLQREKCLNPFLGMERIYPV 2232

Query 1847 -QTSTATGRLSIEEPNLQSVEHEVEFKLD------------------------KNGRDVS 1881 

Q+ TATGR++ EPN+Q+V + E K+ K G V+ 

Sbjct 2233 SQSHTATGRITFTEPNIQNVPRDFEIKMPTLVGESPPSQAVGKGLLPMGRGKYKKGFSVN 2292 

Query 1882 SD---------ADR---YKINARDFFVPTQENWLLLTADYSQIELRLMAHFSRDSSLISK 1929 

ADR + I+ R FVP +L ADYSQ+ELR++AH S D LI 

Sbjct 2293 PRCQAQMEERAADRGMPFSISMRHAFVPF-PGGSILAADYSQLELRILAHLSHDRRLIQV 2351 

Query 1930 LSQPEGDVFTMIAAKWTGKAEDSVSPHDRDQTKRLIYGILYGMGANRLAEQLECTSDEAK 1989 

L+ DVF IAA+W +SV R Q K++ YGI+YGMGA L EQ+ ++A 

Sbjct 2352 LNTG-ADVFRSIAAEWKMIEPESVGDDLRQQAKQICYGIIYGMGAKSLGEQMGIKENDAA 2410 

Query 1990 EKIRSFKSSFPAVTSWLNETISFCQEKGYIQTLKGRRRFLSKIKFGNAKEKSKAQRQAVN 2049 

I SFKS + + ++ ET+ C+ G++QT+ GRRR+L IK N K+ A+RQA+N 

Sbjct 2411 CYIDSFKSRYTGINQFMTETVKNCKRDGFVQTILGRRRYLPGIKDNNPYRKAHAERQAIN 2470 

Query 2050 SMCQGSAADIIKIAMINIYSAIAEDVDTAASSSSSE----------TRFHMLKGR-CRI- 2097 

++ QGSAADI+KIA +NI + T S E +R L+G C I 

Sbjct 2471 TIVQGSAADIVKIATVNIQKQLETFHSTFKSHGHREGMLQSDRTGLSRKRKLQGMFCPIR 2530 

Query 2098 ----LLQVHDELVLEVDPSYVKLAAMLLQTSMENAVSLLVPLHVKLKVGKTWGSLEPF 2151 

+LQ+HDEL+ EV V A +++ ME+AV L V L VK+K+G +WG L+ F 

Sbjct 2531 GGFFILQLHDELLYEVAEEDVVQVAQIVKNEMESAVKLSVKLKVKVKIGASWGELKDF 2588 

>AT4G38970 

MASTSLLKASPVLDKSEWVKGQSVLFRQPSSASVVLRNRATSLTVRAASSYADELVKTAKTIASPGRGILAMDESNATCGKRLDSIGLENTEANRQAFRT 

LLVSAPGLGQYVSGAILFEETLYQSTTEGKKMVDVLVEQNIVPGIKVDKGLVPLVGSNNESWCQGLDGLSSRTAAYYQQGARFAKWRTVVSIPNGPSALA 

VKEAAWGLARYAAISQDSGLVPIVEPEILLDGEHDIDRTYDVAEKVWAEVFFYLAQNNVMFEGILLKPSMVTPGAESKDRATPEQVAAYTLKLLRNRVPP 

AVPGIMFLSGGQSEVEATLNLNAMNQAPNPWHVSFSYARALQNTCLKTWGGRPENVNAAQTTLLARAKANSLAQLGKYTGEGESEEAKEGMFVKGYTY 

GENE ID: 226 ALDOA | aldolase A, fructose-bisphosphate [Homo sapiens] 




Query 54 ELVKTAKTIASPGRGILAMDESNATCGKRLDSIGLENTEANRQAFRTLLVSAPG-LGQYV 112 

EL A I +PG+GILA DES + KRL SIG ENTE NR+ +R LL++A + + 

Sbjct 69 ELSDIAHRIVAPGKGILAADESTGSIAKRLQSIGTENTEENRRFYRQLLLTADDRVNPCI 128 

Query 113 SGAILFEETLYQSTTEGKKMVDVLVEQNIVPGIKVDKGLVPLVGSNNESWCQGLDGLSSR 172 

G ILF ETLYQ +G+ V+ + V GIKVDKG+VPL G+N E+ QGLDGLS R 

Sbjct 129 GGVILFHETLYQKADDGRPFPQVIKSKGGVVGIKVDKGVVPLAGTNGETTTQGLDGLSER 188 

Query 173 TAAYYQQGARFAKWRTVVSI-PNGPSALAVKEAAWGLARYAAISQDSGLVPIVEPEILLD 231 

A Y + GA FAKWR V+ I + PSALA+ E A LARYA+I Q +G+VPIVEPEIL D 

Sbjct 189 CAQYKKDGADFAKWRCVLKIGEHTPSALAIMENANVLARYASICQQNGIVPIVEPEILPD 248 

Query 232 GEHDIDRTYDVAEKVWAEVFFYLAQNNVMFEGILLKPSMVTPGAESKDRATPEQVAAYTL 291 

G+HD+ R V EKV A V+ L+ +++ EG LLKP+MVTPG + + E++A T+ 

Sbjct 249 GDHDLKRCQYVTEKVLAAVYKALSDHHIYLEGTLLKPNMVTPGHACTQKFSHEEIAMATV 308 

Query 292 KLLRNRVPPAVPGIMFLSGGQSEVEATLNLNAMNQAP--NPWHVSFSYARALQNTCLKTW 349 

LR VPPAV GI FLSGGQSE EA++NLNA+N+ P PW ++FSY RALQ + LK W 

Sbjct 309 TALRRTVPPAVTGITFLSGGQSEEEASINLNAINKCPLLKPWALTFSYGRALQASALKAW 368 

Query 350 GGRPENVNAAQTTLLARAKANSLAQLGKYTGEGES-EEAKEGMFVKGYTY 398 

GG+ EN+ AAQ + RA ANSLA GKYT G++ A E +FV + Y 

Sbjct 369 GGKKENLKAAQEEYVKRALANSLACQGKYTPSGQAGAAASESLFVSNHAY 418 

>AT5G03430 

MEIDKAIGESDDKRLKTKYNNAIFVIKRALALYSIEEVAFSFNGGKDSTVLLHLLRAGYFLHKKEQTCSNGGLSSFPVRTIYFESPSAFTEINAFTYDAA 

QTYNLQLDIIRQDFKSGLEALLKANPIRAIFLGVRIGDPTAVGQEQFSPSSPGWPPFMRVNPILDWSYRDVWAFLLTCKVKYCSLYDQGYTSIGSIHDTV 

PNSLLSVNDTSSKEKFKPAYLLSDGRLERAGRVKKIASLKKDVDTESQKHEVLLASVIAVGDEILSGTVEDQLGLSLCKKLTSVGWSVQQTTVLRNDIDS 

VSEEVDRQRSTSDMVFIYGGVGPLHSDVTLAGVAKAFGVRLAPDEEFEEYLRHLISDQCTGDRNEMAQLPEGITELLHHEKLSVPLIKCRNVIVLAATNT 

EELEKEWECLTELTKLGGGSLIEYSSRRLMTSLTDVEVAEPLSKLGLEFPDIYLGCYRKSRQGPIIICLTGKDNARMDSAAQALRKKFKKDVFVEIK 

GENE ID: 80308 FLAD1 | FAD1 flavin adenine dinucleotide synthetase homolog (S. 

cerevisiae) [Homo sapiens] (10 or fewer PubMed links) 



Query 15 LKTKYNNAIFVIKRALALYSIEEVAFSFNGGKDSTVLLHLLRAGYFLHKKEQTCSNGGLS 74 

L K A+ I+ +LA YS+ ++ FNGGKD T LLHL A + +K N 

Sbjct 279 LGKKVAGALQTIETSLAQYSLTQLCVGFNGGKDCTALLHLFHAA--VQRKLPDVPN---- 332 

Query 75 SFPVRTIYFESPSAFTEINAFTYDAAQTYNLQLDIIRQDFKSGLEALLKANP-IRAIFLG 133 

P++ +Y S S F E+ F D + YNLQ+ K L L +P + A+ +G 

Sbjct 333 --PLQILYIRSISPFPELEQFLQDTIKRYNLQMLEAEGSMKQALGELQARHPQLEAVLMG 390 

Query 134 VRIGDPTAVGQEQFSPSSPGWPPFMRVNPILDWSYRDVWAFLLTCKVKYCSLYDQGYTSI 193 

R DP + FSP+ PGWP FMR+NP+LDW+YRD+W FL V YC LYD+GYTS+

Sbjct 391 TRRTDPYSCSLCPFSPTDPGWPAFMRINPLLDWTYRDIWDFLRQLFVPYCILYDRGYTSL 450 

Query 194 GSIHDTVPNSLLSVNDTSSKEKFKPAYLLSDGRLERAGRV 233 

GS +TV N L ++PAYLL + ER R 

Sbjct 451 GSRENTVRNPALKCLSPGGHPTYRPAYLLENEEEERNSRT 490 



Query 255 ASVIAVGDEILSGTVEDQLGLSLCKKLTSVGWSVQQTTVLRNDIDSVSEEVDRQRSTSDM 314 

A +I VGDEIL G +D LC+ L S+G V + +V+ +++ +++ EV + 

Sbjct 16 AGIIIVGDEILKGHTQDTNTFFLCRTLRSLGVQVCRVSVVPDEVATIAAEVTSFSNRFTH 75 

Query 315 VFIYGGVGPLHSDVTLAGVAKAFGVRLAPDEEFEEYLRHLISDQCTGDRNEMAQLPEGIT 374 

V GG+GP H DVT VA+AFG L P + E + L + +++ +P + 

Sbjct 76 VLTAGGIGPTHDDVTFEAVAQAFGDELKPHPKLEAATKALGGE----GWEKLSLVPS--S 129 

Query 375 ELLHH-------EKLSVPLIKCRNVIVLAATNTEELEKEWECLTELTKLGGGSLIEYSSR 427 

LH+ + PL+ RNV + E L + E + L + +++ S+ 

Sbjct 130 ARLHYGTDPCTGQPFRFPLVSVRNVYLFPGI-PELLRRVLEGMKGLFQ---NPAVQFHSK 185 

Query 428 RLMTSLTDVEVAEPLS--------KLGL-EFPDIYLGCYR------KSRQGPIIICL 469 

L + + +A L+ +LGL +PD Y+ +GP+ CL 

Sbjct 186 ELYVAADEASIAPILAEAQAHFGRRLGLGSYPDWGSNYYQVKLTLDSEEEGPLEECL 242 

>AT5G07650 

MSLVEISGSDAMAAPMPGRVPPPPPRPPPMPRRLPPMFDAFDHTGAGMVWGFPRPAKKRASLKPLHWVKITSDLQGSLWDELQRRHGDSQTAIELDISEL 

ETLFFVEAKPEKIRLHDLRRASYRVFNVRSYYMRANNKVINLSMPLPDMMTAVLAMDESVVDVDQIEKLIKFCPTNEEMELLKTYTGDKAALGKYEQYLL 

ELMKVPRLEAKLRVFSFKTQFGTKITELKERLNVVTSACEEVRSSEKLKEIMKKIPCLGNTSNQGPDRGKSSVVDKNLSFSSGIQLKEIMKKIPCLGNTS 

KSNPRVGVKLDSSVSDTHTVKSMHYYCKVLASEASELLDVYKDLQSLESASKIQVKSLAQNIQAIIKRLEKLKQELTASETDGPASEVFCNTLKDFISIA 

ETEMATVLSLYSVVRKKADALPPYFGEDPNQCPFEQLTMTLFNFIKLFKKAHEENVKQADLEKKKAMKQIDLRRANDTEIMLTKVNIPLADMMAAVLGMD 

EYVLDVDQIENLIRFCPTKEEMELLKNYTGDKATLGKCEQLAKAKAPLKEHFRVINAFPSLTPQYFLEVMKVPGVESKLRAFSFKIQFGTQIAELNKGLN 

AVNSACEEVRTSEKLKEIMANILCMGNILNQGTAEGSAVGFKLKSLLILSDTCAPNSKMTLMHYLCKVLASKASDLLDFHKDLESLESASKIQLKSLAEE 

IQAITKGLEKLNKQLTASESDGPVSQVFRKVLKDFISMAETQVATVSSLYSSVGKNADALAHYFGEDPNHYPFEKVTTTLLSFIRLFKKAHEENVKQADL 

DKNKDAKEAEMEKTK 

GENE ID: 81624 DIAPH3 | diaphanous homolog 3 (Drosophila) [Homo sapiens] 




Query 470 IDLRRANDTEIMLTKVNIPLADMMAAVLGMDEYVLDVDQIENLIRFCPTKEEMELLKNYT 529 

+D + A + I L+ +P ++ +L +DE L I+NLI+ P +E++ L + 

Sbjct 715 LDSKIAQNLSIFLSSFRVPYEEIRMMILEVDETRLAESMIQNLIKHLPDQEQLNSLSQFK 774 

Query 530 GDKATLGKCEQLAKAKAPLKEHFRVINAFPSLTPQYFLEVM-KVPGVESKLRAFSFKIQF 588 

+ + L CE P+ F+ VM V + +L A FK+QF 

Sbjct 775 SEYSNL--CE-----------------------PEQFVVVMSNVKRLRPRLSAILFKLQF 809 

Query 589 GTQIAELNKGLNAVNSACEEVRTSEKLKEIMANILCMGNILNQGTAEGSAVGFKLKSLLI 648 

Q+ + + AV++ACEE++ S+ +++ +L MGN +N G+ GF L SL 

Sbjct 810 EEQVNNIKPDIMAVSTACEEIKKSKSFSKLLELVLLMGNYMNAGSRNAQTFGFNLSSLCK 869 

Query 649 LSDTCAPNSKMTLMHYLCKVLASKASDLLDFHKDLESLESASKIQLKSLAEEIQAITKGL 708 

L DT + + K TL+H+L ++ K D+L+F DLE L+ ASK+ +++L + ++ + + L 

Sbjct 870 LKDTKSADQKTTLLHFLVEICEEKYPDILNFVDDLEPLDKASKVSVETLEKNLRQMGRQL 929 

Query 709 EKLNKQLTASESDGPVSQVFRKVLKDFISMAETQVATVSSLYSSVGKNADALAHYFGEDP 768 

++L K+L + F + F+ A+ Q T+S L+ ++ K ++ Y+ D 

Sbjct 930 QQLEKELETFPPPEDLHDKFVTKMSRFVISAKEQYETLSKLHENMEKLYQSIIGYYAIDV 989 

Query 769 NHYPFEKVTTTLLSFIRLFKKAHEENV 795 

E T L +F F +A +EN+ 

Sbjct 990 KKVSVEDFLTDLNNFRTTFMQAIKENI 1016 



Query 135 ANNKVINLS---MPLPDMMTAVLAMDESVVDVDQIEKLIKFCPTNEEMELLKTYTGDKAA 191 

A N I LS +P ++ +L +DE+ + I+ LIK P E++ L + + + 

Sbjct 720 AQNLSIFLSSFRVPYEEIRMMILEVDETRLAESMIQNLIKHLPDQEQLNSLSQFKSEYSN 779 

Query 192 LGKYEQYLLELMKVPRLEAKLRVFSFKTQFGTKITELKERLNVVTSACEEVRSSEKLKEI 251 

L + EQ+++ + V RL +L FK QF ++ +K + V++ACEE++ S+ ++ 

Sbjct 780 LCEPEQFVVVMSNVKRLRPRLSAILFKLQFEEQVNNIKPDIMAVSTACEEIKKSKSFSKL 839 

Query 252 MKKIPCLGNTSNQGPDRGKSSVVDKNLSFSSGIQLKEIMKKIPCLGNTSKSNPRVGVKLD 311 

++ + +GN N G ++ + SS +LK D 

Sbjct 840 LELVLLMGNYMNAGSRNAQTF----GFNLSSLCKLK-----------------------D 872 

Query 312 SSVSDTHTVKSMHYYCKVLASEASELLDVYKDLQSLESASKIQVKSLAQNIQAIIKRLEK 371 

+ +D T +H+ ++ + ++L+ DL+ L+ ASK+ V++L +N++ + ++L++ 

Sbjct 873 TKSADQKTT-LLHFLVEICEEKYPDILNFVDDLEPLDKASKVSVETLEKNLRQMGRQLQQ 931 

Query 372 LKQELTASETDGPASEVFCNTLKDFISIAETEMATVLSLYSVVRKKADALPPYFGEDPNQ 431 

L++EL + F + F+ A+ + T+ L+ + K ++ Y+ D + 

Sbjct 932 LEKELETFPPPEDLHDKFVTKMSRFVISAKEQYETLSKLHENMEKLYQSIIGYYAIDVKK 991

Query 432 CPFEQLTMTLFNFIKLFKKAHEENV 456 

E L NF F +A +EN+ 

Sbjct 992 VSVEDFLTDLNNFRTTFMQAIKENI 1016 

>AT5G09350 

MQMAQFLSLVRGDSIESPREITSPSNLISESGSNGWLIRFFDSSFFCEWIAVSYLYKHQHSGVRDYLCNRMYTLPLSGIESYLFQICYLMVHKPSPSLDK 

FVIDICAKSLKIALKVHWFLLAELEDSDDNEGISRIQEKCQIAATLVGEWSPLMRPHNEPSTPGSKVLNKFLSSKQKLFSLTLSPPTQKSLLFSPTSGSN 

LQDDGSQLSADDNKIFKRLIPSPKVRDALLFRKSADKEDEECEKDGFFKRLLRDSRGEDDEQRSNSEGFFKRLLKDNKSEEEEISNNSEGFFKRLRSSKG 

DEEELTSSSDGFFKRLLRDNKGDEEELGANSEGFFKKLLRDSKNEDEEPNANTEGFFKKLFHESKNEDDKVSNAVDDEEKDGFLKKLFKEKFDEKRNGNE 

RNETDETVYTDETSGEDNGREGFFKKLFKEKFEDKPNIGKADDGNESEDDESSEFSLFRRLFRRHPEDVKTTLPSENCSNGGFVESSPGTENFFRKLFRD 

RDRSVEDSELFGSKKYKEKCPGSPKPQNNTPSKKPPLPNNTAAQFRKGSYHESLEFVHALCETSYDLVDIFPIEDRKTALRESIAEINSHLAQAETTGGI 

CFPMGRGVYRVVNIPEDEYVLLNSREKVPYMICVEVLKAETPCGAKTTSTSLKLSKGGIPLANGDAFLHKPPPWAYPLSTAQEVYRNSADRMSLSTVEAI 

DQAMTHKSEVKLVNACLSVETHSNSNTKSVSSGVTGVLRTGLESDLEWVRLVLTADPGLRMESITDPKTPRRKEHRRVSSIVAYEEVRAAAAKGEAPPGL 

PLKGAGQDSSDAQPMANGGMLKAGDALSGEFWEGKRLRIRKDSIYGNLPGWDLRSIIVKSGDDCRQEHLAVQLISHFFDIFQEAGLPLWLRPYEVLVTSS 

YTALIETIPDTASIHSIKSRYPNITSLRDFFDAKFKENSPSFKLAQRNFVESMAGYSLVCYLLQIKDRHNGNLLMDEEGHIIHIDFGFMLSNSPGGVNFE 

SAPFKLTRELLEVMDSDAEGLPSEFFDYFKVLCIQGFLTCRKHAERIILLVEMLQDSGFPCFKGGPRTIQNLRKRFHLSLTEEQCVSLVLSLISSSLDAW 

RTRQYDYYQRVLNGIR 

GENE ID: 5298 PI4KB | phosphatidylinositol 4-kinase, catalytic, beta 




Query 830 EFWEGKRLRIRKDSIYGNLPGWDLRSIIVKSGDDCRQEHLAVQLISHFFDIFQEAGLPLW 889 

E W+ K RIR+ S YG+LP W L S+IVK GDD RQE LA Q++ I+++ +PLW 

Sbjct 535 EPWQEKVRRIREGSPYGHLPNWRLLSVIVKCGDDLRQELLAFQVLKQLQSIWEQERVPLW 594 

Query 890 LRPYEVLVTSSYTALIETIPDTASIHSIKSRYPNITSLRDFFDAKFKENSPSFKLAQRNF 949 

++PY++LV S+ + +IE + + SIH +K + ++ L F + +F AQRNF 

Sbjct 595 IKPYKILVISADSGMIEPVVNAVSIHQVK-KQSQLSLLDYFLQEHGSYTTEAFLSAQRNF 653 

Query 950 VESMAGYSLVCYLLQIKDRHNGNLLMDEEGHIIHIDFGFMLSNSPGGVNFESAPFKLTRE 1009 

V+S AGY LVCYLLQ+KDRHNGN+L+D EGHIIHIDFGF+LS+SP + FE++ FKLT E 

Sbjct 654 VQSCAGYCLVCYLLQVKDRHNGNILLDAEGHIIHIDFGFILSSSPRNLGFETSAFKLTTE 713 

Query 1010 LLEVMDSDAEGLPSEFFDYFKVLCIQGFLTCRKHAERIILLVEMLQD-SGFPCFKGGPRT 1068 

++VM GL + F+Y+K+L +QG + RKH ++++ +VE++Q S PCF G T 

Sbjct 714 FVDVMG----GLDGDMFNYYKMLMLQGLIAARKHMDKVVQIVEIMQQGSQLPCFHGS-ST 768 

Query 1069 IQNLRKRFHLSLTEEQCVSLVLSLISSSLDAWRTRQYDYYQRVLNGI 1115 

I+NL++RFH+S+TEEQ LV ++ S+ + T+ YD +Q + NGI 

Sbjct 769 IRNLKERFHMSMTEEQLQLLVEQMVDGSMRSITTKLYDGFQYLTNGI 815 



Query 31 SGSNGWLIRFFDSSFFCEWIAVSYLYKHQHSGVRDYLCNRMYTLPLSGIESYLFQICYLM 90 

S WL+R F+S F +A+SYLY + GV+ Y+ NR++ ++ YL Q+ + 

Sbjct 124 SAKQSWLLRLFESKLFDISMAISYLYNSKEPGVQAYIGNRLFCFRNEDVDFYLPQLLNMY 183 

Query 91 VHK---PSPSLDKFVIDICAKSLKIALKVHWFLLA 122 

+H ++ +++ C +S+ +L+ L A 

Sbjct 184 IHMDEDVGDAIKPYIVHRCRQSINFSLQCALLLGA 218 



Query 555 EFVHALCETSYDLVDIFPIEDRKTALRESIAEINSHLAQAETTGGICFPMGRGVYRVVNI 614 

EF+ +L L + P +++KT + I+E++ L + + P + VV + 

Sbjct 327 EFIKSLMAIGKRLATL-PTKEQKT--QRLISELS--LLNHKLPARVWLPTAGFDHHVVRV 381 

Query 615 PEDEYVLLNSREKVPYMICVEVLKAE 640 

P + V+LNS++K PY+I VEVL+ E 

Sbjct 382 PHTQAVVLNSKDKAPYLIYVEVLECE 407 

>AT5G17380 

MADKSETTPPSIDGNVLVAKSLSHLGVTHMFGVVGIPVTSLASRAMALGIRFIAFHNEQSAGYAASAYGYLTGKPGILLTVSGPGCVHGLAGLSNAWVNT 

WPMVMISGSCDQRDVGRGDFQELDQIEAVKAFSKLSEKAKDVREIPDCVSRVLDRAVSGRPGGCYLDIPTDVLRQKISESEADKLVDEVERSRKEEPIRG 

SLRSEIESAVSLLRKAERPLIVFGKGAAYSRAEDELKKLVEITGIPFLPTPMGKGLLPDTHEFSATAARSLAIGKCDVALVVGARLNWLLHFGESPKWDK 

DVKFILVDVSEEEIELRKPHLGIVGDAKTVIGLLNREIKDDPFCLGKSNSWVESISKKAKENGEKMEIQLAKDVVPFNFLTPMRIIRDAILAVEGPSPVV 

VSEGANTMDVGRSVLVQKEPRTRLDAGTWGTMGVGLGYCIAAAVASPDRLVVAVEGDSGFGFSAMEVETLVRYNLAVVIIVFNNGGVYGGDRRGPEEISG 

PHKEDPAPTSFVPNAGYHKLIEAFGGKGYIVETPDELKSALAESFAARKPAVVNVIIDPFAGAESGRLQHKN 

GENE ID: 26061 HACL1 | 2-hydroxyacyl-CoA lyase 1 [Homo sapiens] 




Query 2 ADKSETTPPSIDGNVLVAKSLSHLGVTHMFGVVGIPVTSLASRAMALGIRFIAFHNEQSA 61 

++ +E + + G ++A++L V ++FG+VGIPVT +A A LGI++I NEQ+A 

Sbjct 4 SNFAERSEEQVSGAKVIAQALKTQDVEYIFGIVGIPVTEIAIAAQQLGIKYIGMRNEQAA 63 

Query 62 GYAASAYGYLTGKPGILLTVSGPGCVHGLAGLSNAWVNTWPMVMISGSCDQRDVGRGDFQ 121 

YAASA GYLT +PG+ L VSGPG +H L G++NA +N WP+++I GS ++ G FQ 

Sbjct 64 CYAASAIGYLTSRPGVCLVVSGPGLIHALGGMANANMNCWPLLVIGGSSERNQETMGAFQ 123 

Query 122 ELDQIEAVKAFSKLSEKAKDVREIPDCVSRVLDRAVSGRPGGCYLDIPTDVLRQKISESE 181 

E Q+EA + ++K S + + IP + + + ++ GRPG CY+DIP D + +++ + 

Sbjct 124 EFPQVEACRLYTKFSARXSSIEAIPFVIEKAVRSSIYGRPGACYVDIPADFVNLQVNVNS 183 

Query 182 ADKLVDEVERSRKEEPIRGSLRSEIESAVSLLRKAERPLIVFGKGAAYSRAEDELKKLVE 241 

+ +ER PI + S + +A S++R A++PL++ GKGAAY+ AE+ +KKLVE 

Sbjct 184 ----IKYMERCMS-PPISMAETSAVCTAASVIRNAKQPLLIIGKGAAYAHAEESIKKLVE 238 

Query 242 ITGIPFLPTPMGKGLLPDTHEFSATAARSLAIGKCDVALVVGARLNWLLHFGESPKWDKD 301 

+PFLPTPMGKG++PD H + AARS A+ DV ++ GARLNW+LHFG P++ D

Sbjct 239 QYKLPFLPTPMGKGVVPDNHPYCVGAARSRALQFADVIVLFGARLNWILHFGLPPRYQPD 298 

Query 302 VKFILVDVSEEEI-ELRKPHLGIVGDAKTVIGLLNREIKDDPFCLGKSNSWVESISKKAK 360 

VKFI VD+ EE+ KP + ++G+ V L E+ P+ + W +++ +K K 

Sbjct 299 VKFIQVDICAEELGNNVKPAVTLLGNIHAVTKQLLEELDKTPWQYPPESKWWKTLREKMK 358 

Query 361 ENGEKMEIQLAKDVVPFNFLTPMRIIRDAILAVEGPSPVVVSEGANTMDVGRSVLVQKEP 420 

N + +K +P N+ T +++ + VVSEGANTMD+GR+VL P 

Sbjct 359 SNEAASKELASKKSLPMNYYTVFYHVQEQLPR----DCFVVSEGANTMDIGRTVLQNYLP 414 

Query 421 RTRLDAGTWGTMGVGLGYCIAAAVASPDR----LVVAVEGDSGFGFSAMEVETLVRYNLA 476 

R RLDAGT+GTMGVGLG+ IAAAV + DR ++ VEGDS FGFS MEVET+ RYNL 

Sbjct 415 RHRLDAGTFGTMGVGLGFAIAAAVVAKDRSPGHWIICVEGDSAFGFSGMEVETICRYNLP 474 

Query 477 VVIIVFNNGGVYGG-DRRGPEEISGPHKEDPA--PTSFVPNAGYHKLIEAFGGKGYIVET 533 

++++V NN G+Y G D +E+ P +PN+ Y +++ AFGGKGY V+T 

Sbjct 475 IILLVVNNNGIYQGFDTDTWKEMLKFQDATAVVPPMCLLPNSHYEQVMTAFGGKGYFVQT 534 

Query 534 PDELKSALAESFA-ARKPAVVNVIIDPFA 561 

P+EL+ +L +S A KP+++N++I+P A 

Sbjct 535 PEELQKSLEQSLADTTKPSLINIMIEPQA 563 

>AT5G19440 

MANSGEGKVVCVTGASGYIASWLVKFLLSRGYTVKASVRDPSDPKKTQHLVSLEGAKERLHLFKADLLEQGSFDSAIDGCHGVFHTASPFFNDAKDPQAE 

LIDPAVKGTLNVLNSCAKASSVKRVVVTSSMAAVGYNGKPRTPDVTVDETWFSDPELCEASKMWYVLSKTLAEDAAWKLAKEKGLDIVTINPAMVIGPLL 

QPTLNTSAAAILNLINGAKTFPNLSFGWVNVKDVANAHIQAFEVPSANGRYCLVERVVHHSEIVNILRELYPNLPLPERCVDENPYVPTYQVSKDKTRSL 

GIDYIPLKVSIKETVESLKEKGFAQF 

GENE ID: 50814 NSDHL | NAD(P) dependent steroid dehydrogenase-like 




Query 3 NSGEGKVVCVTGASGYIASWLVKFLLSRGYTVKA-SVRDPSDPKKTQHLVSLEGAKERLH 61 

N + K V G SG++ +V+ LL+RGY V ++ D ++ 

Sbjct 33 NQNQAKRCTVIGGSGFLGQHMVEQLLARGYAVNVFDIQQGFD-------------NPQVR 79 

Query 62 LFKADLLEQGSFDSAIDGCHGVFHTASPFFNDAKDPQAELIDPAVKGTLNVLNSCAKASS 121 

F DL + A+ G + VFH ASP + + + GT NV+ +C K + 

Sbjct 80 FFLGDLCSRQDLYPALKGVNTVFHCASP--PPSSNNKELFYRVNYIGTKNVIETC-KEAG 136 

Query 122 VKRVVVTSSMAAV--GYNGKPRTPDVTVDETWFSDPELCEASKMWYVLSKTLAEDAAWKL 179 

V+++++TSS + + G + K T D+ +Y +K L E A 

Sbjct 137 VQKLILTSSASVIFEGVDIKNGTEDLPYAMKPID----------YYTETKILQERAVLGA 186 

Query 180 AK-EKGLDIVTINPAMVIGPL---LQPTLNTSA--AAILNLINGAKTFPNLSFGWVNVKD 233 

EK I P + GP L P L +A + +I K + +F V++ 

Sbjct 187 NDPEKNFLTTAIRPHGIFGPRDPQLVPILIEAARNGKMKFVIGNGKNLVDFTF----VEN 242 

Query 234 VANAHIQAFE 243 

V + HI A E 

Sbjct 243 VVHGHILAAE 252 

>AT5G20980 

MGQLALQRLQPLASLPRRPPSLPPPSSATPSLPCATASRRPRFYVARAMSSHIVGYPRIGPKRELKFALESFWDGKTNVDDLQNVAANLRKSIWKHMAHA 

GIKYIPSNTFSYYDQMLDTTAMLGAVPSRYGWESGEIGFDVYFSMARGNASAHAMEMTKWFDTNYHYIVPELGPDVNFSYASHKAVVEFKEAKALGIDTV 

PVLIGPMTYLLLSKPAKGVEKSFCLLSLIDKILPVYKEVLADLKSAGARWIQFDEPILVMDLDTSQLQAFSDAYSHMESSLAGLNVLIATYFADVPAEAY 

KTLMSLKCVTGFGFDLVRGLETLDLIKMNFPRGKLLFAGVVDGRNIWANDLSASLKTLQTLEDIVGKEKVVVSTSCSLLHTAVDLVNEMKLDKELKSWLA 

FAAQKVVEVNALAKSFSGAKDEALFSSNSMRQASRRSSPRVTNAAVQQDVDAVKKSDHHRSTEVSVRLQAQQKKLNLPALPTTTIGSFPQTTDLRRIRRE 

FKAKKISEVDYVQTIKEEYEKVIKLQEELGIDVLVHGEAERNDMVEFFGEQLSGFAFTSNGWVQSYGSRCVKPPIIYGDITRPKAMTVFWSSMAQKMTQR 

PMKGMLTGPVTILNWSFVRNDQPRHETCFQIALAIKDEVEDLEKAGVTVIQIDEAALREGLPLRKSEQKFYLDWAVHAFRITNSGVQDSTQIHTHMCYSN 

FNDIIHSIIDMDADVITIENSRSDEKLLSVFHEGVKYGAGIGPGVYDIHSPRIPSTEEIAERINKMLAVLDSKVLWVNPDCGLKTRNYSEVKSALSNMVA 

AAKLIRSQLNKS 

GENE ID: 550631 CCDC157 | coiled-coil domain containing 157 [Homo sapiens] 


Score = 36.2 bits (82), Expect = 0.13, Method: Composition-based stats. 


Query 10 QPLASLPRRPPSLPP--PSSATPSLPCATASRRP 41 

QP S PR+P + PP P ++ P PC + SR+P 

Sbjct 137 QPCTSPPRQPCTSPPRQPCTSPPRQPCTSPSRQP 170 

>AT5G23680 

MAELQLVEGHQINGGFIPPAIINSIEAPETSAAAGVSVGSKRLRRPSVRLGDIGGDQYHQHVVAAYDSPQVRRPKWRPSGGGGGGGGNRKEPNNQSGKTT 

SSSRTRTMTNLSSGGYENTGTLDEDPVSIGSWRVKKWVKSSGGETAATTTTNTASAKRVRSNWATRNDGVEQGDEKFSGEEEEEEEDEELGGEEGFRDFS

REDSESPMKERRRRYENREVELLGDWQQSGGRGKEGVKIWLQE 

ELGLGRYWPMFEMHEV EVDEQVLPLLTLEDLK KDMGINAVGSRRKMYCAIQKLGREFS 

GENE ID: 800114 

BICC1 | biccaudal 

C homolog g 1 (Drosophila) ) [Homo sapiens] 

(10 or feweer 


Score = 555.5 


matrix 

adjust. 

Identitiess 


= 0/55 (0%) 

Query 238 

Sbjct 881 

>AT5G27380 

MGSGCSSLSYSSSSSTCNATVFSISSSSPSSSSSLKLNPSSFL 

LFQNPKTLRNQSPLRC RCGRSFKMESQKPIFD DLEKLDDEFVQKLVYDALVWSSLHGLVVGDKK 

SYQKSGNVPGVVGLMHAPIALLPTAFPPEAYWKQACNVTPLFN 

NELIDRVSLDGKFLQD QDSLSRTKKVDVFTSR RLLDIHSKMLERNKKEDIRLGLHRFDYMLDEE 

ETNSLLQIEMNNTISCSFPGLSRLVSQQLHQSLLRSYGDQIGI 

IDSERVPINTSTIQFA FADALAKAWLEYSNPR RAVVMVIVQPEERNMY YDQHLLSSILREKHNII 

VVIRKTLAEVEEKEGSVQEDETLIVGGGQAVAVVYFRSGYTPN 

NDHPSESEWNARLLIEEESSAVKCPSIAYHL 

LTGSKKIQQELAKPGV VLERFLDNKEDIAKLRR 

KCFAGLWSLDDDSEIVKQAIEKPGLFVVMKPQREGGGNNIYGD 

DDVRENLLRLQKEGEE EEGNAAYILMQRIFPK KVSNMFLVREGVYHKH HQAISELGVYGAYLRSS 

KDEVIVNEQSGGYLMRTKIASSDEGGVVAAGFGVLDSIYLI 


GSS | glutatthione 

synthetas se [Homo sapienss] 



Score = 3332 


matrix 

adjust. 

Identitiess 


Query 115 

Sbjct 47 

Query 175 

Sbjct 107 

Query 232 

Sbjct 167 

Query 292 

Sbjct 225 

Query 352 

Sbjct 283 

Query 411 

Sbjct 343 

Query 467 

Sbjct 401 

Query 526 

Sbjct 461 

>AT5G35630 

MAQILAASPTCCQMRVPKHSSVIASSSSKLWSSVVLKQKKQSN 

NNKVRGFRVLALQSDN DNSTVNRVETLLNLDT TKPYSDRIIAEYIWIG GGSGIDLRSKSRTIEKK 

PVEDPSELPKWWNYDGSSTGQAPGEDSSEVILYPQAIFRDPFR 

RGGNNILVICDTWTPA PAGEPIPTNKRAKAAE EIFSNKKVSGEVPWFG GIEQEYTLLQQNVKWPP 

LGWPVGAFPGPPQGPYYCGVGADKIWGGRDISDAHYKACLYAG 

GINISGTNGEVMPGQW QWEFQVGPSVGIDAGD DHVWCARYLLERITEQ QAGVVLTLDPKPIEGDD 

WNGAGCHTNYSSTKSMREEGGFEVIKKKAILNLSLRHKEHISA 

AYGEGNERRLTGKHET ETASIDQFSWGVANRG GCSIRVGRDTEAKGKG GYLEDRRPASNMDPYII 

VTSLLAETTLLLWEPTLEAEALAAQKLLSLNV 

pdb|2OJW|C Chain C, CCrystal 

Structur re Of Human Gluttamine 

Synthetas se In Complex 

With Adp Annd 

Phosphate 

12 more seequence 

titles 

Score = 3397 


matrix 

adjust. 

Identitiess 


Query 47 

Sbjct 20 

Query 107 

Sbjct 75 

Query 167 

Sbjct 135 

Query 227 

Sbjct 192 

Query 287 

Sbjct 252 

Query 343 

Sbjct 312 

Query 403 

Sbjct 372 

WLQELGLGRYWPMFFEMHEVDEQVLPLLTL 

LEDLKDMGINAVGSRR RRKMYCAIQKLGR 292 

+LGLG+Y +FF+ 

E+D Q LT +DLK++GI G+RR RRKM AI +L + 

LFSKLGLGKYTDVFFQQQEIDLQTFLTLTD 

DQDLKELGITTFGARR RRKMLLAISELNK 935 

HAPIALLPTAFPEAAYWKQACNVTPLFNEL 

LIDRVSLDGKFLQDSLLSRTKKVDVFTSRLL 

LDI 174 

+AP L P+ P A +QA V FN L+D L VS + FL+ +LLS 

T K D FT+RL DI 

YAPFTLFPSLVPSAALLEQAYAVQMDFNLL 

LVDAVSQNAAFLEQTLLSSTIKQDDFTARLF 

FDI 106 

HSKMLERNKKEDIRRLGLHRFDYMLDEETN 

N---SLLQIEMNTISCCSFPGLSRLVSQLHQ 

QSL 231 

H ++L+ + + LGL+R DYM + +L QIE+NTIS SF GL+ +H+ + 

HKQVLKEGIAQTVFFLGLNRSDYMFQRSAD 

DGSPALKQIEINTISAASFGGLASRTPAVHR 

RHV 166 

LRSYGDQIGIDSERRVPINTSTIQFADALA 

AKAWLEYSNPRAVVMV MVIVQPEERNMYDQHL LLS 291 

L ++ + ++ N + A +A AKAW Y +P A+V++ +I Q +ERN++DQ + 

LSVLSKT--KEAGKKILSNNPSKGLALGIA 

AKAWELYGSPNALVLLLIAQEKERNIFDQRA 

AIE 224 

SILREKHNIVVIRKKTLAEVEKEGSVQEDE 

ETLIVGGQAVAVVYFR FRSGYTPNDHPSESEW WNA 351 

+ L + NI VIR+ +T ++ ++GS+ +D L V GQ +AVVYFR FR GY P + S W A 

NELLAR-NIHVIRRRTFEDISEKGSLDQDR 

RRLFVDGQEIAVVYFR FRDGYMPRQY-SLQNW WEA 282 

RLLIEESSAVKCPSSIAYHLTGSKKIQQEL 

LAKPGVLERFLDNK-EEDIAKLRKCFAGLWSLD 

410 

RLL+E S A KCP IA L G+KK+QQEL L++PG+LE L + E +A+LR FAGL+SLD 

RLLLERSHAAKCPDDIATQLAGTKKVQQEL 

LSRPGMLEMLLPGQPEEAVARLRATFAGLYSLD 

342 

DSE----IVKQAIEEKPGLFVMKPQREGGG 

GNNIYGDDVRENLLRL RLQKEGEEGNAAYILM MQR 466 

E + +A+ P FV+KPQREGGG GNN+YG+++ + L +LL 

K+ EE A+YILM M++ 

VGEEGDQAIAEALAAAPSRFVLKPQREGGG 

GNNLYGEEMVQALKQL QL-KDSEE-RASYILM MEK 400 

IFPKVSNMFLVREGGVYHK-HQAISELGVY 

YGAYLRSKDEVIVNEQQSGYLMRTKIASSDEGG 

525 

I P+ L+R G + Q ISELG++ +G Y+R ++ +++N+ G+L+RTK + GG 

IEPEPFENCLLRPGGSPARVVQCISELGIF 

FGVYVRQEETLVMNKH KHVGHLLRTKAIEHAD DGG 460 

VAAGFGVLDSIY 

VAAG VLD+ Y 

VAAGVAVLDNPY 

537 

472 

FRVLALQSDNSTVNNRVETLLNLDTKPYSD 

DRIIAEYIWIGGSGIDDLRSKSRTIEKPVED 

DPS 106 

F+ +A N + +V L P +++ + A YIWI G+G LR K+RT++ + 

FQSMASSHLNKGIKKQVYMSL-----PQGE 

EKVQAMYIWIDGTGEGGLRCKTRTLDSEPKC 

CVE 74 

ELPKWNYDGSSTGQQAPGEDSEVILYPQAI 

IFRDPFRGGNNILVICCDTWTPAGEPIPTNK 

KRA 166 

ELP+WN+DGSST QQ+ 

G +S++ L P A+ +FRDPFR N LV+CC+ 

+ P TN R 

ELPEWNFDGSSTLQQSEGSNSDMYLVPAAM 

MFRDPFRKDPNKLVLCCEVFKYNRRPAETNL 

LRH 134 

KAAEIFSNKKVSGEEVPWFGIEQEYTLLQQ 

QNVKWPLGWPVGAFPGGPQGPYYCGVGADKIWG 

226 

I VS + PWFG+EQEYTL+ + P GWP FPGGPQGPYYCGVGAD+ 

+G 

TCKRIMD--MVSNQQHPWFGMEQEYTLMGT 

TDGH-PFGWPSNGFPGGPQGPYYCGVGADRA 

AYG 191 

RDISDAHYKACLYAAGINISGTNGEVMPGQ 

QWEFQVGPSVGIDAGD GDHVWCARYLLERITEQA 

286 

RDI +AHY+ACLYAAG+ 

I+GTN EVMP QWEFQ+GP Q 

GI GD GDH+W AR++L R+ E 

RDIVEAHYRACLYAAGVKIAGTNAEVMPAQ 

QWEFQIGPCEGISMGD GDHLWVARFILHRVCEDF 

251 

GVVLTLDPKPIEGDDWNGAGCHTNYSTKSM 

MREEGGFEVIKKAILNNLSLRHKEHISAY---- 

342 

GV+ T DPKPI G+ +WNGAGCHTN+STK+M MREE G + I++AI LS RH+ HI AY 

GVIATFDPKPIPGNNWNGAGCHTNFSTKAM 

MREENGLKYIEEAIEKKLSKRHQYHIRAYDP 

PKG 311 

GEGNERRLTGKHETTASIDQFSWGVANRGC 

CSIRVGRDTEAKGKGY GYLEDRRPASNMDPYIVT 

402 

G N RRLTG HETT++I+ 

FS GVANR SIR+ R + KGY GY EDRRP++N DP+ VT 

GLDNARRLTGFHETTSNINDFSAGVANRSA 

ASIRIPRTVGQEKKGY GYFEDRRPSANCDPFSVT 

371 

SLLAETTLLWE 4413 

L T LL E 

EALIRTCLLNE 3382

AT5G37590 

MSLLRILSTLYYKGTHRTSRSFSSSRNNLICTTFANPLSGKPR 

RISYQNDYGGHRTNLH LHLLDSRLWIILSGQA AAILGFCGNTVLAEDESMKSKSGDNMDESGNN 

TGLEKIEDGSVVVSNIHTSKWRVFTDSSGRDYFFQGKLEPAER 

RLFGSAIQEAKEGFGE GEKDPHVASACNNLAE ELYRVKKEFDKAEPLY YLEAVSILEEFYGPDDD 

VRVGATLHNLGGQLYLVQRKLEEARACCYELKGRVLGYNHPDY 

YAETMYHLGTEKIQMR MRKLLFWILLKYLRHE EGGQGESMAYIRRLRY YLSQIYIRSNRLAEAEE 

KLQRKLLHMMEELSKGWNSMEAITAAEEALALTLRLSGKLGEA 

ALELFEKCLNARKKLL LLPEGHIQIGGNLLHIAKTFMLQASQMRRTDNSEALSKLEKAKNYLL 

ENSARIAKDVLLHKLKNQKSKAQKDEKKSSAALRNYEHAALVI 

ILLQSLESLAALEMSKKNEIHEPKEENLHAA 

AEDSLLQCVTAYKEFG GYGTQLQDSSEVKSEYY 

LSCLKHLSALLLAKKETTLNSKASPISSLPELKEEIKRIDIDL 

LRSQKTG 

GENE ID: 899953 

KLC4 | kineesin 

light chain n 4 [Homo sapienns] 



Score = 76. .3 bits (186), Expect = 1e-13, , Method: Compossitional 

matrix x adjust. 

Identitiess 


Query 130 

Sbjct 144 

Query 190 

Sbjct 204 

Query 246 

Sbjct 264 

Query 294 

Sbjct 316 

Score = 399.3 

bits (90), Expect = 0.014, , Method: Compossitional 


Identitiess 


= 2/70 (2%) 

Query 133 

Sbjct 273 

Query 192 

Sbjct 333 

>AT5G37600 

MSLVSDLINLNNLSDSTDKIIAEYIWVVGGSGMDMRSKARTLP 

PGPVTDPSQLPKWNYD YDGSSTGQAPGEDSEV VILYPQAIFKDPFRRG GNNILVMCDAYTPAGEE 

PIPTNKRHAAAAKVFSNPDVAAEVPWYYGIEQEYTLLQKDVKW 

WPVGWPIGGYPGPQGP GPYYCGIGADKSFGRD DVVDSHYKACLYAGIN NISGINGEVMPGQWEFF 

QVGPAVGISAAADEIWVARYILERITEEIAGVVVSFDPKPIPG 

GDWNGAGAHCNYSTKS KSMREEGGYEIIKKAIDKLGLRHKEHIAAYG 

GEGNERRLTGHHETADD 

INTFLWGVANRRGASIRVGRDTEKEGKKGYFEDRRPASNMDPY 

YIVTSMIAETTILWNP NP 

> gb|EEAW91118.1| 


Length=384 


GLUL | gluttamate-ammonia 

ligase l [Homo sappiens] 



Score = 3397 


matrix 

adjust. 

Identitiess 


Query 17 

Sbjct 24 

Query 77 

Sbjct 84 

Query 137 

Sbjct 142 

Query 197 

Sbjct 201 

Query 257 

Sbjct 261 

Query 313 

Sbjct 321 

YFFQGKLEPAERLFFGSAIQEAKEGFGEKD 

DPHVASACNNLAELYR YRVKKEFDKAEPLYLEAV 

189 

Y QG+ E A L A+++ + G P VA+ N LA +YR YR + ++ +A L + A+ 

YAAQGRYEVAVPLCCKQALEDLERTSGRGH 

HPDVATMLNILALVYR YRDQNKYKEAAHLLND DAL 203 

SILEEFYGPDDVRVVGATLHNLGQLYLVQR 

RKLEEARA----CYELLKGRVLGYNHPDYAETM 

245 

SI E GPD V ATL+NL LY + K +EA E+ ++ +VLG NHPD A+ + 

SIRESTLGPDHPAVVAATLNNLAVLYGKRG 

GKYKEAEPLCQRALEIIREKVLGTNHPDVAK 

KQL 263 

YHL------------GTEKIQMRKLLFWIL 

LLKYLRHEGGQGESMA MAYIRRLR-YLSQIYIRS 

293 

+L 

E+ R L + EG G + R + L+ Y+ + 

NNLALLCQNQGKYEEAVERYYQRALAIY-- 

-------EGQLGPDNP NPNVARTKNNLASCYL LKQ 315 

NRLAEAEKLQRKLLL---HMMEL 

312 

+ AEAE L +++LL 

H+ E 

GKYAEAETLYKEILLTRAHVQEF 

337 

QGKLEPAERLFGSAAIQEAKEGFGEKDPHV 

VASACNNLAELYRVKK KKEFDKAEPLYLEAVSI- 

191 

QGK E ER + AA+ 

+ G +P+V VA NNLA Y + ++ +AE LY E ++ 

QGKYEAVERYYQRAALAIYEGQLGPDNPNV 

VARTKNNLASCYLKQG QGKYAEAETLYKEILTRA 

332 

-LEEFYGPDD 2000 

++EF DD 

HVQEFGSVDD 3442 

glutamate-ammon nia ligase (gluttamine 

synthetase), 

isoform CR RA_b 

DKIIAEYIWVGGSGGMDMRSKARTLPGPVT 

TDPSQLPKWNYDGSSTTGQAPGEDSEVILYP 

PQA 76 

+K+ A YIW+ G+GG 

+R K RTL +LP+WN+DGSSTT 

Q+ G +S++ L P A 

EKVQAMYIWIDGTGGEGLRCKTRTLDSEPK 

KCVEELPEWNFDGSSTTLQSEGSNSDMYLVP 

PAA 83 

IFKDPFRRGNNILVVMCDAYTPAGEPIPTN 

NKRHAAAKVFSNPDVA VAAEVPWYGIEQEYTL LLQ 136 

+F+DPFR+ N LVV+C+ 

+ P TN N RH ++ V+ + PW+G+EQEYTL L+ 

MFRDPFRKDPNKLVVLCEVFKYNRRPAETN 

NLRHTCKRIMDM--VS VSNQHPWFGMEQEYTL LMG 141 

KDVKWPVGWPIGGYYPGPQGPYYCGIGADK 

KSFGRDVVDSHYKACLLYAGINISGINGEVM 

MPG 196 

D P GWP G+ +PGPQGPYYCG+GAD+ +++GRD+V++HY+ACLLYAG+ 

I+G N EVM MP 

TDGH-PFGWPSNGFFPGPQGPYYCGVGADR 

RAYGRDIVEAHYRACLLYAGVKIAGTNAEVM 

MPA 200 

QWEFQVGPAVGISAAADEIWVARYILERIT 

TEIAGVVVSFDPKPIPPGDWNGAGAHCNYSTKS 

256 

QWEFQ+GP GIS D +WVAR+IL R+ E GV+ +FDPKPIPPG+WNGAG 

H N+STK+ 

QWEFQIGPCEGISMMGDHLWVARFILHRVC 

CEDFGVIATFDPKPIPPGNWNGAGCHTNFSTKA 

260 

MREEGGYEIIKKAIIDKLGLRHKEHIAAY- 

----GEGNERRLTGHH HHETADINTFLWGVAN NRG 312 

MREE G + I++AII+KL 

RH+ HI AY G N RRLTG HHET++IN 

F GVAN NR 

MREENGLKYIEEAIIEKLSKRHQYHIRAYD 

DPKGGLDNARRLTGFH FHETSNINDFSAGVAN NRS 320 

ASIRVGRDTEKEGKKGYFEDRRPASNMDPY 

YIVTSMIAETTIL 3353 

ASIR+ R +E KKGYFEDRRP++N 

DP+ + VT + T +L 

ASIRIPRTVGQEKKKGYFEDRRPSANCDPF 

FSVTEALIRTCLL 3361 

>AT5G45340 

MDFSGLFLTLSSAAALFLCLLRFIAGVVRRSSSTKLPLPPGTM 

MGYPYVGETFQLYSQD QDPNVFFAAKQRRYGS SVFKTHVLGCPCVMISSPEAAKFVLVTKSHLL 

FKPTFPASKERRMLGKQAIFFHQGDYHHSKLRKLVLRAFMPDA 

AIRNMVPHIESIAQES ESLNSWDGTQLNTYQE EMKTYTFNVALISILG GKDEVYYREDLKRCYYY 

ILEKGYNSMPIINLPGTLFHKAMKARKKELAQILANILSKRRQ 

QNPSSHTDLLGSFMED EDKAGLTDEQIADNIIGVIFAARDTTASVLTWILKYLADNPTVLEAA 

VTEEQMAIRKDDKKEGESLTWEDTKKMMPLTYRVIQETLRAAT 

TILSFTFREAVEDVEY EYEGYLIPKGWKVLPL LFRNIHHNADIFSDPG GKFDPSRFEVAPKPNTT 

FMPFGSGIHSCCPGNELAKLEISVLIHHHLTTKYRWSIVGPSD 

DGIQYGPFALPQNGLP LPIALERKP 

GENE ID: 566603 

CYP26B1 | ccytochrome 

P450, , family 26, subbfamily 

B, poly ypeptide 1 



links)



Query 1 MDFSGLFLTLSAAALFLCL---------------LRFIAGVRRSSSTKLPLPPGTMGYPY 45 

M F GL L + A L CL LR+ A R S KLP+P G+MG+P 

Sbjct 1 MLFEGLDLVSALATLAACLVSVTLLLAVSQQLWQLRWAA--TRDKSCKLPIPKGSMGFPL 58 

Query 46 VGETFQLYSQDPNVFFAAKQRRYGSVFKTHVLGCPCVMISSPEAAKFVLVTKSHLFKPTF 105 

+GET Q F ++++ +YG+VFKTH+LG P + ++ E + +L+ + HL + 

Sbjct 59 IGETGHWLLQGSG-FQSSRREKYGNVFKTHLLGRPLIRVTGAENVRKILMGEHHLVSTEW 117 

Query 106 PASKERMLGKQAIFFHQGDYHSKLRKLVLRAFMPDAIRNMVPHIESIAQESLNSWDG--T 163 

P S +LG + GD H RK+ + F +A+ + +P I+ + Q++L +W 

Sbjct 118 PRSTRMLLGPNTVSNSIGDIHRNKRKVFSKIFSHEALESYLPKIQLVIQDTLRAWSSHPE 177 

Query 164 QLNTYQEMKTYTFNVALISILGKDEVYYREDLKRCYYILEKGYN---SMPINLPGTLFHK 220 

+N YQE + TF +A+ +LG EDL + + ++ + S+P++LP + + + 

Sbjct 178 AINVYQEAQKLTFRMAIRVLLGFS--IPEEDLGHLFEVYQQFVDNVFSLPVDLPFSGYRR 235 

Query 221 AMKARKELAQILANILSKRRQ-----NPSSHTDLL-GSFMEDKAGLTDEQIADNIIGVIF 274 

++AR+ L + L + ++ Q + S DLL S E +T +++ D + +IF 

Sbjct 236 GIQARQILQKGLEKAIREKLQCTQGKDYSDALDLLIESSKEHGKEMTMQELKDGTLELIF 295 

Query 275 AARDTTASVLTWILKYLADNPTVLEAVTEEQMAIRKDKKEG----ESLTWEDTKKMPLTY 330 

AA TTAS T ++ L +PTVLE + +E A G +L + + 

Sbjct 296 AAYATTASASTSLIMQLLKHPTVLEKLRDELRAHGILHSGGCPCEGTLRLDTLSGLRYLD 355 

Query 331 RVIQETLRAATILSFTFREAVEDVEYEGYLIPKGWKVLPLFRNIHHNADIFSDPGKFDPS 390 

VI+E +R T +S +R ++ E +G+ IPKGW V+ R+ H A +F D FDP 

Sbjct 356 CVIKEVMRLFTPISGGYRTVLQTFELDGFQIPKGWSVMYSIRDTHDTAPVFKDVNVFDPD 415 

Query 391 RFEVAPKPNT-----FMPFGSGIHSCPGNELAKLEISVLIHHLTTKYRWS---------- 435 

RF A + ++PFG G+ +C G LAKL + VL L + R+ 

Sbjct 416 RFSQARSEDKDGRFHYLPFGGGVRTCLGKHLAKLFLKVLAVELASTSRFELATRTFPRIT 475 

Query 436 ---IVGPSDGIQYGPFALPQN 453 

++ P DG+ F L N 

Sbjct 476 LVPVLHPVDGLSVKFFGLDSN 496 

>AT5G48375 

MKFRALGLVLLLAVETCKAEEITCEETKPFTCNQTDRFNRKHFDDDFIFEGGKGRGLNVWDGFTHRYPEKGGPDLGNGDSTCGSYEHWQKDIDVMTELGV 

DGYRFSLAWSRIAPRESNQAGVKYYNDLIDGLLAKNITPFVTLFHWDLPQVLQDEYEGFLNHEIIDDFKDYANLCFKIFGDRVKKWITINQLYTVPTRGY 

AMGTDAPEPYIVAHNQLLAHAKVVHLYRKKYKPKQRGQIGVVMITRWFVPYDSTQANIDATERNKEFFLGWFMEPLTKGKYPDIMRKLVGRRLPKFNKKE 

AKLVKGSYDFLGINYYQTQYVYAIPANPPNRLTVLNDSLSAFSYENKDGPIGPWFNADSYYHPRGILNVLEHFKTKYGNPLVYITENGELLILSGCNVKG 

YFAWCLGDNYELWPSRSFHVSPFYLLHRKDKGAFPSFEA 

GENE ID: 197021 LCTL | lactase-like [Homo sapiens] (10 or fewer PubMed links) 



Query 54 GRGLNVWDGFTHRYPEKGGPDLGN--GDSTCGSYEHWQKDIDVMTELGVDGYRFSLAWSR 111 

G+G ++WD FTH G LGN D C Y Q+DI ++ EL V+ YRFSL+W R 

Sbjct 60 GKGPSIWDVFTH---SGKGKVLGNETADVACDGYYKVQEDIILLRELHVNHYRFSLSWPR 116 

Query 112 IAP-----RESNQAGVKYYNDLIDGLLAKNITPFVTLFHWDLPQVLQDEYEGFLNHEIID 166 

+ P + N+ G+++Y+DLID LL+ NITP VTL HWDLPQ+LQ +Y G+ N + + 

Sbjct 117 LLPTGIRAEQVNKKGIEFYSDLIDALLSSNITPIVTLHHWDLPQLLQVKYGGWQNVSMAN 176 

Query 167 DFKDYANLCFKIFGDRVKKWITINQLYTVPTRGYAMGTDAP-------EPYIVAHNQLLA 219 

F+DYANLCF+ FGDRVK WIT + + +GY G AP Y AH+ + A 

Sbjct 177 YFRDYANLCFEAFGDRVKHWITFSDPRAMAEKGYETGHHAPGLKLRGTGLYKAAHHIIKA 236 

Query 220 HAKVVHLYRKKYKPKQRGQIGVVMITRWFVPYD-STQANIDATERNKEFFLGWFMEPLTK 278 

HAK H Y ++ KQ+G +G+ + W P D S +++A ER +F LGWF P+ 

Sbjct 237 HAKTWHSYNTTWRSKQQGLVGISLNCDWGEPVDISNPKDLEAAERYLQFCLGWFANPIYA 296 

Query 279 GKYPDIMRKLVGR----------RLPKFNKKEAKLVKGSYDFLGINYYQTQYVYAIPANP 328 

G YP +M+ +GR RLP F+ +E +KG+ DFLG+ ++ T+Y+ N 

Sbjct 297 GDYPQVMKDYIGRKSAEQGLEMSRLPVFSLQEKSYIKGTSDFLGLGHFTTRYI--TERNY 354 

Query 329 PNRLTVLNDSLSAFSYENKDGPIG----PWFNADS---YYHPRGILNVLEHFKTKYGNPL 381 

P+R SY+N I W + S Y P G +L +T+YG+P 

Sbjct 355 PSR--------QGPSYQNDRDLIELVDPNWPDLGSKWLYSVPWGFRRLLNFAQTQYGDPP 406 

Query 382 VYITENG------------------------ELL--ILSGCNVKGYFAWCLGDNYE 411 

+Y+ ENG E+L I G N+KGY +W L D +E 

Sbjct 407 IYVMENGASQKFHCTQLCDEWRIQYLKGYINEMLKAIKDGANIKGYTSWSLLDKFE 462 

>AT5G65540 

MALLGDDGRGFDLARKLEVSGVWRTWLGDSIYSSFHHYLSSPSTWEAFMRVDESKSRAQIQLQLRVRALLFDKATVSLFLRSNTIAASSSSSASISDVSS 

VAVSKLNPNYLQLHGDDVYYTLENASLESGFQREGGIRHNPSLTKSLSKPSFTSGTRGSESDFSNLSQRSRFEELPDTWYTQFISRYGFKYGMSVGGQES 

DKRTPEGMSTYLRVVDTHKRKRAPFLEDRSLAHMSRSSTHPSSGFDGSTSEDDILFLPETMFRMNCVPETALSPITRTQDNLKTEFYGVLDTLPQVTTRS 

HIMIERLGLMPEYHRMEERGVLRSRKAEKMGFSDDQAALVSRKVVARMLLTMGFEGATEVPIDVFSQLVSRHMSKLGRILKLLTDSYKKECSAMQLIKMF 

LNTTGYSNLGSLAEIVKDGTRNHPPPNQKQPQVLQQQLHLQQQASLRLPQQIQRQMHPQMQQMVNPQNFQQQQQLERMRRRPVTSPRPNMDMEKDRPLVQ 

VKLENPSEMAVDGNAFNPMNPRHQQQLQQQLRQQQQIAAMSNMQQQPGYNQFRQLASMQIPQMQTPTLGTVRAQPVKVEGFEQLMGGDSSLKHDSDDKLR 

SPPTK 

No significant homologies

ATCG00480 

MRTNPTTSNPEEVSIREKKNLGRIAQIIIGPVLDVAFPPGKMP 

PNIYNALVVKGRDTLG LGQEINVTCEVQQLLG GNNRVRAVAMSATEGL LKRGMDVVDMGNPLSVV 

PVGGATLGRIFFNVLGEPVDNLGPVDTTRTTSPIHKSAPAFIE 

ELDTKLSIFETGIKVV VVDLLAPYRRGGKIGL LFGGAGVGKTVLIMEL LINNIAKAHGGVSVFGG 

GVGERTREGNDDLYMEMKESGVINEQNNLAESKVALVYGQMNE 

EPPGARMRVGLTALTM TMAEYFRDVNEQDVLL LFIDNIFRFVQAGSEV VSALLGRMPSAVGYQPP 

TLSTEMGTLQEERITSTKKGSITSIQAAVYVPADDLTDPAPAT 

TTFAHLDATTVLSRGL GLAAKGIYPAVDPLDS STSTMLQPRIVGEEHY YETAQQVKQTLQRYKEE 

LQDIIAILGLDDELSEEDRLTVARARKKIERFLSQPFFVAEVF 

FTGSPGKYVGLAETIRRGFNLILSGEFDSLP 

PEQAFYLVGNIDEATA AKATNLEMESKLKK 

> ref| |NP_001677.2| 

GENE ID: 5506 

ATP5B | ATP synthase, H+ tr ransporting, mittochondrial 

F1 complex, 

beta polypeeptide 

[Homo sappiens] 


Score = 6667 

bits (1721), , Expect = 0.0, , Method: Compossitional 


Identitiess 


Query 1 

Sbjct 33 

Query 53 

Sbjct 92 

Query 113 

Sbjct 147 

Query 173 

Sbjct 207 

Query 233 

Sbjct 266 

Query 293 

Sbjct 326 

Query 353 

Sbjct 386 

Query 413 

Sbjct 446 

Query 473 

Sbjct 506 

MRTNPTTSNP---------EVSIREKKNLG 

GRIAQIIGPVLDVAFP FPPGKMPNIYNALVVK KGR 52 

+R PT +P 

S + GRI G +IG V+DV F G +P I NAL V+ GR 

LRAAPTAVHPVRDYYAAQTSPSPKAGAATG 

GRIVAVIGAVVDVQFD FDEG-LPPILNALEVQ QGR 91 

DTLGQEINVTCEVQQQLLGNNRVRAVAMSA 

ATEGLKRGMDVVDMGN GNPLSVPVGGATLGRIFN 

112 

+T + EV Q LG + VR +AM TEGL RG V+D G P+ +PVG TLGRI N 

ET-----RLVLEVAAQHLGESTVRTIAMDG 

GTEGLVRGQKVLDSGA GAPIKIPVGPETLGRIMN 

146 

VLGEPVDNLGPVDTTRTTSPIHKSAPAFIE 

ELDTKLSIFETGIKVV VVDLLAPYRRGGKIGL LFG 172 

V+GEP+D GP+ TT+ 

+PIH AP F+E E+ + I TGIKVV VVDLLAPY +GGKIGL LFG 

VIGEPIDERGPIKTTKQFAPIHAEAPEFME 

EMSVEQEILVTGIKVV VVDLLAPYAKGGKIGL LFG 206 

GAGVGKTVLIMELIINNIAKAHGGVSVFGG 

GVGERTREGNDLYMEMMKESGVINEQNLAESKV 

232 

GAGVGKTVLIMELIINN+AKAHGG 

SVF GVGERTREGNDLY G 

EMM 

ESGVIN ++ A SKV 

GAGVGKTVLIMELIINNVAKAHGGYSVFAG 

GVGERTREGNDLYHEMMIESGVINLKD-ATSKV 

265 

ALVYGQMNEPPGARRMRVGLTALTMAEYFR 

RDVNEQDVLLFIDNIFFRFVQAGSEVSALLG 

GRM 292 

ALVYGQMNEPPGARR 

RV LT LT+AEYFR RD QDVLLFIDNIFFRF 

QAGSEVSALLG GR+ 

ALVYGQMNEPPGARRARVALTGLTVAEYFR 

RDQEGQDVLLFIDNIFFRFTQAGSEVSALLG 

GRI 325 

PSAVGYQPTLSTEMMGTLQERITSTKKGSI 

ITSIQAVYVPADDLTDDPAPATTFAHLDATTVL 

352 

PSAVGYQPTL+T+MMGT+QERIT+TKKGSI 

ITS+QA+YVPADDLTDDPAPATTFAHLDATTVL 

PSAVGYQPTLATDMMGTMQERITTTKKGSI 

ITSVQAIYVPADDLTDDPAPATTFAHLDATTVL 

385 

SRGLAAKGIYPAVDDPLDSTSTMLQPRIVG 

GEEHYETAQQVKQTLQQRYKELQDIIAILGL 

LDE 412 

SR +A GIYPAVDDPLDSTS 

++ P IVG G EHY+ A+ V++ LQQ 

YK LQDIIAILG+ DE 

SRAIAELGIYPAVDDPLDSTSRIMDPNIVG 

GSEHYDVARGVQKILQQDYKSLQDIIAILGM 

MDE 445 

LSEEDRLTVARARKKIERFLSQPFFVAEVF 

FTGSPGKYVGLAETIRRGFNLILSGEFDSLP 

PEQ 472 

LSEED+LTV+RARKKI+RFLSQPF 

VAEVF FTG GK V L ETI+ +GF IL+GE+D LP PEQ 

LSEEDKLTVSRARKKIQRFLSQPFQVAEVF 

FTGHMGKLVPLKETIKKGFQQILAGEYDHLP 

PEQ 505 

AFYLVGNIDEATAKKATNLEME 

493 

AFY+VG I+EA AKKA 

L E 

AFYMVGPIEEAVAKKADKLAEE 

526 

>ATCG00490 

MSPQTETKASVVGFKAGVKEYKLTYYTTPEYETKDTDILAAFR 

RVTPQPGVPPEEAGAA AAVAAESSTGTWTTVW WTDGLTSLDRYKGRCY YHIEPVPGEETQFIAYY 

VAYPLDLFEEGGSVTNMFTSIVGNVFGGFKALAALRLEDLRIP 

PPAYTKTFQGPPHGIQQVERDKLNKYGRPLL 

LGCTIKPKLGLSAKNY YGRAVYECLRGGLDFTT 

KDDENVNSQPFFMRWRDRFLFCAEAIYYKSQAETGEIKGHYLN 

NATAGTCEEMIKRAVF VFARELGVPIVMHDYL LTGGFTANTSLSHYCR RDNGLLLHIHRAMHAVV 

IDRQKNHGMHFFRVLAKALRLSGGDHIIHAGTVVGKLEGDRES 

STLGFVDLLRDDYVEK EKDRSRGIFFTQDWVS SLPGVLPVASGGIHVW WHMPALTEIFGDDSVLL 

QFGGGTLGHPWWGNAPGAVANRVALEAACVQARNEGRDLAVEG 

GNEIIREACKWSPELA LAAACEVWKEITFNFP PTIDKLDGQE 


homologies to human protei ins 

ATP synth hase subunit betta, 

mitochondria al precursor [Ho omo sapiens]

Text S1: Protein sequences and alignments of all proteins found in ...

Create successful ePaper yourself

Delete template?

Save as template?