15.11.2014 Views

Predicción de la estructura secundaria de proteínas mediante ...

Predicción de la estructura secundaria de proteínas mediante ...

Predicción de la estructura secundaria de proteínas mediante ...

SHOW MORE
SHOW LESS

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

TÍTULO DEL PROYECTO:<br />

Predicción <strong>de</strong> <strong>la</strong> <strong>estructura</strong> <strong>secundaria</strong> <strong>de</strong> proteínas <strong>mediante</strong><br />

autómatas celu<strong>la</strong>res.<br />

CLASE DE PROYECTO: Investigación y Desarrollo<br />

DIRECTOR: José Santos Reyes (Despacho 403), santos@udc.es<br />

BREVE DESCRIPCIÓN:<br />

La <strong>de</strong>terminación <strong>de</strong> <strong>la</strong> <strong>estructura</strong> <strong>de</strong> proteínas a partir <strong>de</strong> <strong>la</strong> secuencia primaria <strong>de</strong> aminoácidos,<br />

proveniente <strong>de</strong> <strong>la</strong> información genética en el ADN codificador, es <strong>de</strong> enorme importancia. La<br />

<strong>estructura</strong> <strong>secundaria</strong> <strong>de</strong> una proteína <strong>de</strong>termina cómo se pliega <strong>la</strong> ca<strong>de</strong>na <strong>de</strong> aminoácidos formando<br />

hélices u otras <strong>estructura</strong>s regu<strong>la</strong>res. Estas <strong>estructura</strong>s regu<strong>la</strong>res se pliegan finalmente en una<br />

<strong>estructura</strong> final o terciaria.<br />

Este proyecto se centra en <strong>la</strong> predicción <strong>de</strong> los elementos <strong>de</strong> <strong>la</strong> <strong>estructura</strong> <strong>secundaria</strong> a partir <strong>de</strong> <strong>la</strong><br />

secuencia <strong>de</strong> aminoácidos <strong>de</strong> <strong>la</strong> ca<strong>de</strong>na proteínica. La predicción se realizará con esquemas <strong>de</strong><br />

autómatas celu<strong>la</strong>res (AC), utilizados en el campo <strong>de</strong> vida artificial para el estudio <strong>de</strong>l<br />

comportamiento emergente [6]. El plegado proteínico en los niveles secundario y terciario es un<br />

ejemplo <strong>de</strong> proceso dinámico y emergente. El AC actuará sobre cada aminoácido <strong>de</strong> <strong>la</strong> ca<strong>de</strong>na<br />

proteínica, consi<strong>de</strong>rando una ventana <strong>de</strong> aminoácidos vecinos centrada en aquél al que se le aplica<br />

el AC. El AC actúa sobre todos los aminoácidos <strong>de</strong> <strong>la</strong> ca<strong>de</strong>na <strong>de</strong> una proteína y se repite el<br />

procedimiento varias iteraciones en el tiempo. Los valores <strong>de</strong> <strong>de</strong>terminados bits/posiciones <strong>de</strong> <strong>la</strong><br />

iteración <strong>de</strong>l AC se eligen para <strong>de</strong>terminar <strong>la</strong>s posibles <strong>estructura</strong>s <strong>secundaria</strong>s. Se consi<strong>de</strong>rarán<br />

hélices (H), láminas beta (B) y restos (C).<br />

Para <strong>la</strong> obtención automática <strong>de</strong>l AC se recurrirá a algoritmos evolutivos y, en concreto, se usará<br />

Evolución Diferencial (ED), como método robusto y con ventajas contrastadas respecto a otros<br />

métodos evolutivos [4][3][7]. El AC se evalúa sobre conjuntos <strong>de</strong> entrenamiento benchmark con<br />

ca<strong>de</strong>nas <strong>de</strong> aminoácidos con <strong>estructura</strong> <strong>secundaria</strong> conocida, y esa evaluación <strong>de</strong>termina un fitness<br />

que se retorna al método evolutivo <strong>de</strong> ED.<br />

En eses objetivos generales se experimentará en los siguientes aspectos:<br />

• Codificaciones binarias a<strong>de</strong>cuadas para cada uno <strong>de</strong> los 20 aminoácidos.<br />

• Codificación genotípica <strong>de</strong> <strong>la</strong>s reg<strong>la</strong>s <strong>de</strong> los diferentes autómatas celu<strong>la</strong>res.<br />

• Experimentación con diferentes vecinda<strong>de</strong>s en los ACs.


• Experimentación con secuencias <strong>de</strong> benchmark: base <strong>de</strong> proteínas con el conjunto <strong>de</strong><br />

entrenamiento Rost-San<strong>de</strong>r <strong>de</strong> 126 proteínas no homólogas [5] y el conjunto <strong>de</strong> entrenamiento<br />

CB 513 [1].<br />

• Experimentación con los “parámetros Chou-Fasman” [1] que <strong>de</strong>terminan <strong>la</strong> propensión <strong>de</strong> cada<br />

aminoácido a formar parte <strong>de</strong> cada posible <strong>estructura</strong> <strong>secundaria</strong> [1]. Extensión <strong>de</strong>l mo<strong>de</strong>lo para<br />

incluir mo<strong>de</strong>los neuronales sencillos que <strong>de</strong>terminen <strong>la</strong>s reg<strong>la</strong>s <strong>de</strong>l AC y, en este caso, <strong>la</strong><br />

propensión <strong>de</strong>l aminoácido central a formar una <strong>de</strong>terminada <strong>estructura</strong> <strong>secundaria</strong>.<br />

• Definición <strong>de</strong> un módulo gráfico que muestre <strong>la</strong> evolución temporal <strong>de</strong>l AC en <strong>la</strong>s diferentes<br />

versiones, junto con un interfaz para <strong>de</strong>terminar los parámetros <strong>de</strong>finitorios <strong>de</strong>l AC y método<br />

evolutivo.<br />

[1] Chou, P.Y. and Fasman, G.D. (1974), “Prediction of protein conformation”, Biochemistry<br />

13:222-245.<br />

[1] Chopra, P. and Ben<strong>de</strong>r, A. (2006), “Evolved cellu<strong>la</strong>r automata for protein secondary<br />

structure prediction imitate the <strong>de</strong>terminants for folding observed in nature”, In Silico<br />

Biology 7(1):87-93.<br />

[2] Cuff, J.A. and Barton, G.J. (1999), “Evaluation and improvement of multiple sequence<br />

methods for protein secondary structure prediction”, Proteins 34:508-519.<br />

[3] Novo, J., Santos, J. and Penedo, M.G. (2011), “Optimization of topological active<br />

<strong>de</strong>formable mo<strong>de</strong>ls with differential evolution”, Proc. ICANNGA 2011- International<br />

Conference on Adaptive and Natural Computing Algorithms, Ljubljana-Slovenia.<br />

[4] Price, K.V., Storn, R.M. and Lampinen, J.A. (2005), Differential evolution - A practical<br />

approach to global optimization, Springer-Ver<strong>la</strong>g.<br />

[5] Rost, B. and San<strong>de</strong>r, C. (1993), “Prediction of secondary structure at better than 70%<br />

accuracy”, J. Mol. Biol. 232:584-599.<br />

[6] Santos, J. (2007), Vida Artificial. Realizaciones Computacionales. Servicio <strong>de</strong> Publicaciones<br />

Universidad <strong>de</strong> A Coruña.<br />

[7] Santos, J. and Diéguez, M. (2011), “Differential evolution for protein structure prediction<br />

using the HP mo<strong>de</strong>l”, IWANN 2011, 4th. International Work-conference on the Interp<strong>la</strong>y<br />

between Natural and Artificial Computation.<br />

Programación: C.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!