13.07.2013 Visualizaciones

Descargue nuestro catálogo de productos y servicios. - SIE

Descargue nuestro catálogo de productos y servicios. - SIE

Descargue nuestro catálogo de productos y servicios. - SIE

SHOW MORE
SHOW LESS

¡Convierta sus PDFs en revista en línea y aumente sus ingresos!

Optimice sus revistas en línea para SEO, use backlinks potentes y contenido multimedia para aumentar su visibilidad y ventas.

El éxito <strong>de</strong> los equipos Sie Ladón se basa en la experiencia que nos han transmitido <strong>nuestro</strong>s clientes. Esto conjuntamente<br />

con el acuerdo <strong>de</strong> I+D con el Instituto Rocasolano, nos ha permitido <strong>de</strong>sarrollar sistemas que han fortalecido <strong>nuestro</strong>s clústeres<br />

y máquinas <strong>de</strong> cálculo que ofrecemos. Todos ellos están basados sobre código abierto Linux y plataformas estándar, lo que<br />

permite reducir a los investigadores los costes <strong>de</strong> propiedad. Entre ellos cabe <strong>de</strong>stacar:<br />

SISTEMAS DE CONTROL<br />

<strong>SIE</strong> NETEMPERATURE<br />

Basado en un pequeño dispositivo<br />

hardware, que dispone <strong>de</strong> una<br />

sonda <strong>de</strong> temperatura<br />

in<strong>de</strong>pendiente <strong>de</strong>l propio cluster, se<br />

establecen dos niveles <strong>de</strong> alerta:<br />

Nivel A: Puesto que el clúster no<br />

<strong>de</strong>be superar los 25º C, cuando<br />

llega a esta temperatura, que se<br />

consi<strong>de</strong>ra anormal en una sala<br />

refrigerada, el sistema avisa<br />

mediante email o sms al operador<br />

<strong>de</strong> esta subida. El sistema no se<br />

<strong>de</strong>tiene.<br />

Nivel B: Si llega a los 35º C, el<br />

servidor lanza a los nodos un script<br />

<strong>de</strong> apagado. Pasados unos<br />

minutos, se apaga a sí mismo,<br />

<strong>de</strong>jando un log <strong>de</strong> la temperatura<br />

máxima alcanzada. De esta forma<br />

se salvaguarda la integridad <strong>de</strong>l<br />

sistema hasta que sea arrancado<br />

por un operador, no produciéndose<br />

ninguna pérdida <strong>de</strong> datos en los<br />

cálculos que se encontraba<br />

realizando.<br />

El sistema es autónomo con<br />

acceso mediante una IP. Se pue<strong>de</strong><br />

gestionar vía web o integrado en<br />

una consola <strong>de</strong> alertas SNMP. Este<br />

sistema se i<strong>de</strong>ó porque <strong>nuestro</strong>s<br />

ingenieros <strong>de</strong>scubrieron que en la<br />

mayoría <strong>de</strong> los casos, al irse la luz,<br />

los servidores seguían<br />

funcionando normalmente, gracias<br />

a las SAI. No así, los sistemas <strong>de</strong><br />

aire acondicionado; a<strong>de</strong>más al<br />

restituirse la energía eléctrica, no<br />

son rearmados <strong>de</strong> forma<br />

automática. Adicionalmente las<br />

averías en aires acondicionados<br />

son mucho más habituales que en<br />

los sistemas <strong>de</strong> alta tecnología<br />

CONECTIVIDAD CLUSTER<br />

Los clústeres <strong>SIE</strong> utilizan dos re<strong>de</strong>s<br />

in<strong>de</strong>pendientes e internas, una<br />

para datos y otra para cálculos<br />

(mejorando así el rendimiento en<br />

cálculos paralelos).<br />

En la red <strong>de</strong> datos se usa<br />

tecnología Gigabit para obtener<br />

buen rendimiento en el volumen <strong>de</strong><br />

datos a mover. En la red <strong>de</strong> cálculo,<br />

hemos implementado dos<br />

tecnologías <strong>de</strong>pendiendo <strong>de</strong> las<br />

necesida<strong>de</strong>s <strong>de</strong>l cliente:<br />

GESTIÓN REMOTA IPMI<br />

La gestión remota <strong>de</strong>l cluster y NAS<br />

mediante alertas por e-mail y KVM<br />

over LAN, permiten actuaciones<br />

proactivas antes <strong>de</strong> que se<br />

produzca la avería y caída <strong>de</strong>l<br />

sistema. <strong>SIE</strong> entrega sin costo<br />

adicional para el cliente, un<br />

software <strong>de</strong> gestión que permite<br />

<strong>de</strong>s<strong>de</strong> máquinas Windows y Linux<br />

gestionar más <strong>de</strong> 200 nodos, con<br />

20 sesiones concurrentes <strong>de</strong><br />

monitorización.<br />

PROTOCOLO GM2 (Myrinet)<br />

sobre Gigabit<br />

Hemos realizado una<br />

implementación sobre código<br />

abierto, que nos permite usar el<br />

protocolo <strong>de</strong> baja latencia GM2<br />

sobre hardware Gigabit y 10<br />

Gigabit. Esta solución es i<strong>de</strong>al para<br />

pequeños sistemas HPC, dado que<br />

no incrementamos el coste <strong>de</strong><br />

propiedad, que supone la<br />

adquisición <strong>de</strong> hardware <strong>de</strong> re<strong>de</strong>s<br />

<strong>de</strong> baja latencia. Nuestros<br />

ingenieros han comprobado que<br />

este sistema es i<strong>de</strong>al para la<br />

paralelización entre 3-4 nodos, que<br />

para muchos investigadores es<br />

suficiente. A<strong>de</strong>más, esta solución<br />

es muy interesante para muchos<br />

<strong>de</strong>partamentos que tienen acceso<br />

a centros <strong>de</strong> supercomputación y<br />

para los cuales ya tienen<br />

<strong>de</strong>sarrollados programas para<br />

tecnología Myrinet. Este protocolo<br />

reduce el tiempo <strong>de</strong> latencia a 5-6<br />

milisegundos frente a los 60 ms <strong>de</strong>l<br />

protocolo TCP/IP, permitiendo usar<br />

la paralelización basada en MPICH<br />

con la solución <strong>de</strong> colas Torque que<br />

implementamos.<br />

INFINIBAND<br />

Sistemas Informáticos Europeos<br />

suministra la tecnología Infiniband<br />

<strong>de</strong> IV generación, con anchos <strong>de</strong> 20<br />

y 40 Gb/s en modo 4x, 8x y 12x,<br />

compatible con la anterior <strong>de</strong> 10<br />

Gb/s. Actualmente es el sistema <strong>de</strong><br />

mayor ancho <strong>de</strong> banda y lí<strong>de</strong>r en<br />

cálculo científico. Aporta tiempos<br />

teóricos <strong>de</strong> latencia <strong>de</strong> 160ns; los<br />

reales están en torno a los 4-5 ms.<br />

Este sistema <strong>de</strong> intercomunicación,<br />

pensado principalmente para<br />

clústeres <strong>de</strong> mediano y gran<br />

tamaño, nos permite ofertar<br />

soluciones <strong>de</strong> gama alta <strong>de</strong> 36 a<br />

648 puertos.<br />

GM2<br />

La solución <strong>de</strong> GM2 sobre Gigabit<br />

ha sido el último <strong>de</strong>sarrollo <strong>de</strong> I+D<br />

entre el CSIC y los ingenieros <strong>de</strong><br />

Sistemas Informáticos Europeos.<br />

Basado todo el sobre plataforma<br />

abierta y libre <strong>de</strong> royalties, permite<br />

usar a los investigadores re<strong>de</strong>s <strong>de</strong><br />

baja latencia a coste cero.<br />

Basado en el “Myricom's Myrinet<br />

Express protocol”, permite que<br />

todas las API implementadas sobre<br />

los sistemas Myrinet <strong>de</strong> hardware<br />

propietario, puedan ser usadas<br />

sobre esta plataforma Gigabit<br />

utilizada en los sistemas <strong>SIE</strong> Ladón<br />

y sobre las tarjetas 10G que nuestra<br />

empresa comercializa. Proporciona<br />

alto rendimiento <strong>de</strong> paso <strong>de</strong><br />

mensajes y compatibilidad MPI, sin<br />

costes hardware adicionales.<br />

Las pruebas realizas por nuestra<br />

empresa <strong>de</strong>muestran que el<br />

protocolo Open-Mx obtiene un gran<br />

rendimiento sobre re<strong>de</strong>s 10G, pero<br />

sobre re<strong>de</strong>s 1000 Mbps, solo es<br />

a<strong>de</strong>cuado para paralelizar entre un<br />

máximo <strong>de</strong> 4 nodos, lo que le hace<br />

i<strong>de</strong>o para clúster pequeños.

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!