Descargue nuestro catálogo de productos y servicios. - SIE
Descargue nuestro catálogo de productos y servicios. - SIE
Descargue nuestro catálogo de productos y servicios. - SIE
¡Convierta sus PDFs en revista en línea y aumente sus ingresos!
Optimice sus revistas en línea para SEO, use backlinks potentes y contenido multimedia para aumentar su visibilidad y ventas.
El éxito <strong>de</strong> los equipos Sie Ladón se basa en la experiencia que nos han transmitido <strong>nuestro</strong>s clientes. Esto conjuntamente<br />
con el acuerdo <strong>de</strong> I+D con el Instituto Rocasolano, nos ha permitido <strong>de</strong>sarrollar sistemas que han fortalecido <strong>nuestro</strong>s clústeres<br />
y máquinas <strong>de</strong> cálculo que ofrecemos. Todos ellos están basados sobre código abierto Linux y plataformas estándar, lo que<br />
permite reducir a los investigadores los costes <strong>de</strong> propiedad. Entre ellos cabe <strong>de</strong>stacar:<br />
SISTEMAS DE CONTROL<br />
<strong>SIE</strong> NETEMPERATURE<br />
Basado en un pequeño dispositivo<br />
hardware, que dispone <strong>de</strong> una<br />
sonda <strong>de</strong> temperatura<br />
in<strong>de</strong>pendiente <strong>de</strong>l propio cluster, se<br />
establecen dos niveles <strong>de</strong> alerta:<br />
Nivel A: Puesto que el clúster no<br />
<strong>de</strong>be superar los 25º C, cuando<br />
llega a esta temperatura, que se<br />
consi<strong>de</strong>ra anormal en una sala<br />
refrigerada, el sistema avisa<br />
mediante email o sms al operador<br />
<strong>de</strong> esta subida. El sistema no se<br />
<strong>de</strong>tiene.<br />
Nivel B: Si llega a los 35º C, el<br />
servidor lanza a los nodos un script<br />
<strong>de</strong> apagado. Pasados unos<br />
minutos, se apaga a sí mismo,<br />
<strong>de</strong>jando un log <strong>de</strong> la temperatura<br />
máxima alcanzada. De esta forma<br />
se salvaguarda la integridad <strong>de</strong>l<br />
sistema hasta que sea arrancado<br />
por un operador, no produciéndose<br />
ninguna pérdida <strong>de</strong> datos en los<br />
cálculos que se encontraba<br />
realizando.<br />
El sistema es autónomo con<br />
acceso mediante una IP. Se pue<strong>de</strong><br />
gestionar vía web o integrado en<br />
una consola <strong>de</strong> alertas SNMP. Este<br />
sistema se i<strong>de</strong>ó porque <strong>nuestro</strong>s<br />
ingenieros <strong>de</strong>scubrieron que en la<br />
mayoría <strong>de</strong> los casos, al irse la luz,<br />
los servidores seguían<br />
funcionando normalmente, gracias<br />
a las SAI. No así, los sistemas <strong>de</strong><br />
aire acondicionado; a<strong>de</strong>más al<br />
restituirse la energía eléctrica, no<br />
son rearmados <strong>de</strong> forma<br />
automática. Adicionalmente las<br />
averías en aires acondicionados<br />
son mucho más habituales que en<br />
los sistemas <strong>de</strong> alta tecnología<br />
CONECTIVIDAD CLUSTER<br />
Los clústeres <strong>SIE</strong> utilizan dos re<strong>de</strong>s<br />
in<strong>de</strong>pendientes e internas, una<br />
para datos y otra para cálculos<br />
(mejorando así el rendimiento en<br />
cálculos paralelos).<br />
En la red <strong>de</strong> datos se usa<br />
tecnología Gigabit para obtener<br />
buen rendimiento en el volumen <strong>de</strong><br />
datos a mover. En la red <strong>de</strong> cálculo,<br />
hemos implementado dos<br />
tecnologías <strong>de</strong>pendiendo <strong>de</strong> las<br />
necesida<strong>de</strong>s <strong>de</strong>l cliente:<br />
GESTIÓN REMOTA IPMI<br />
La gestión remota <strong>de</strong>l cluster y NAS<br />
mediante alertas por e-mail y KVM<br />
over LAN, permiten actuaciones<br />
proactivas antes <strong>de</strong> que se<br />
produzca la avería y caída <strong>de</strong>l<br />
sistema. <strong>SIE</strong> entrega sin costo<br />
adicional para el cliente, un<br />
software <strong>de</strong> gestión que permite<br />
<strong>de</strong>s<strong>de</strong> máquinas Windows y Linux<br />
gestionar más <strong>de</strong> 200 nodos, con<br />
20 sesiones concurrentes <strong>de</strong><br />
monitorización.<br />
PROTOCOLO GM2 (Myrinet)<br />
sobre Gigabit<br />
Hemos realizado una<br />
implementación sobre código<br />
abierto, que nos permite usar el<br />
protocolo <strong>de</strong> baja latencia GM2<br />
sobre hardware Gigabit y 10<br />
Gigabit. Esta solución es i<strong>de</strong>al para<br />
pequeños sistemas HPC, dado que<br />
no incrementamos el coste <strong>de</strong><br />
propiedad, que supone la<br />
adquisición <strong>de</strong> hardware <strong>de</strong> re<strong>de</strong>s<br />
<strong>de</strong> baja latencia. Nuestros<br />
ingenieros han comprobado que<br />
este sistema es i<strong>de</strong>al para la<br />
paralelización entre 3-4 nodos, que<br />
para muchos investigadores es<br />
suficiente. A<strong>de</strong>más, esta solución<br />
es muy interesante para muchos<br />
<strong>de</strong>partamentos que tienen acceso<br />
a centros <strong>de</strong> supercomputación y<br />
para los cuales ya tienen<br />
<strong>de</strong>sarrollados programas para<br />
tecnología Myrinet. Este protocolo<br />
reduce el tiempo <strong>de</strong> latencia a 5-6<br />
milisegundos frente a los 60 ms <strong>de</strong>l<br />
protocolo TCP/IP, permitiendo usar<br />
la paralelización basada en MPICH<br />
con la solución <strong>de</strong> colas Torque que<br />
implementamos.<br />
INFINIBAND<br />
Sistemas Informáticos Europeos<br />
suministra la tecnología Infiniband<br />
<strong>de</strong> IV generación, con anchos <strong>de</strong> 20<br />
y 40 Gb/s en modo 4x, 8x y 12x,<br />
compatible con la anterior <strong>de</strong> 10<br />
Gb/s. Actualmente es el sistema <strong>de</strong><br />
mayor ancho <strong>de</strong> banda y lí<strong>de</strong>r en<br />
cálculo científico. Aporta tiempos<br />
teóricos <strong>de</strong> latencia <strong>de</strong> 160ns; los<br />
reales están en torno a los 4-5 ms.<br />
Este sistema <strong>de</strong> intercomunicación,<br />
pensado principalmente para<br />
clústeres <strong>de</strong> mediano y gran<br />
tamaño, nos permite ofertar<br />
soluciones <strong>de</strong> gama alta <strong>de</strong> 36 a<br />
648 puertos.<br />
GM2<br />
La solución <strong>de</strong> GM2 sobre Gigabit<br />
ha sido el último <strong>de</strong>sarrollo <strong>de</strong> I+D<br />
entre el CSIC y los ingenieros <strong>de</strong><br />
Sistemas Informáticos Europeos.<br />
Basado todo el sobre plataforma<br />
abierta y libre <strong>de</strong> royalties, permite<br />
usar a los investigadores re<strong>de</strong>s <strong>de</strong><br />
baja latencia a coste cero.<br />
Basado en el “Myricom's Myrinet<br />
Express protocol”, permite que<br />
todas las API implementadas sobre<br />
los sistemas Myrinet <strong>de</strong> hardware<br />
propietario, puedan ser usadas<br />
sobre esta plataforma Gigabit<br />
utilizada en los sistemas <strong>SIE</strong> Ladón<br />
y sobre las tarjetas 10G que nuestra<br />
empresa comercializa. Proporciona<br />
alto rendimiento <strong>de</strong> paso <strong>de</strong><br />
mensajes y compatibilidad MPI, sin<br />
costes hardware adicionales.<br />
Las pruebas realizas por nuestra<br />
empresa <strong>de</strong>muestran que el<br />
protocolo Open-Mx obtiene un gran<br />
rendimiento sobre re<strong>de</strong>s 10G, pero<br />
sobre re<strong>de</strong>s 1000 Mbps, solo es<br />
a<strong>de</strong>cuado para paralelizar entre un<br />
máximo <strong>de</strong> 4 nodos, lo que le hace<br />
i<strong>de</strong>o para clúster pequeños.