20.11.2015 Views

revista lista

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

us algoritmos, el sistema del MIT tardó apenas entre 2 y 12 horas en generar cada una de sus entradas.<br />

El análisis de grandes volúmenes<br />

de datos, más conocidos hoy en<br />

día como “big data”, consiste en<br />

buscar determinados patrones<br />

ocultos con algún tipo de valor<br />

predictivo. Esas búsquedas, por<br />

supuesto, se han automatizado,<br />

gracias a la potencia de los ordenadores<br />

modernos y el desarrollo<br />

de algoritmos cada vez mejores.<br />

No obstante, hasta ahora, la elección<br />

de qué aspectos o factores<br />

conviene analizar dentro de esos<br />

datos requería obligatoriamente<br />

cierta intuición humana.<br />

Ahora, investigadores del MIT han<br />

desarrollado un nuevo sistema<br />

informático, denominado “Data<br />

Science Machine”, que no sólo<br />

busca patrones en los datos, sino<br />

que también diseña las características<br />

de la búsqueda, eliminando<br />

por completo cualquier tipo<br />

de intervención humana.<br />

Los investigadores desarrollaron<br />

un prototipo del sistema y, para<br />

probarlo, lo inscribieron en tres<br />

competiciones en las que tuvo<br />

que competir con diversos equipos<br />

de científicos de datos descubriendo<br />

patrones predictivos<br />

en conjuntos de datos con los<br />

que no estaba familiarizado. El<br />

sistema informático desarrollado<br />

por MIT superó a 615 de los 906<br />

equipos participantes en las tres<br />

competiciones; y en dos de las<br />

tres competiciones, sus predicciones<br />

mostraron un 94% y un<br />

96% de precisión con respecto a<br />

las de los ganadores.<br />

En la tercera, obtuvo una cifra más<br />

modesta, un 87%, pero mientras<br />

que los equipos humanos necesitaron<br />

trabajar algunos meses en el<br />

desarrollo de sus algoritmos, el sistema<br />

del MIT tardó apenas entre 2<br />

y 12 horas en generar cada una de<br />

sus entradas.


Sin duda, el sistema tiene muchas<br />

ventajas y ofrece buenos resultados.<br />

Existen numerosos volúmenes<br />

de datos de gran tamaño<br />

almacenados con los que, al<br />

menos por el momento no se ha<br />

hecho absolutamente nada, simplemente<br />

están ahí; y su número<br />

crece cada día. Sacar partido a<br />

esos datos, diseñando las búsquedas<br />

adecuadas para encontrar<br />

en ellos patrones predictivos<br />

que resulten de utilidad, requeriría<br />

la contratación de personal<br />

altamente cualificado, además de<br />

una inversión de dinero. Sin embargo,<br />

el nuevo sistema del MIT<br />

puede hacerlo de forma automática,<br />

prácticamente sin coste añadido<br />

y en una cantidad de<br />

tiempo mucho menor, ofreciendo<br />

unos resultados que, si bien<br />

por el momento pueden no ser<br />

los mejores, sí son lo bastante<br />

buenos.<br />

El investigador Max Kanter, en<br />

cuya tesis de máster se basa el<br />

sistema, y Kalyan Veeramachaneni,<br />

su director de tesis e investigador<br />

del Laboratorio de inteligencia<br />

artificial y ciencias de la<br />

computación (CSAIL) del MIT,<br />

describen el nuevo sistema en<br />

un artículo presentado por<br />

Kanter en el Congreso Internacional<br />

de ciencia de los datos y<br />

análisis avanzado del IEEE, que<br />

tuvo lugar esta semana en París

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!