revista lista

us algoritmos, el sistema del MIT tardó apenas entre 2 y 12 horas en generar cada una de sus entradas. 

El análisis de grandes volúmenes 

de datos, más conocidos hoy en 

día como “big data”, consiste en 

buscar determinados patrones 

ocultos con algún tipo de valor 

predictivo. Esas búsquedas, por 

supuesto, se han automatizado, 

gracias a la potencia de los ordenadores 

modernos y el desarrollo 

de algoritmos cada vez mejores. 

No obstante, hasta ahora, la elección 

de qué aspectos o factores 

conviene analizar dentro de esos 

datos requería obligatoriamente 

cierta intuición humana. 

Ahora, investigadores del MIT han 

desarrollado un nuevo sistema 

informático, denominado “Data 

Science Machine”, que no sólo 

busca patrones en los datos, sino 

que también diseña las características 

de la búsqueda, eliminando 

por completo cualquier tipo 

de intervención humana. 

Los investigadores desarrollaron 

un prototipo del sistema y, para 

probarlo, lo inscribieron en tres 

competiciones en las que tuvo 

que competir con diversos equipos 

de científicos de datos descubriendo 

patrones predictivos 

en conjuntos de datos con los 

que no estaba familiarizado. El 

sistema informático desarrollado 

por MIT superó a 615 de los 906 

equipos participantes en las tres 

competiciones; y en dos de las 

tres competiciones, sus predicciones 

mostraron un 94% y un 

96% de precisión con respecto a 

las de los ganadores. 

En la tercera, obtuvo una cifra más 

modesta, un 87%, pero mientras 

que los equipos humanos necesitaron 

trabajar algunos meses en el 

desarrollo de sus algoritmos, el sistema 

del MIT tardó apenas entre 2 

y 12 horas en generar cada una de 

sus entradas.

Sin duda, el sistema tiene muchas 

ventajas y ofrece buenos resultados. 

Existen numerosos volúmenes 

de datos de gran tamaño 

almacenados con los que, al 

menos por el momento no se ha 

hecho absolutamente nada, simplemente 

están ahí; y su número 

crece cada día. Sacar partido a 

esos datos, diseñando las búsquedas 

adecuadas para encontrar 

en ellos patrones predictivos 

que resulten de utilidad, requeriría 

la contratación de personal 

altamente cualificado, además de 

una inversión de dinero. Sin embargo, 

el nuevo sistema del MIT 

puede hacerlo de forma automática, 

prácticamente sin coste añadido 

y en una cantidad de 

tiempo mucho menor, ofreciendo 

unos resultados que, si bien 

por el momento pueden no ser 

los mejores, sí son lo bastante 

buenos. 

El investigador Max Kanter, en 

cuya tesis de máster se basa el 

sistema, y Kalyan Veeramachaneni, 

su director de tesis e investigador 

del Laboratorio de inteligencia 

artificial y ciencias de la 

computación (CSAIL) del MIT, 

describen el nuevo sistema en 

un artículo presentado por 

Kanter en el Congreso Internacional 

de ciencia de los datos y 

análisis avanzado del IEEE, que 

tuvo lugar esta semana en París

revista lista

Create successful ePaper yourself

Delete template?

Save as template?