revista lista
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
us algoritmos, el sistema del MIT tardó apenas entre 2 y 12 horas en generar cada una de sus entradas.<br />
El análisis de grandes volúmenes<br />
de datos, más conocidos hoy en<br />
día como “big data”, consiste en<br />
buscar determinados patrones<br />
ocultos con algún tipo de valor<br />
predictivo. Esas búsquedas, por<br />
supuesto, se han automatizado,<br />
gracias a la potencia de los ordenadores<br />
modernos y el desarrollo<br />
de algoritmos cada vez mejores.<br />
No obstante, hasta ahora, la elección<br />
de qué aspectos o factores<br />
conviene analizar dentro de esos<br />
datos requería obligatoriamente<br />
cierta intuición humana.<br />
Ahora, investigadores del MIT han<br />
desarrollado un nuevo sistema<br />
informático, denominado “Data<br />
Science Machine”, que no sólo<br />
busca patrones en los datos, sino<br />
que también diseña las características<br />
de la búsqueda, eliminando<br />
por completo cualquier tipo<br />
de intervención humana.<br />
Los investigadores desarrollaron<br />
un prototipo del sistema y, para<br />
probarlo, lo inscribieron en tres<br />
competiciones en las que tuvo<br />
que competir con diversos equipos<br />
de científicos de datos descubriendo<br />
patrones predictivos<br />
en conjuntos de datos con los<br />
que no estaba familiarizado. El<br />
sistema informático desarrollado<br />
por MIT superó a 615 de los 906<br />
equipos participantes en las tres<br />
competiciones; y en dos de las<br />
tres competiciones, sus predicciones<br />
mostraron un 94% y un<br />
96% de precisión con respecto a<br />
las de los ganadores.<br />
En la tercera, obtuvo una cifra más<br />
modesta, un 87%, pero mientras<br />
que los equipos humanos necesitaron<br />
trabajar algunos meses en el<br />
desarrollo de sus algoritmos, el sistema<br />
del MIT tardó apenas entre 2<br />
y 12 horas en generar cada una de<br />
sus entradas.
Sin duda, el sistema tiene muchas<br />
ventajas y ofrece buenos resultados.<br />
Existen numerosos volúmenes<br />
de datos de gran tamaño<br />
almacenados con los que, al<br />
menos por el momento no se ha<br />
hecho absolutamente nada, simplemente<br />
están ahí; y su número<br />
crece cada día. Sacar partido a<br />
esos datos, diseñando las búsquedas<br />
adecuadas para encontrar<br />
en ellos patrones predictivos<br />
que resulten de utilidad, requeriría<br />
la contratación de personal<br />
altamente cualificado, además de<br />
una inversión de dinero. Sin embargo,<br />
el nuevo sistema del MIT<br />
puede hacerlo de forma automática,<br />
prácticamente sin coste añadido<br />
y en una cantidad de<br />
tiempo mucho menor, ofreciendo<br />
unos resultados que, si bien<br />
por el momento pueden no ser<br />
los mejores, sí son lo bastante<br />
buenos.<br />
El investigador Max Kanter, en<br />
cuya tesis de máster se basa el<br />
sistema, y Kalyan Veeramachaneni,<br />
su director de tesis e investigador<br />
del Laboratorio de inteligencia<br />
artificial y ciencias de la<br />
computación (CSAIL) del MIT,<br />
describen el nuevo sistema en<br />
un artículo presentado por<br />
Kanter en el Congreso Internacional<br />
de ciencia de los datos y<br />
análisis avanzado del IEEE, que<br />
tuvo lugar esta semana en París