20.11.2015 Views

revista 1

You also want an ePaper? Increase the reach of your titles

YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.

El análisis de grandes volúmenes<br />

de datos, más conocidos<br />

hoy en día como “big<br />

data”, consiste en buscar<br />

determinados patrones<br />

ocultos con algún tipo de<br />

valor predictivo. Esas búsquedas,<br />

por supuesto, se<br />

han automatizado, gracias a<br />

la potencia de los ordenadores<br />

modernos y el desarrollo<br />

de algoritmos cada<br />

vez mejores. No obstante,<br />

hasta ahora, la elección de<br />

qué aspectos o factores<br />

conviene analizar dentro de<br />

esos datos requería obligatoriamente<br />

cierta intuición<br />

humana. Ahora, investigadores<br />

del MIT han desarrollado<br />

un nuevo sistema informático,<br />

denominado<br />

“Data Science Machine”, que<br />

no sólo busca patrones en<br />

los datos, sino que también<br />

diseña las características de<br />

la búsqueda, eliminando<br />

por completo cualquier tipo<br />

de intervención humana.<br />

1<br />

Los investigadores desarrollaron<br />

un prototipo del sistema<br />

y, para probarlo, lo<br />

inscribieron en tres competiciones<br />

en las que tuvo que<br />

competir con diversos equipos<br />

de científicos de datos<br />

descubriendo patrones predictivos<br />

en conjuntos de<br />

datos con los que no estaba<br />

familiarizado. El sistema informático<br />

desarrollado por<br />

MIT superó a 615 de los 906<br />

equipos participantes en las<br />

tres competiciones; y en<br />

dos de las tres competiciones,<br />

sus predicciones mostraron<br />

un 94% y un 96% de<br />

precisión con respecto a las<br />

de los ganadores. En la tercera,<br />

obtuvo una cifra más<br />

modesta, un 87%, pero<br />

mientras que los equipos<br />

humanos necesitaron trabajar<br />

algunos meses en el desarrollo<br />

de sus algoritmos,<br />

el sistema del MIT tardó<br />

apenas entre 2 y 12 horas<br />

en generar cada una de sus<br />

entradas.


2


Sin duda, el sistema tiene<br />

muchas ventajas y ofrece<br />

buenos resultados. Existen<br />

numerosos volúmenes de<br />

datos de gran tamaño almacenados<br />

con los que, al<br />

menos por el momento no<br />

se ha hecho absolutamente<br />

nada, simplemente están<br />

ahí; y su número crece cada<br />

día. Sacar partido a esos<br />

datos, diseñando las búsquedas<br />

adecuadas para encontrar<br />

en ellos patrones<br />

predictivos que resulten de<br />

utilidad, requeriría la contratación<br />

de personal altamente<br />

cualificado, además<br />

de una inversión de dinero.<br />

Sin embargo, el nuevo sistema<br />

del MIT puede hacerlo<br />

de forma automática, prácticamente<br />

sin coste añadido<br />

y en una cantidad de<br />

tiempo mucho menor, ofreciendo<br />

unos resultados que,<br />

si bien por el momento<br />

pueden no ser los mejores,<br />

sí son lo bastante buenos.<br />

El investigador Max Kanter,<br />

en cuya tesis de máster se<br />

basa el sistema, y Kalyan<br />

Veeramachaneni, su director<br />

de tesis e investigador<br />

del Laboratorio de inteligencia<br />

artificial y ciencias<br />

de la computación (CSAIL)<br />

del MIT, describen el nuevo<br />

sistema en un artículo presentado<br />

por Kanter en el<br />

Congreso Internacional de<br />

ciencia de los datos y análisis<br />

avanzado del IEEE, que<br />

tuvo lugar esta semana en<br />

París.<br />

3


Revista<br />

Revista<br />

tecnologica<br />

Tecnologica


4

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!