revista 1
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
El análisis de grandes volúmenes<br />
de datos, más conocidos<br />
hoy en día como “big<br />
data”, consiste en buscar<br />
determinados patrones<br />
ocultos con algún tipo de<br />
valor predictivo. Esas búsquedas,<br />
por supuesto, se<br />
han automatizado, gracias a<br />
la potencia de los ordenadores<br />
modernos y el desarrollo<br />
de algoritmos cada<br />
vez mejores. No obstante,<br />
hasta ahora, la elección de<br />
qué aspectos o factores<br />
conviene analizar dentro de<br />
esos datos requería obligatoriamente<br />
cierta intuición<br />
humana. Ahora, investigadores<br />
del MIT han desarrollado<br />
un nuevo sistema informático,<br />
denominado<br />
“Data Science Machine”, que<br />
no sólo busca patrones en<br />
los datos, sino que también<br />
diseña las características de<br />
la búsqueda, eliminando<br />
por completo cualquier tipo<br />
de intervención humana.<br />
1<br />
Los investigadores desarrollaron<br />
un prototipo del sistema<br />
y, para probarlo, lo<br />
inscribieron en tres competiciones<br />
en las que tuvo que<br />
competir con diversos equipos<br />
de científicos de datos<br />
descubriendo patrones predictivos<br />
en conjuntos de<br />
datos con los que no estaba<br />
familiarizado. El sistema informático<br />
desarrollado por<br />
MIT superó a 615 de los 906<br />
equipos participantes en las<br />
tres competiciones; y en<br />
dos de las tres competiciones,<br />
sus predicciones mostraron<br />
un 94% y un 96% de<br />
precisión con respecto a las<br />
de los ganadores. En la tercera,<br />
obtuvo una cifra más<br />
modesta, un 87%, pero<br />
mientras que los equipos<br />
humanos necesitaron trabajar<br />
algunos meses en el desarrollo<br />
de sus algoritmos,<br />
el sistema del MIT tardó<br />
apenas entre 2 y 12 horas<br />
en generar cada una de sus<br />
entradas.
2
Sin duda, el sistema tiene<br />
muchas ventajas y ofrece<br />
buenos resultados. Existen<br />
numerosos volúmenes de<br />
datos de gran tamaño almacenados<br />
con los que, al<br />
menos por el momento no<br />
se ha hecho absolutamente<br />
nada, simplemente están<br />
ahí; y su número crece cada<br />
día. Sacar partido a esos<br />
datos, diseñando las búsquedas<br />
adecuadas para encontrar<br />
en ellos patrones<br />
predictivos que resulten de<br />
utilidad, requeriría la contratación<br />
de personal altamente<br />
cualificado, además<br />
de una inversión de dinero.<br />
Sin embargo, el nuevo sistema<br />
del MIT puede hacerlo<br />
de forma automática, prácticamente<br />
sin coste añadido<br />
y en una cantidad de<br />
tiempo mucho menor, ofreciendo<br />
unos resultados que,<br />
si bien por el momento<br />
pueden no ser los mejores,<br />
sí son lo bastante buenos.<br />
El investigador Max Kanter,<br />
en cuya tesis de máster se<br />
basa el sistema, y Kalyan<br />
Veeramachaneni, su director<br />
de tesis e investigador<br />
del Laboratorio de inteligencia<br />
artificial y ciencias<br />
de la computación (CSAIL)<br />
del MIT, describen el nuevo<br />
sistema en un artículo presentado<br />
por Kanter en el<br />
Congreso Internacional de<br />
ciencia de los datos y análisis<br />
avanzado del IEEE, que<br />
tuvo lugar esta semana en<br />
París.<br />
3
Revista<br />
Revista<br />
tecnologica<br />
Tecnologica
4