intec
intec
intec
You also want an ePaper? Increase the reach of your titles
YUMPU automatically turns print PDFs into web optimized ePapers that Google loves.
<strong>intec</strong><br />
LA INTELIGENCIA COMPETITIVA<br />
FACTOR CLAVE PARA LA TOMA DE DECISIONES ESTRATÉGICAS<br />
EN LAS ORGANIZACIONES<br />
17<br />
Estas actividades se enmarcan dentro de la Minería de Datos (Data Mining), que puede definirse como:<br />
El tratamiento automático de la información bruta contenida en las bases de datos que permite<br />
extraer los esquemas y los modelos más significativos con objeto de presentar a los usuarios<br />
conocimientos implícitos, no triviales, desconocidos anteriormente y potencialmente útiles<br />
(Dousset, Dkaki i Mothe, 1998)<br />
Actualmente el nombre de minería de datos engloba a todo el conjunto de técnicas encaminadas<br />
a la extracción de conocimiento procesable, implícito en las bases de datos:<br />
<br />
La información no estructurada. Internet y la Minería de textos (Text Mining)<br />
Pero la información no está sólo en las bases de datos. Se estima que un 80% de la información<br />
estratégica no está estructurada (Chantrier, 2007). Y buena parte de ella está en Internet. Se necesitan<br />
pues herramientas inteligentes para extraer y analizar la información.<br />
Aunque Internet nació a finales de los 60s del pasado siglo, sólo se convirtió en una herramienta<br />
accesible al gran público a partir de 1992, gracias a la aparición de la World Wide Web, una<br />
gigantesca “tela de araña” mundial que relaciona millares de ordenadores (Revelli, 2000). En<br />
esta década aparecieron los motores de búsqueda –como Yahoo! o AltaVista- que permiten encontrar<br />
documentos en la Red a partir de palabras clave específicas. En 1998 irrumpió Google, que<br />
pronto se convirtió en el buscador líder.<br />
Un motor de búsqueda está constituido por dos elementos: un robot (spider) que recorre permanentemente<br />
millones de documentos en la Red con objeto de almacenar su contenido y un sistema<br />
de indexación que permite analizar la información capturada para que los usuarios puedan<br />
encontrarla mediante las palabras claves apropiadas.<br />
La comprensión de los textos está exigiendo herramientas capaces de “leerlos” y “entenderlos”. Nace<br />
así la Minería de Textos o Text Mining 9 , que se encuentra en pleno desarrollo. Puede definirse así:<br />
Text Mining es el proceso de aplicación de métodos automáticos para analizar y estructurar datos<br />
de texto con el objetivo de crear conocimiento útil a partir de información estructurada y no<br />
estructurada (Temis, 2004, IALE Tecnología, Curso a distancia de Vigilancia Tecnológica e Inteligencia<br />
Competitiva, 2008).<br />
La Minería de Textos tiene un carácter multidisciplinar ya que incorpora aportaciones de la captura<br />
o recuperación de información (information retrieval, information extraction), del procesamiento<br />
del lenguaje natural, PLN 10 (natural language processing, NLP), de la estadística, de la mine-<br />
9 También conocida como intelligent text analysis, text data<br />
mining o knowledge-discovery in text (KDT).<br />
10 El procesamiento del lenguaje natural persigue que el ordenador<br />
entienda el lenguaje humano.