13.09.2018 Views

TFM_Grupo-OVNIS_vfinal8-split-merge

Create successful ePaper yourself

Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.

MASTER EN BUSINESS INTELLIGENCE & INOVACIÓN TECNOLÓGICA.<br />

TRABAJO FINAL DE MÁSTER<br />

Análisis explicativo de<br />

avistamientos<br />

UFO.<br />

EAE Business School<br />

Campus Joaquin Costa<br />

Madrid<br />

Autores: Kamila Lis<br />

Juan Rojo<br />

Cinta Simón<br />

Carmen Valdés<br />

Tutores:<br />

Izaskun López-Samaniego<br />

Yolanda Alfaro Peral<br />

Joseba López-Samaniego


CREATIVE DIMENSION<br />

DESIGN STUDIO


Índice<br />

General<br />

1.INTRODUCCION<br />

Presentación de la idea de<br />

Proyecto y hechos generales<br />

sobre el objeto de nuestro<br />

análisis<br />

2.PROPUESTA DE VALOR<br />

Detalle de modelo de<br />

negocio que planteamos<br />

desarrollar<br />

3. DESARROLLO TECNICO<br />

Procesos de extracción y<br />

análisis de las bases de datos<br />

4. ANÁLISIS Y MODELADO<br />

Desarrollo del estudio<br />

basándonos en modelos<br />

temporales y apoyándonos<br />

en R Studio.<br />

Acercando el<br />

Business<br />

Intelligence a lo<br />

sobrenatural<br />

4. CONCLUSIONES & NEXT<br />

STEPS<br />

Resumen del aprendizaje y<br />

aproximación a las siguientes<br />

fases del negocio.<br />

ANÁLISIS UFOS<br />

00


Agradecimientos<br />

Queremos agradecer a nuestros tutores, la confianza mostrada desde un principio ante un<br />

grupo sin conocimientos técnicos ni experiencia en el terreno del Business Intelligence y<br />

Big Data. Mención especial a ellos también por su apoyo incondicional en la temática de<br />

nuestro <strong>TFM</strong>.<br />

Agradecer también a EAE Business School el poner a nuestra disposición sus instalaciones y<br />

permitirnos hacer uso de ellas durante las largas horas invertidas en este proyecto,<br />

facilitando un espacio de trabajo que ha acabado por convertirse en una segunda casa<br />

para nuestro equipo.<br />

Por último, aunque no menos importante, gracias a nuestras familias y amigos por la<br />

paciencia demostrada a lo largo del master.


INTRODUCCIÓN<br />

Contexto y Justificación<br />

El debate sobre si estamos solos en el universo no es una novedad; esta es una pregunta que se<br />

repite de forma continuada desde el principio de siglo. No importa cuántos años hayan pasado, lo<br />

cierto es que a día de hoy sigue tratándose de un tema sujeto a las opiniones subjetivas de<br />

científicos y aficionados, pues no se ha llegado a confirmar ni desmentir ninguna de las teorías.<br />

Después de años de investigación, en los que siguen apareciendo comentarios en las redes de<br />

miles de personas expuestas a avistamientos de objetos no identificados, la cantidad de<br />

información disponible acerca de esta temática es inmensurable. No son pocos los institutos<br />

oficiales que se encargan de recoger y archivar estas declaraciones de forma rigurosa, sin<br />

embargo, no existe una explotación pública de esta base de datos.<br />

Con las técnicas aprendidas durante este master nuestro objetivo es acceder y trabajar estas<br />

bases de datos con el fin de buscar resultados más concluyentes sobre los avistamientos<br />

recogidos en los últimos años.<br />

Objetivo<br />

Como detallaremos más adelante, nuestro objetivo tras el análisis de esta información es doble:<br />

a) Por un lado, dar respuesta a algunas de las dudas populares más frecuentes a través de un<br />

análisis explicativo de los datos, mediante el desarrollo de un dashboard ad hoc con los<br />

resultados y conclusiones obtenidas.<br />

b) Explotar los resultados en un modelo de negocio que reporte beneficios tanto para los<br />

investigadores interesados en la ufología, como para sectores que puedan encontrar un<br />

beneficio directo en ella, como es sector turístico y recreacional.<br />

La investigación se centra en los avistamientos de OVNIs declarados a nivel mundial, pero para<br />

dotales de valor, otras fuentes de datos se incorporarán a este estudio para alcanzan una mayor<br />

profundidad en el contenido.<br />

ANÁLISIS UFOS 01


Metodología y Fuentes<br />

Tras analizar varias fuentes de datos de donde obtener el registro de avistamientos <strong>OVNIS</strong> más<br />

cualificados, la opción seleccionada para la extracción de la información es NUFORC en base a<br />

variables cuantitativas – cerca de 90.000 registros de avistamientos en su BBDD – y cualitativas,<br />

pues se recogen a través de formularios con campos cerrados que facilitarán la normalización<br />

posterior<br />

Fig. 1 – Captura web NUFORC<br />

www.nuforc.org<br />

Director: Peter Davenport<br />

NUFORC<br />

N<br />

U<br />

F<br />

O<br />

R<br />

C<br />

National<br />

Unidentified<br />

Flying<br />

Object<br />

Report<br />

Center<br />

Fundada en 1974 por Robert J. Gribble, NUFORC cumple la función pública de recibir, registrar y,<br />

en la medida de lo posible, corroborar y documentar los informes de avistamientos de fenómenos<br />

inusuales (generalmente relacionados con <strong>OVNIS</strong>) efectuados por individuos a lo largo de todo el<br />

planeta.<br />

El principal canal de recepción de información de NUFORC es el telefónico, su línea ha funcionado<br />

de manera continuada desde su fundación y ha procesado decenas de miles<br />

02<br />

ANÁLISIS UFOS


de llamadas, contribuyendo al crecimiento reputacional del centro.<br />

NUFORC es, además, independiente de cualquier otra organización relacionada con los <strong>OVNIS</strong>.<br />

Sus registros se realizan de forma anónima, lo que ha fomentado que esta organización se<br />

convierta en el servicio de información OVNI más popular y ampliamente aceptado en todo el<br />

mundo.<br />

Una de las políticas del centro, que distingue sus operaciones de la mayoría de las demás<br />

organizaciones de <strong>OVNIS</strong>, es que pone a disposición del público todos sus datos en forma<br />

resumida. La información detallada se pone a disposición de los investigadores OVNI<br />

experimentados. Los resúmenes mensuales del informe de avistamiento se publican en este sitio<br />

web.<br />

Además, de la línea telefónica, NUFORC cuenta con un formulario online a través del que dejar<br />

registro de los avistamientos mediante campos predefinidos que obligan a los usuarios a dejar<br />

constancia de la fecha, la duración, la provincia, el estado, el código postal, la forma del objeto<br />

avistado y el número de objetos y testigos del avistamiento.<br />

Fig. 2 – Captura web NUFORC<br />

Fig. 3 – Captura web NUFORC<br />

Mensualmente, la organización revisa y corrige los informes recibidos tanto a través del<br />

formulario como vía telefónica y los pública en su web. Sin embargo, NUFORC no cuenta con un<br />

archivo descargable de información, lo que dificulta el acceso a la base de datos.<br />

ANÁLISIS UFOS 03


NUFORC: extracción de la BBDD<br />

Puesto que la información se encuentra reflejada en la web, en formato HTML, en tablas<br />

mensuales desde 1947, con un rango de entre 200 y 700 registros por mes, la extracción manual<br />

de la información se convierte en una tarea inviable.<br />

La primera opción para acceder a la información es ponernos en contacto con el director de la<br />

organización para explicar la envergadura del proyecto y la necesidad de acceder a una base de<br />

datos tratada para poder llevarlo a cabo. Pese a que inicialmente NUFORC se presenta dispuesto a<br />

colaborar con el proyecto, la realidad es que no cuentan con una BBDD agregada y limpia que<br />

puedan compartir con nosotros por contener datos personales que, por razones obvias, no<br />

pueden compartir con entidades externas sin incumplir la normativa de protección de datos.<br />

Ante esta situación, recurrimos a técnicas de web scraping para acceder de manera automatizada<br />

a las más de 1000 páginas en las que se muestra la información mensual.<br />

WWW<br />

Web Scraping<br />

INTRODUCCION AL SCRAPING<br />

Web scraping es una técnica que sirve para extraer información de una web de<br />

forma automatizada.<br />

El scraping de datos se basa en transformar el contenido no estructurado de un<br />

sitio web en datos estructurados los cuales pueden ser almacenados<br />

posteriormente en una base de datos o en una hoja de cálculo.<br />

Esta técnica se relaciona directamente con la indexación web para organizar el<br />

contenido que encontramos en los motores de búsquedas.<br />

04<br />

ANÁLISIS UFOS


En este caso concreto, para extraer la información mediante scraping optamos por desarrollar<br />

nuestro propio código Python, en lugar de seleccionar alguna de las múltiples herramientas webs<br />

disponibles. Esto nos permitirá modelar la información en el momento de la recuperación y<br />

facilitar la posterior normalización de los datos.<br />

El código se conecta con la web http://www.nuforc.org/webreports/ndxevent.html, donde<br />

encontramos un listado de 915 enlaces que redirigen a las páginas que contienen la información<br />

mensual completa.<br />

Con la librería Beautiful Soup identificamos las etiquetas de formato link en el formato HTML de<br />

la página anterior. Mediante un bucle, ordenamos al código que cada vez que encuentre una<br />

etiqueta , acceda a la web y parsee la información para crear un segundo bucle en el que<br />

escriba la información de la tabla que se encuentra en la página de destino del link (sólo existe<br />

una única tabla, lo que simplifica el código final) en un csv, con filas y columnas a las que<br />

previamente les hemos dado formato.<br />

En el momento de la extracción se eliminan las comillas, dobles espacios, comas simples, y todo<br />

aquel carácter que pueda dificultar el tratamiento posterior de la información<br />

Una vez hecho esto, el código vuelca la<br />

información sobre un fichero csv y vuelve a<br />

ejecutar el bucle inicial para continuar con la<br />

extracción de la información contenida en el<br />

segundo enlace, que almacenará en el mismo<br />

fichero csv, a continuación de la extraída<br />

anteriormente.<br />

La extracción total de la información tarda<br />

unos 40 minutos en ejecutarse, y devuelve<br />

más de 85K filas de información. Pese a<br />

tratarse de una cantidad más que suficiente<br />

para llevar a cabo nuestro análisis, vemos<br />

que no todos los registros de la web han sido<br />

almacenados en el fichero csv. Tras hacer una<br />

comprobación manual en la web,<br />

observamos que algunos de los enlaces están<br />

corrompidos o no contienen información.<br />

Aceptamos la extracción del fichero como<br />

válida y procedemos a la normalización de la<br />

información de la base de datos.<br />

Fig. 4 – Código Python scraping<br />

ANÁLISIS UFOS 05


Primeros Resultados<br />

NUFORC<br />

Antes de normalizar la BBDD hacemos un<br />

primer análisis descriptivo que nos ayude a<br />

plantear las bases de nuestra propuesta de<br />

negocio.<br />

EEUU COMO PRINCIPAL PAÍS CON<br />

AVISTAMIENTOS<br />

TERRITORIO MUY<br />

DEFINIDO<br />

EEUU deberá ser el centro de la propuesta<br />

de negocio que presentemos<br />

88%<br />

41%<br />

Le sigue muy de lejos Canadá (4,5%) y<br />

UK (3%).<br />

Tanto la organización como la página<br />

web tienen su origen en Seattle, por lo<br />

que no es de extrañar que el 95% de los<br />

registros provengan de países de habla<br />

inglesa.<br />

A PARTIR DE 2008 CRECE EL NÚMERO<br />

DE AVISTAMIENTOS<br />

Entre el 2008 y el 2013 se producen el<br />

41% de los avistamientos Ovnis,<br />

Aunque es realmente a partir de 1995<br />

cuando empieza a aumentar el volumen<br />

de registros<br />

VERACIDAD<br />

CUESTIONABLE<br />

Los avistamientos se concentran a partir<br />

del atardecer, y 1 de cada 4 no tiene una<br />

descripción precisa, será necesario verificar<br />

la información con otras fuentes.<br />

31%<br />

LA MAYORÍA DE LOS REGISTROS DE<br />

<strong>OVNIS</strong> TIENEN UNA FORMA<br />

DEFINIDA<br />

Sólo el 31% de los avistamientos<br />

corresponden a formas luminosas.<br />

No existe una forma predominante<br />

entre los registros, aunque las formas<br />

circulares son más frecuentes.<br />

REGISTROS TOTALES EN LA BBDD >> 86.246<br />

Con estos resultados, y antes de continuar ejecutando análisis,<br />

vamos a continuar con la definición de nuestra propuesta de<br />

negocio.<br />

TEMÁTICA DE INTERÉS<br />

GLOBAL<br />

Aunque en menor medida, encontramos<br />

registros en casi todos los países<br />

06<br />

ANÁLISIS UFOS


Explotación de<br />

la información<br />

Antes de adentrarnos en las técnicas necesarias para desarrollar y evaluar nuestra idea de<br />

negocio, repasemos los conceptos básicos de este territorio, así como la historia y evolución del<br />

mismo, con el fin de situar la propuesta en un contexto social acertado.<br />

PSEUDOCIENCIA<br />

Afirmación o creencia que<br />

es presentada<br />

incorrectamente como<br />

científica, pese a carecer<br />

de estatus científico ni<br />

poder ser comprobada de<br />

forma fiable.<br />

EXTRATERESTRE<br />

Popularmente, se denomina<br />

así a todo ser vivo originario<br />

de algún sitio ajeno a la<br />

tierra.<br />

Comúnmente al nombrado<br />

“marciano”, cuya definición<br />

aplicaría sólo a los habitantes<br />

de Marte.<br />

OVNI<br />

Objeto volador no identificado.<br />

Se refiere a la observación de<br />

un objeto que no puede ser<br />

identificado por el<br />

observador y cuyo origen<br />

sigue siendo desconocido<br />

después de una<br />

investigación.<br />

ANÁLISIS UFOS 07


Un poco de histórico<br />

UFOLOGÍA: CIENCIA O PSEUDOCIENCIA<br />

(TERMINOLOGÍA INGLESA QUE PROCEDE DEL TÉRMINO UFO)<br />

1<br />

Europa<br />

02<br />

Estados Unidos<br />

Finlandia, Noruega, Suiza o<br />

Alemania son los primeros países<br />

europeos en reportar<br />

avistamientos de extrañas<br />

formas en el cielo.<br />

La Fuerza Aérea de Estados Unidos<br />

crea un organismo para investigar<br />

las crecientes declaraciones de<br />

avistamientos <strong>OVNIS</strong> en el país.<br />

08 ANÁLISIS UFOS


Es a partir de 1946 cuando comienzan las<br />

primeras declaraciones de avistamientos <strong>OVNIS</strong>.<br />

Han pasado más de 70 años, y aún a día de hoy<br />

siguen identificándose en el cielo luces, discos y<br />

otras formas de las que no es posible explicar su<br />

procedencia. La Ufología se abría paso, así como<br />

disciplina científica cuyo objetivo se centraba en<br />

el estudio de estos objetos volantes.<br />

Algunos meses después el fenómeno llegó a EEUU<br />

a raíz de las declaraciones de Kenneth Arnold, un<br />

piloto civil que en junio de 1947 avisto nueve<br />

extrañas naves volando sobre Washington, en el<br />

oeste de los Estados Unidos, se acuñó el término<br />

OVNI por vez primera.<br />

La prensa bautizó estas naves<br />

como “platillos volantes”.<br />

Las declaraciones de Arnold (quien además<br />

de piloto, era considerado un respetable<br />

hombre de negocios), unidas a otros<br />

fenómenos inexplicables, como la supuesta<br />

llegada a Roswell, Nuevo México, de un OVNI<br />

en el mismo año, obligó a la Fuerza Aérea<br />

estadounidense a crear un organismo de<br />

investigación sobre lo sucedido.<br />

Llamado Proyecto Libro Azul, con sede en<br />

Ohio, se decidió incluir en el programa a un<br />

número muy limitado de personas. Pese a su<br />

reducido número, este equipo investigó en<br />

poco más de veinte años más de 12.618<br />

avistamientos de <strong>OVNIS</strong>.<br />

Réplica de un extraterrestre en el Museo y Centro de<br />

Investigación de Ovnis, en Roswell, Nuevo Mexico.<br />

ANÁLISIS UFOS<br />

09


Proyecto Libro Azul<br />

Las fechas de la creación del proyecto coinciden con el final de la II Guerra Mundial y el inicio de<br />

la Guerra Fría, un periodo de inestabilidad política en el que se propagaban el número de<br />

avistamientos de objetos no identificados. La intención del proyecto era disminuir la inquietud<br />

pública y devolver a la sociedad un clima de normalidad.<br />

Entre los años 40 y 50 el tema de los <strong>OVNIS</strong> se asentó en las discusiones políticas del país como<br />

algo que todos los jefes de gobierno entendían de suma importancia.<br />

En 1966 un comité independiente de la Fuerza Aérea fue creado para profundizar en algunos de<br />

los casos del Proyecto Libro Azul. Este grupo concluyó tras su investigación que no había<br />

evidencia de actividad de <strong>OVNIS</strong>, lo que llevó a la clausura definitiva del proyecto en 1969.<br />

No hay indicio<br />

alguno de ser<br />

una amenaza<br />

para la seguridad<br />

nacional.<br />

No existen<br />

pruebas que<br />

demuestre<br />

adelantos o<br />

tecnología<br />

superior.<br />

No se puede<br />

probar que los<br />

avistamientos<br />

correspondan a<br />

vehículos.<br />

extraterrestres.<br />

Pese al fin del proyecto, no se recupera la tranquilidad. Más de 700 casos del proyecto no<br />

pueden ser explicados por falta de información; algunos de los casos cerrados despiertan más<br />

preguntas que respuestas para los ufólogos, y pese a que muchos de estos documentos se han<br />

hecho públicos, todavía continúa la solicitud de información al gobierno estadounidense.<br />

A pesar de estos hechos, los científicos, no sólo no creen en <strong>OVNIS</strong> y extraterrestres, sino que los<br />

estigmatizan y los consideran, desde el enfoque de la ciencia oficial, como tabúes a evitar e<br />

ignorar. Lo que, a su vez, alimenta la acusación de los ufólogos hacia los científicos como<br />

personas de mente estrecha y, en último término, como miembros de una organización que, no<br />

solo rechaza, sino que conspira para ocultar al público información importante y valiosa.<br />

NO PUEDE CONSIDERARSE CIENCIA A LA UFOLOGIA<br />

Es innegable que el fenómeno ha despertado el interés de disciplinas como la sociología,<br />

psicología y antropología que encuentran fascinante la reacción ante el fenómeno OVNI,<br />

con especial interés en las abducciones y en las teorías conspiratorias.<br />

10 ANÁLISIS UFOS


En conclusión, la ufología surge a raíz de la<br />

Segunda Guerra Mundial, marcada por<br />

inestabilidad social y miedo y se enfrenta<br />

directamente con la ciencia, no por los objetos<br />

de estudio, si no por las metodologías aplicadas<br />

y la falta de evidencias concluyentes.<br />

El clima de misterio creado en torno a esta<br />

materia ha despertado el interés de los medios<br />

de comunicación y la cultura, desarrollándose<br />

un fenómeno fan centrado en los<br />

extraterrestres que ha llevado a la industria<br />

cinematográfica, junto a otras, a ganar millones<br />

de dólares con su explotación<br />

Roswell (Nuevo México), el Área 51 (Nevada), el<br />

Triángulo M (Rusia), el parque nacional de<br />

Árboles de Josué (California), Wycliffe Well<br />

(Australia), Sedona (Arizona), San Clemente<br />

(Chile), Wiltshire (Reino Unido) … Estos destinos<br />

son el foco de muchos turistas ávidos de<br />

encontrarse de frente con vida extraterrestre y<br />

podrán constituir parte de nuestro target final en<br />

el modelo de negocio que desarrollaremos.<br />

Más de 200.000<br />

personas al año<br />

visitan Roswell y gastan<br />

unos 5 millones de<br />

dólares entre<br />

recuerdos y servicios de<br />

hotelería.<br />

ANÁLISIS UFOS<br />

11


Propuesta de Valor<br />

A pesar de la insistencia del gobierno americano por rebajar importancia a este nuevo<br />

fenómeno, un promedio de 226 avistamientos se registra al día desde los últimos 20 años<br />

según NUFORC.<br />

IDENTIFICAMOS 3 SEGMENTOS<br />

A EXPLOTAR<br />

Turismo<br />

PARTICULARES<br />

Turismo<br />

EMPRESAS<br />

Investigación<br />

PUBLICACIONES<br />

Interesados en actividades<br />

diferentes, ocio cultural y<br />

familiar.<br />

Agencias y Organizaciones que<br />

unifiquen paquetes<br />

vacacionales.<br />

Sector especializado en el<br />

estudio y la investigación de<br />

estos fenómenos.<br />

12<br />

ANÁLISIS UFOS


Business Canvas Model<br />

DISEÑO DEL SUPUESTO MODELO DE NEGOCIO.<br />

Fig. 5 – Canvas Business Model<br />

ANÁLISIS UFOS<br />

13


En el canvas anterior identificamos tres tipologías de clientes en los que enfocaremos la<br />

investigación con el fin de poder constituir un modelo de negocio rentable a partir de un análisis<br />

explicativo de los avistamientos OVNI registrados desde 1950 en EEUU<br />

1. Segmento de Clientes Particulares<br />

Pese a que los particulares serán los usuarios finales del producto desarrollado, será a través de las<br />

empresas de viaje y turismo como moneticemos los resultados del análisis.<br />

No obstante, será necesario tener en mente cuales son las necesidades de este tipo de clientes<br />

para asegurarnos que el producto final se ajusta a sus expectativas. Identificamos 3 tipos de<br />

clientes diferentes dentro del segmento de Particulares:<br />

Aficionados a<br />

viajar<br />

Aficionados al<br />

turismo de<br />

aventuras<br />

Aficionados a la<br />

ufología<br />

Constituyen el subsegmento<br />

más amplio y<br />

genérico, puesto que no<br />

muestran un particular<br />

interés en ufología. No<br />

obstante, pueden llegar a<br />

constituir la mayor fuente<br />

de ingresos por el<br />

volumen que suponen.<br />

Suponen una combinación<br />

interesante entre los viajeros<br />

habituales y aquellos que<br />

buscan nuevas experiencias en<br />

sus aventuras. No son grandes<br />

aficionados a la ufología,<br />

aunque el tema es susceptible<br />

de despertarles suficiente<br />

curiosidad para contratar el<br />

paquete de viaje ofrecido por la<br />

agencia.<br />

Adicionalmente, a este tipo de<br />

viajeros se les presupone la<br />

necesidad de compartir con su<br />

entorno las experiencias<br />

desarrolladas en sus viajes con<br />

el fin de diferenciarse de los<br />

turistas más comunes, por lo<br />

que constituirán un altavoz<br />

social para dar a conocer estos<br />

nuevos paquetes de viajes.<br />

Serán los más interesados en<br />

los resultados de la<br />

investigación, aunque no<br />

necesariamente son el<br />

público habitual de las<br />

agencias de viajes. Para llegar<br />

a ellos serán necesario<br />

hacerlo a través de un<br />

método no convencional,<br />

bien utilizando los propios<br />

portales online sobre<br />

fenómenos extraterrestres<br />

bien a través de participación<br />

en convenciones<br />

relacionadas.<br />

Este target se encuentra a<br />

medio camino entre el<br />

público directo del negocio<br />

orientado al turismo y el<br />

interesado en la publicación<br />

de la investigación.<br />

Contra este segmento de público se lanzarán, además, propuestas en paralelo con el fin de<br />

ayudar a la financiación del proyecto de investigación, como aplicaciones móviles para detectar:<br />

1. Avistamientos de OVNIs el día de tu cumpleaños.<br />

2. Dónde/cuándo se producirá el próximo avistamiento.<br />

14 ANÁLISIS UFOS


2. Segmento de Clientes Empresas<br />

Como se ha mencionado anteriormente, será a través de las empresas donde encontremos la<br />

fuente de ingreso para el modelo de negocio orientado a Turismo.<br />

Clasificamos las empresas en dos tipologías que pueden requerir de una aproximación<br />

diferenciada a la hora de presentarle nuestro Plan de Negocio:<br />

2.1 Agencias de Viajes<br />

Hablaremos aquí tanto de agencias presenciales como de OTAs (Online<br />

Travel Agencies) ya que el acercamiento a ambas será similar.<br />

Ofreceremos un servicio de información sobre avistamientos <strong>OVNIS</strong> no sólo<br />

en las localizaciones más conocidas por el gran público (a través del cine o<br />

la televisión) si no que ampliaremos a todos los estados de USA de los que<br />

dispongamos suficiente información tras la investigación.<br />

2.2 Oficinas de Turismo Locales<br />

Con el fin de ampliar nuestro radio de acción, no nos limitaremos sólo a las<br />

agencias, puesto que en la actualidad existe una tendencia creciente a la<br />

organización individual de los viajes, independientemente del destino o las<br />

necesidades.<br />

Para evitar que la caída del negocio de las agencias afecte al nuestro<br />

directamente, ofreceremos a las oficinas de turismo locales las rutas con<br />

mayor probabilidad de avistamientos junto con la información<br />

complementaria sobre el análisis explicativo que las dotará de la veracidad<br />

necesaria para que resulte interesante para el gran público.<br />

2.3 Empresas Organización de Eventos<br />

Un sector relacionado con las agencias de turismo y las oficinas de Turismo<br />

WE CAN locales, MAKE son las INDIVIDUAL empresas dedicadas OFFER a la organización FOR YOU de eventos. JUST<br />

TELL Ofreceremos US WHAT alternativas YOUR de experiencias BUSINESS de coaching NEEDS y actividades<br />

grupales para aquellas pymes y multinacionales que busquen desarrollar<br />

actividades de cohesión entre sus trabajadores en una temática totalmente<br />

ajena al mundo empresarial.<br />

ANÁLISIS UFOS<br />

15


3 Segmento de clientes Publicaciones<br />

Como tercer y último segmento de cliente, encontramos a las diferentes agencias tanto<br />

nacionales como internacionales que se ocupan de temas de estas características.<br />

Ofreceremos los resultados finales de la investigación con el fin de demostrar a la comunidad de<br />

ufólogos la relación encontrada entre los avistamientos registrados a lo largo de los últimos 70<br />

años y otros fenómenos externos que puedan sacar a la luz supuestos fraudes en los<br />

avistamientos. Así como poner de manifiesto aquellos resultados que con los registros obtenidos<br />

den lugar a una duda razonable sobre la veracidad de la información, puesto que como veíamos<br />

al principio, no existen explicación lógica y/o científica para alguno de estos fenómenos y las<br />

principales instituciones gubernamentales los consideran un engaño.<br />

No obstante, no será suficiente con identificar el público más adecuado para nuestro modelo de<br />

negocio, si no que necesitaremos contar con producto capaz de diferenciarse entre los similares<br />

ya existentes en el mercado, y aportar un valor añadido a nuestros clientes para conseguir tanto<br />

la satisfacción del cliente final como la distribución orgánica de la información que suponga un<br />

beneficio extra para las Agencias y Oficinas de Turismo.<br />

Para ello identificamos cuáles serán las actividades claves para poder dotarlas a continuación de<br />

contenido relevante para todos nuestros públicos.<br />

16<br />

ANÁLISIS UFOS


Actividades clave<br />

CLASIFICACIÓN DE LA INFORMACIÓN POR ESTADOS<br />

A través del cine y la televisión unos pocos estados de América del Norte se han convertido<br />

en protagonistas de los fenómenos extraterrestres, mientras que los registros de<br />

avistamientos se han venido sucediendo a lo largo de todo el país.<br />

Nuestro objetivo con este análisis es dotar a las agencias de viajes de nuevos puntos de<br />

interés y valor añadido que puedan constituir fuentes de ingreso adicionales, bien como<br />

rutas añadidas a los viajes habituales o bien como incremento en el ingreso por<br />

excursiones organizadas en destinos frecuentes.<br />

ANÁLISIS DE PROBABILIDAD DE FRAUDE<br />

Los registros de avistamientos son muchos y constantes a lo largo de los últimos años. El<br />

interés turístico despertado en lugares como Roswell supone una fuente de ingresos<br />

fundamental para una población relativamente pequeña, por lo que existen sospechas de<br />

que los propios nativos de la ciudad reporten falsos avistamientos con el fin de seguir<br />

atrayendo la atención de los turistas.<br />

Con el fin de despejar todas las dudas posibles, analizaremos qué factores externos pueden<br />

influir en el incremento de avistamientos por cada uno de los estados para procurar una<br />

información lo más contrastada posible a las empresas y desmentir los mitos más obvios.<br />

PROBABILIDAD DE AVISTAMIENTOS<br />

La frecuencia de registros de avistamientos en EEUU es constante y con una media de más<br />

de 200 avistamientos diarios, lo que nos permite calcular donde existe mayor probabilidad<br />

de que se produzca el siguiente avistamiento con un análisis predictivo.<br />

La incorporación de nuevos destinos junto con la probabilidad de avistamientos basado en<br />

los acontecimientos más recientes dotará a las agencias que comercialicen este producto<br />

de información más precisa que sin duda añadirá valor extra para sus clientes finales.<br />

DIVULGACIÓN DEL ANÁLISIS<br />

Al buscar medios de comunicación especializados y agencias internacionales dedicadas a<br />

este tipo de fenómenos para distribuir los resultados de nuestra investigación<br />

conseguiremos acercarnos al público más interesado en avistamientos OVNIs, lo que<br />

permitirá (en la medida de las posibilidades de distribución de estos medios) acercar al<br />

público nueva información.<br />

El objetivo de la divulgación en publicaciones especializadas es doble: por un lado,<br />

pretendemos dotar de fiabilidad científica a los resultados obtenidos; por otro, encontrar<br />

una fuente de ingresos adicional que permita financiar futuros análisis<br />

ANÁLISIS UFOS<br />

17


Evaluando al Target<br />

ENCUESTA SOBRE HÁBITOS DE VIAJE<br />

De cara a anticipar el éxito del proyecto en la medida de lo posible, se desarrolla una encuesta<br />

online en la que se pregunta sobre los diferentes hábitos de consumo de la población.<br />

Se envía una encuesta online a una BBDD de en torno a 1200 personas, todos ellos trabajadores<br />

mayores de 18 años, entre los que se recoge una muestra de 793 respuestas.<br />

El 76,7% declara que le gusta<br />

viajar, un total de 608<br />

entrevistados; sobre ellos<br />

realizaremos nuestro estudio<br />

para determinar cómo<br />

ofrecerles el mejor producto.<br />

La encuesta se divide en tres<br />

bloques, en los que se pretende<br />

determinar su perfil socio<br />

económico, así como los hábitos<br />

más frecuentes en sus viajes,<br />

tanto en la ejecución como en la<br />

planificación de las mismas.<br />

Determinamos con la encuesta<br />

que el 33,7% de los encuestados<br />

prefiere los destinos exóticos y<br />

diferentes. Si le preguntamos<br />

qué tipo le viaje les gustaría que<br />

las agencias de viajes le<br />

ofrecieran, el 43% responde que<br />

le gustaría recibir una<br />

“experiencia diferente”.<br />

Fig.6 – Infografía (parte 1)<br />

18 ANÁLISIS UFOS


Puesto que viajar es una actividad que le gusta a<br />

la mayoría de la población y, en la que<br />

detectamos un cierto interés por la<br />

diferenciación, creemos que un paquete de viaje<br />

que combine aspectos más tradicionales con<br />

experiencias al aire libre para el avistamiento de<br />

ovnis en directo podría suponer una fuente de<br />

negocio importante tanto para agencias de viaje<br />

tradicionales como para OTAs (Online Travel<br />

Agencies).<br />

Se elabora una<br />

infografía con los<br />

resultados de la<br />

encuesta<br />

19<br />

Fig.7 – Infografía (parte 2)<br />

ANÁLISIS UFOS


Desarrollo<br />

PLANTEADO EL ESCENARIO A DESARROLLAR, FASEAMOS EL PROYECTO<br />

ANTE EL QUE NOS ENFRENTAMOS<br />

Paso 01. Nuevas Fuentes de Información<br />

Buscaremos datos externos a la información obtenida de<br />

NUFORC con el fin de complementar la información con<br />

factores que puedan ayudarnos a certificar la veracidad de los<br />

registros.<br />

Los datos a encontrar serán los siguientes:<br />

01. Referencias Cinematográficas<br />

02. Referencias Web<br />

03. Variables Meteorológicas<br />

Paso 02. Limpieza y Normalización<br />

Una vez tengamos localizadas las fuentes complementarias,<br />

procederemos a normalizarlas junto a la BBDD inicial para<br />

desarrollar el modelo óptimo sobre el que trabajaremos.<br />

Dependiendo de la complejidad de las BBDD encontradas, la<br />

normalización será manual, o se automatizará a través de funciones<br />

en R.<br />

20 ANÁLISIS UFOS


Desarrollo<br />

del Proyecto<br />

Paso 03. Almacenamiento de<br />

datos<br />

Sobre el que trabajar las consultas<br />

necesarias para los análisis posteriores.<br />

Paso 04. Análisis y modelado<br />

Aplicaremos los lenguajes y herramientas<br />

aprendidas para el desarrollo del análisis<br />

descriptivo.<br />

FIN DEL<br />

PROYECTO<br />

Paso 05. Cuadro de Mandos<br />

Los resultados finales se presentarán<br />

volcados sobre un cuadro de mandos,<br />

para el que se seleccionará la<br />

herramienta de visualización más<br />

adecuada según las necesidades del<br />

proyecto.<br />

Conclusiones<br />

Resumen del<br />

aprendizaje.<br />

ANÁLISIS UFOS<br />

21


Extracción<br />

BBDD<br />

SELECCIONAMOS EL ORIGEN DE LAS FUENTES Y LA MEJOR MANERA DE<br />

OPTENER LA INFORMACIÓN<br />

REFERENCIAS CINEMATOGRÁFICAS<br />

El mayor archivo de cine y televisión global actual se encuentra agregado en el “INTERNET<br />

MOVIE DATA BASE”, que se aloja bajo el dominio IMDB.com en Internet. La web fue creada en<br />

octubre de 1990, y poco tiempo después, en 1998 fue adquirida por Amazon.<br />

IMDB se constituyó en sus inicios como una base de datos pública, alimentada por usuarios<br />

anónimos que fueron completándola hasta convertirla hoy en día el mayor repositorio de cine.<br />

22 ANÁLISIS UFOS


A través del motor de búsqueda de la web,<br />

encontramos un listado de referencias<br />

cinematográficas sobre temática<br />

extraterrestre agregado desde1898 hasta<br />

2016.<br />

Un total de 268 títulos cinematográficos,<br />

recopilados por los usuarios de IMDB.<br />

Puesto que se trata de una base de datos<br />

creada por usuarios, asumimos que existe un<br />

margen de error que consideramos aceptable<br />

dado el volumen de información obtenido.<br />

Fig. 8 – Captura IMDB<br />

https://www.imdb.com/list/ls055028710/<br />

Analizado el entorno, optamos por utilizar una de las herramientas de scraping que ofrece el<br />

mercado en lugar de desarrollar un nuevo código. La herramienta seleccionada es IMPORT IO, a<br />

través de su aplicación web nos permitirá rastrear el contenido de una web, seleccionar los datos<br />

que deseamos extraer y guardarlos en un archivo .csv o json.<br />

El proceso que seguimos es el siguiente:<br />

1. Registro en la web con una licencia de prueba.<br />

Esta licencia nos ofrece acceso libre a todas las características de la herramienta, limitando el<br />

número de consultas máximas que podemos hacer, 500. Para nuestro ejercicio, lo<br />

consideramos aceptable.<br />

2. Introducimos la URL de la web de<br />

IMDB que deseamos.<br />

En este momento se carga una<br />

réplica de la web sobre Import IO en<br />

la que aparecen claramente<br />

identificadas las áreas con formato<br />

tabla cuando pasamos el cursor<br />

sobre ellas.<br />

Fig.9 –Captura Import IO<br />

ANÁLISIS UFOS<br />

23


3. Comprobación de la tabla resultante.<br />

Antes de proceder a la extracción de la<br />

información, la herramienta ofrece la<br />

posibilidad de pre visualizar el<br />

resultado que obtendríamos con los<br />

elementos seleccionados, así como del<br />

formato de la tabla y las columnas de<br />

las que se compondría.<br />

Fig10 –Captura Import IO<br />

Esta es una de las facetas de la herramienta que consideramos más valiosas, puesto que la<br />

conversión de la información al fichero definitivo es un proceso lento, y la pre visualización permite<br />

corregir errores antes de solicitar la descarga.<br />

4. Extracción de la data del website.<br />

Como último paso, y simplemente tras pulsar un botón, procedemos a la extracción de la<br />

información.<br />

La herramienta permite repetir la consulta con la periodicidad deseada (días, semanas, meses…), lo<br />

que resulta muy útil para extraer información de aquellos sites que se actualizan de forma<br />

continuada. Para este tipo de ejemplos, excederíamos las limitaciones de la versión gratuita y sería<br />

necesario contratar una licencia.<br />

Con este sencillo proceso, obtenemos un archivo en csv con la información de las referencias de cine<br />

que buscamos.<br />

El objetivo de esta tabla será cruzar su información con los datos extraídos a partir de NUFORC para<br />

analizar si los años con lanzamientos cinematográficos están directamente relacionados con los<br />

periodos de mayor número de avistamientos.<br />

Los resultados deberán dar respuesta a nuestra hipótesis número 1:<br />

WE CAN MAKE INDIVIDUAL OFFER FOR YOU JUST<br />

TELL US WHAT YOUR BUSINESS NEEDS<br />

Las referencias culturales producen ruido sobre los medios de<br />

comunicación que sugestionan a la población y aumentan el<br />

número de avistamientos.<br />

24<br />

ANÁLISIS UFOS


VIDEOS UFO SUBIDOS A YOUTUBE<br />

Siguiendo la lógica de la primera hipótesis, presuponemos que al igual que puede existir una<br />

relación directa entre el cine y los avistamientos, los videos que los usuarios suben de manera<br />

orgánica a sus canales de YouTube deberían coincidir en fecha y lugar con los eventos más<br />

importantes recogidos en la base de datos de NUFORC.<br />

En el caso de YouTube contamos con una gran desventaja al tratarse de una plataforma<br />

relativamente joven. YouTube se crea en 2005 como una plataforma privada agregadora de<br />

videos.<br />

En 2006 esta plataforma es adquirida por Google, quien empieza su explotación comercial hasta<br />

transformarla en la mayor plataforma de consumo de video online a nivel mundial.<br />

El repositorio de datos con el que cuenta YouTube es infinito, no obstante, para resolver nuestro<br />

proyecto necesitamos contar tan sólo con información de videos relacionados con Ovnis.<br />

Para acceder a la información de YouTube lo hacemos a través de su API oficial.<br />

A través de la web para developers de Google, obtenemos el listado de información que<br />

podremos extraer del canal para la operación “list”, que será la que recupere información. El<br />

resto de operaciones disponibles a través de la API no resultan interesantes para este proyecto.<br />

Fig11 –Captura YT Developers site<br />

ANÁLISIS UFOS<br />

25


LA API PERMITE UN MÁXIMO DE 50<br />

REGISTROS POR CONSULTA,<br />

por lo que no es posible hacerlo en una sola llamada, si no<br />

que será necesario ir iterando las fechas para que alcanzar<br />

un número de registros más amplio.<br />

La iteración de fechas la haremos a nivel diario, por lo que<br />

le pediremos al código que para cada día desde 2005,<br />

devuelva información sobre las consultas relacionadas con<br />

“UFO”. Esta información la acompañaremos de<br />

parámetros adicionales para completar el registro final:<br />

- Fecha de Publicación del Video<br />

- Título<br />

- Descripción del video<br />

Fig12 –Código Python Conexión API YT<br />

Le pedimos al código que nos devuelva los 50<br />

primeros vídeos más vistos cada día desde la<br />

fecha de creación del canal hasta hoy.<br />

Este tipo de contenido no es muy frecuente en<br />

YouTube, día tras días, los videos más vistos<br />

aparecen repetidos.<br />

LA ITERACIÓN<br />

PROVOCA LA<br />

DUPLICIDAD DE<br />

REGISTROS<br />

26<br />

ANÁLISIS UFOS


BASE DE DATOS METEOROLÓGICA<br />

En tercer lugar, nos planteamos una última hipótesis:<br />

Las condiciones climatológicas afectan a la visibilidad y, por tanto, a la<br />

veracidad de los avistamientos.<br />

La cuarta base de datos con la que trabajaremos la encontramos ya creada en la web.<br />

Buscábamos un histórico de datos climatológicos que comprendieran un rango de fechas de al<br />

menos 20 años para poder contar con al menos el 50% de la información extraída en NUFORC.<br />

La BBDD la encontramos a partir de Kaggle. Tras encontrar varios proyectos basados en<br />

climatología, nos ponemos en contacto con el creador de un proyecto que tiene por objeto la<br />

evolución del clima a nivel mundial.<br />

Puesto que la BBDD subida en este proyecto no contiene los campos exactos que necesitábamos,<br />

nos ponemos en contacto con el usuario, quien nos facilita la BBDD original que el mismo había<br />

obtenido mediante scraping de la web WEATHER UNDERGROUNDG.<br />

Esta base de datos contiene registros desde 1995, pero sólo nos interesarán aquellos que<br />

coincidan en localización y timestamp con la base de datos de avistamientos.<br />

ANÁLISIS UFOS<br />

27


Normalización<br />

Las diferentes bases de datos con las que vamos<br />

a trabajar en este proyecto se han extraído<br />

mediante técnicas de scraping.<br />

Esta información, pese a ser visualmente<br />

correcta desde el navegador, en el momento de<br />

rastrearse y archivarse en un nuevo documento,<br />

ve comprometido el formato inicial añadiendo<br />

columnas o filas en blanco, con caracteres no<br />

UTF, etc.<br />

PROCESO DE LIMPIEZA<br />

El proceso de limpieza y normalización es la fase previa e indispensable al ETL (siglas que<br />

corresponden a Extracción – Transformación y Load (Carga)) y que constituyen un elemento<br />

importante cuya función completa el resultado de todo el desarrollo de la cohesión de<br />

aplicaciones y sistemas.<br />

La limpieza asegura la calidad de los datos que vamos a procesar. Evita, además la información<br />

no relevante o errónea antes de su volcado, lo que aligera el peso de la carga.<br />

La eliminación de información duplicada ayuda a ahorrar espacio en disco y agiliza las consultas.<br />

Para aplicar una normalización de forma correcta debemos tener en cuenta una serie de<br />

premisas:<br />

1. Aplicar reglas de unificación de datos Ej. Todo en minúsculas.<br />

2. Validación única de los datos de un campo Ej. Sustituir datos vacíos por “na”.<br />

3. Estandarización de datos Ej. Campo DNI siempre sin letra.<br />

28 ANÁLISIS UFOS


Extraction<br />

Transformation<br />

Load<br />

No es posible lograr un buen resultado final en un<br />

proceso ETL, acorde a los objetos marcados, sino se<br />

realiza previamente una buena limpieza de los datos.<br />

EXTRACCION<br />

Es necesario tener en cuenta lo siguiente:<br />

LA EXTRACCION NO<br />

DEBE ALTERAR LA BBDD<br />

DE ORIGEN<br />

1. Extraer los datos desde los sistemas de origen.<br />

2. Analizar los datos extraídos obteniendo un chequeo.<br />

3. Interpretar este chequeo para verificar que los datos<br />

extraídos cumplen la estructura que se esperaba.<br />

3. Convertir los datos a un formato preparado para<br />

iniciar el proceso de transformación.<br />

Además, uno de las prevenciones más importantes que<br />

se deben tener en cuenta durante el proceso de<br />

extracción sería el exigir siempre que esta tarea cause<br />

un impacto mínimo en el sistema de origen. Este<br />

requisito se basa en la práctica ya que, si los datos a<br />

extraer son muchos, el sistema de origen se podría<br />

ralentizar e incluso colapsar, provocando que no<br />

pudiera volver a ser utilizado con normalidad para su<br />

uso cotidiano.<br />

TRANSFORMATION<br />

La fase de transformación de un proceso de ETL aplica<br />

una serie de reglas de negocio o funciones, sobre los<br />

datos extraídos para convertirlos en datos que serán<br />

cargados.<br />

Declarativas. | Independientes. | Claras. | Inteligibles.<br />

CARGA (LOAD)<br />

A la hora de cargar los datos al sistema de destino se<br />

deberá considerar cual es el nivel de granularidad<br />

óptimo teniendo en cuenta el objetivo del proyecto.<br />

El trabajo de análisis se realizará sobre los datos<br />

cargados en el proceso ETL, no sobre la base de datos<br />

original.<br />

ANÁLISIS UFOS<br />

LA TRANSFORMACIÓN<br />

DEBERÁ IGNORAR TODO<br />

DATO NO ÚTIL PARA EL<br />

NEGOCIO<br />

LA CARGA AGREGADA DE<br />

INFORMACIÓN AGILIZA<br />

TIEMPOS DE CONSULTA<br />

29


Normalización NUFORC<br />

A TRAVÉS DEL SCRAPING WEB QUE EFECTUAMOS PARA OBTENER LA<br />

INFORMACIÓN ADQUIRIMOS UNA TABLA CON 114K REGISTROLSS (FILAS)<br />

Como hemos visto anteriormente, el propio código desarrollado en Python está configurado para<br />

eliminar aquellos caracteres que inicialmente sabemos que nos darán problemas en la<br />

consolidación final de los datos: comillas dobles, comillas simples, espacios, saltos de página, …<br />

Esta pequeña corrección facilita el trabajo de normalización posterior, pero no es suficiente<br />

para poder considerarla estándar.<br />

La tabla original cuenta con los siguientes campos, que pasaremos a comentar para detallar su<br />

normalización.<br />

DATE / TIME<br />

Fecha en la que se produce el<br />

avistamiento.<br />

Se devuelve en formato<br />

mm/dd/aa hh:mm en la<br />

mayoría de los registros, pero<br />

encontramos variaciones a lo<br />

largo de las más de cien mil<br />

filas.<br />

Localizamos y eliminamos las<br />

filas sin dato en este campo.<br />

Con los resultados restantes,<br />

hacemos una segunda<br />

normalización con el fin de que<br />

todas las fechas tengan<br />

exactamente el mismo<br />

formato.<br />

CITY<br />

El campo ciudad tiene una<br />

dificultad añadida pues el<br />

volumen de ciudades supera<br />

las 24K.<br />

Puesto que la existen faltas de<br />

ortografía, ciudades escritas en<br />

varios idiomas y lugares<br />

concretos que no<br />

corresponden con ninguna<br />

ciudad, el trabajo no puede<br />

automatizase y tenemos que<br />

recurrir a una automatización<br />

manual.<br />

DEVELOPMENT<br />

STATE<br />

Los datos están compuestos<br />

por estados y países en código<br />

ISO. Para facilitar la lectura de<br />

la información se añade una<br />

columna descriptiva que<br />

contiene el nombre completo<br />

del país/estado.<br />

Los campos vacíos se<br />

completan con el código ISO y<br />

descripción correspondiente.<br />

Esta tarea no es sencilla pues<br />

nuestra referencia principal es<br />

el campo ciudad y existen<br />

ciudades con el mismo nombre<br />

en diversos lugares del planeta.<br />

Lorem ipsum dolour siter amet, consectetur<br />

30 adipiscing elites unc<br />

ANÁLISIS UFOS<br />

DEVELOPMENT<br />

Lorem ipsum dolor siter amet, consectetur adipiscing<br />

elites unc<br />

ac laoreet nisi. Doneci eget<br />

ac laoreet nisi. Doneci eget


Otros campos que contiene esta tabla son:<br />

1. Shape: Corresponde con la forma declarada del avistamiento y encontramos un total de<br />

29 referencias diferentes que agregamos y estandarizamos, dejando un total de 18<br />

formas distintas.<br />

2. Duración: Campo numérico que representa el tiempo de exposición al avistamiento y que<br />

unificaremos en segundos para todas las celdas.<br />

3. Comentarios: Este campo no lo trabajaremos en nuestro análisis, por lo que se mantiene<br />

el contenido original.<br />

4. Fecha de publicación: No lo consideramos relevante y se elimina de la tabla normalizada.<br />

Además de la estandarización, completamos la información con datos que necesitaremos para<br />

profundizar en el análisis:<br />

Coordenadas de geolocalización por ciudad.<br />

Día de la semana, nombre del mes.<br />

Por último, con el fin de explotar la información con un objetivo lúdico a posteriori, creamos<br />

campos que relacionen los datos reales de NUFORC con contenido literario sobre la posible<br />

procedencia de los avistamientos.<br />

https://www.nasa.gov/feature/jpl/new-clues-to-trappist-1-planet-compositions-atmospheres<br />

Fig13 –Captura NASA, Composición Sistemas Solares<br />

ANÁLISIS UFOS 31


PLANETAS HABITABLES<br />

En febrero de 2018 la NASA publica la<br />

composición de los siete planetas que<br />

orbitan a la cercana estrella enana ultra<br />

fría TRAPPIST-1, es básicamente rocosa<br />

y, potencialmente, algunos podrían<br />

albergar más agua que la Tierra.<br />

El sistema planetario de esta estrella está<br />

compuesto de siete planetas terrestres templados,<br />

de los cuales cinco (b, c, e, f y g) son similares en<br />

tamaño a la Tierra, y dos (d y h) son de tamaño<br />

intermedio entre Marte y la Tierra. Tres de los<br />

planetas (e, f y g) orbitan dentro de la zona<br />

habitable<br />

120 Horas de trabajo invertidas en la<br />

normalización de las BBDD<br />

CÓMO COMBINAMOS LA<br />

INFORMACIÓN DE LA NASA<br />

Partimos de los datos reales: nombre del<br />

planeta, nombre del Sistema solar, color y<br />

temperatura y establecemos una relación<br />

basada en la siguiente hipótesis:<br />

A más frio y menor luminosidad, mayor<br />

probabilidad de Éxodo<br />

Establecemos una relación entre la frecuencia de<br />

viaje y la forma del avistamiento:<br />

45% Total -Muy frecuente: luces, formaciones<br />

de varios objetos y naves triangulares...<br />

33% Total- Frecuentes: formas circulares y<br />

esféricas.<br />

22% Total -Poco frecuente: formas cilíndricas e<br />

indefinidas.<br />

32<br />

Damos así coherencia a la información pese a<br />

tratarse de datos ficticios<br />

ANÁLISIS UFOS


Normalización resto de BBDD<br />

BBDD IMBD – CINE Y TV<br />

Esta base cuenta con 276 entradas, cada entrada corresponde a un título de película o serie de<br />

televisión relacionada con UFOS o visitas alienígenas.<br />

La tabla se compone de 26 columnas diferentes, de las que extraeremos solo la información<br />

relevante para nuestro análisis, mientras que el resto las descartaremos.<br />

Campos de la BBDD:<br />

- TITLE(srt): Título de la película.<br />

- YEAR(srt): Año de lanzamiento y tipo de pantalla.<br />

- CERTIFICATE(srt): Clasificación por edades.<br />

- RUNTIME(srt): Duración de la película.<br />

- GENRE(srt): Género cinematográfico.<br />

- VALUE(int): Puntuación de la película del 1 al 10.<br />

- SUMMARY(srt): Sinopsis.<br />

- DIRECTOR/sTART(srt): Director y reparto.<br />

Se eliminan acentos y caracteres especiales. Los títulos se pasan a formato frase. Se comprueba<br />

que las duraciones y los años de lanzamientos tengan el mismo formato en todos los campos<br />

para su posterior utilización.<br />

BBDD YOUTUBE<br />

La extracción de YouTube ha tenido como resultado 3.500 registros en 3 columnas:<br />

- TITLE (srt): Título del video.<br />

- DESCRIPTION (SRT): Resumen del contenido del vídeo<br />

Coincide con el título.<br />

PUBLISHED AT Fecha de publicación del video.<br />

No obstante, esta información está altamente duplicada debido a la iteración diaria del bucle.<br />

De los más de 220K registros, sólo extraemos 371 videos de duplicados.<br />

La información de los campos no es determinante para establecer una localización del UFO, por<br />

lo que a priori descartamos esta tabla para nuestro análisis.<br />

ANÁLISIS UFOS 33


Almacenamiento<br />

de<br />

datos<br />

LAS REGLAS DE NORMALIZACIÓN NO CONSIDERAN EL<br />

RENDIMIENTO. EN ALGUNOS CASOS ES NECESARIO CONSIDERAR<br />

LA DESNORMALIZACIÓN PARA MEJORAR EL RENDIMIENTO.<br />

DESNORMALIZACIÓN<br />

La desnormalización es la duplicación intencionada de columnas en varias tablas, lo cual aumenta<br />

la redundancia de datos. Crear más tablas es necesario, pues, para llegar a una mejor<br />

normalización. Sin embargo, a mayor número de tablas, mayor número de combinaciones al<br />

recuperar los datos; lo que contribuye a la ralentización de las consultas.<br />

La unión de muchas tablas requiere operaciones de entrada/salida (I/O) y lógica de<br />

procesamiento adicional en el disco, por lo que requeriremos de la ayuda de un software para<br />

realizar las consultas.<br />

34 ANÁLISIS UFOS


Rehacemos la información de la tabla normalizada de NUFORC para crear el modelo óptimo de<br />

nuestra base de datos.<br />

Nuestro objetivo es alcanzar un modelo estrella, donde nuestra tabla de hechos esté acompañada de<br />

5 tablas de dimensiones. Estas tablas estarán compuestas por la siguiente información:<br />

TABLA DE HECHOS<br />

Fig13 –Captura Tabla BBDD NUFORC<br />

TABLAS DE DIMENSIONES<br />

DIMENSION LOCATION<br />

DIMENSION DATE<br />

Fig14 –Captura Tabla BBDD NUFORC<br />

Fig15 –Captura Tabla BBDD NUFORC<br />

ANÁLISIS UFOS<br />

35


TABLAS DE DIMENSIONES<br />

DIMENSION PLANET<br />

Fig16 –Captura Tabla BBDD NUFORC<br />

DIMENSION TIME<br />

DIMENSION SHAPE<br />

Fig17 –Captura Tabla BBDD NUFORC<br />

Fig18 –Captura Tabla BBDD NUFORC<br />

MODELO DE DATOS<br />

Nuestro modelo de estrella dibujará un mapa de relación que en teoría debería ser similar a la<br />

siguiente figura:<br />

Fig19 –Modelo Estrella Teórico<br />

36<br />

ANÁLISIS UFOS


En este diseño del almacén de datos la Tabla de Variables (Hechos) está rodeada por<br />

Dimensiones y juntos forman una estructura que permite implementar mecanismos básicos para<br />

poder utilizarla con una herramienta de consultas OLAP.<br />

Esquema estrella del Almacén de Datos implementa un diseño lógico relacional de base de datos<br />

que resulta en que las tablas de hechos representan la Tercera Forma Normal (3FN) y las<br />

dimensiones representan la Segunda Forma Normal (2FN).<br />

El motivo de mantener las tablas en el modelo relacional y permitir el almacenamiento de<br />

información redundante es optimizar el tiempo de respuesta de base datos y dar información a<br />

un usuario en el menor tiempo posible. En este modelo, para obtener la información solicitada,<br />

no hay que construir una sentencia SQL muy compleja que lea muchas tablas de una vez. Una<br />

herramienta de consultas sólo tiene que acceder una tabla.<br />

Se puede encontrar casi cada información de una tabla de hechos en una tabla de dimensiones.<br />

Lo característico de la arquitectura de estrella es que sólo existe una tabla de dimensiones para<br />

cada dimensión y esta tabla representa la segunda forma normal.<br />

Fig20 –Captura SQL server. Modelo Estrella Real<br />

ANÁLISIS UFOS<br />

37


Gestor BBDD: SQL SERVER<br />

Structured Query Language, más conocido por su acrónimo SQL, es un lenguaje de<br />

programación diseñado para administrar sistemas de gestión de bases de datos.<br />

SQL Server es un sistema de BBDD relacionales de Microsoft diseñado para el entorno<br />

empresarial diseñada para el procesamiento de transacciones en línea y el almacenamiento de<br />

datos<br />

En su versión SQL Server Express, encontramos una edición SQL Server que ofrece un almacén<br />

de datos gratuito, fiable y potente, ideal para manejar BBDD ligeras. Esta solución nos evita<br />

hacer un desembolso económico, y pese a sus limitaciones, nos permite trabajar nuestro<br />

proyecto sin dificultades.<br />

Otro punto a favor de la aplicación es que los requerimientos para su instalación no son muy<br />

elevados, con 512Mb de RAM y 4,2GB de espacio disponible en el disco duro de nuestras<br />

máquinas, podemos hacer correr esta aplicación.<br />

Para nuestro proyecto, SQL Server nos facilitará la manera de hacer consultas a la BBDD NUFORC<br />

que, por el volumen de datos, no podríamos hacer desde una hoja de cálculo convencional.<br />

En un futuro, nos permitirá hacer conexiones directas a otras herramientas como Tableau para<br />

completar el cuadro de mandos en tiempo real.<br />

38 ANÁLISIS UFOS


SE HA TRABAJADO CON SQL SERVER EN EL DESARROLLO DEL<br />

PROYECTO PARA PROFUNDIZAR EN EL ANÁLISIS.<br />

A continuación, ilustramos con ejemplos como han sido algunas de esas<br />

consultas:<br />

¿AVISTAMIENTOS POR CIUDAD EN 2012?<br />

?<br />

Fig21 –Captura SQL Server<br />

¿AVISTAMIENTOS POR CIUDAD EN 2012 Y MES?<br />

?<br />

Fig22 –Captura SQL Server<br />

¿PLANETA DE PROCEDENCIA EL LOS<br />

AVISTAMIENTOS EN NEW YORK CITY?<br />

?<br />

Fig23 –Captura SQL Server<br />

ANÁLISIS UFOS<br />

39


Modelado y<br />

análisis<br />

SELECCIONAMOS EL ORIGEN DE LAS FUENTES Y LA MEJOR<br />

MANERA DE OPTENER LA INFORMACIÓN<br />

SERIE TEMPORAL<br />

Utilizando R Studio hemos realizado el estudio de nuestro data set de avistamientos. No<br />

volveremos a extendernos en este apartado sobre el contenido del mismo, pero sí recordaremos<br />

que contamos con más de 80K de avistamientos. Por tanto, es aconsejable, sino imprescindible,<br />

apoyarnos en R para estudiar su contenido e intentar extraer conclusiones.<br />

Dadas las características de nuestro data set vamos a centrar nuestro estudio en las series<br />

temporales.<br />

40 ANÁLISIS UFOS


Una serie temporal se define como:<br />

Una colección de observaciones de una variable recogidas secuencialmente<br />

en el tiempo y, aunque no es nuestro caso, estas observaciones se suelen<br />

recoger en instantes equidistantes en el tiempo.<br />

Encontramos multitud de series temporales en todos los campos. Simplemente a modo de<br />

ejemplo citaremos algunos. En economía o marketing, la evolución del precio de la vivienda, el<br />

índice del barril de Brent, PIB anual…<br />

En factores socio demográficos, número de inmigrantes en una determinada región, tasa de<br />

natalidad anual, renta media per cápita…Incluso en medioambiente, podemos citar los índices de<br />

calidad del aire, la temperatura media mensual, la lluvia recogida diariamente en una ciudad y la<br />

cantidad de metros cúbicos recogidos en un embalse y su evolución.<br />

No citaremos más ejemplos porque son demasiado numerosos; sino que vamos a avanzar<br />

revisando algunas clasificaciones de las series temporales.<br />

Si se pueden predecir exactamente los valores, se dice que las series son<br />

determinísticas.<br />

Si el futuro sólo se puede determinar de modo parcial por las observaciones<br />

pasadas y no se pueden predecir exactamente, se considera que los futuros valores<br />

tienen una distribución de probabilidad que está condicionada a los valores<br />

pasados. En este caso, las series son así estocásticas.<br />

Siguiendo el modo habitual de estudio cuando se trabaja con una serie temporal lo que hemos<br />

hecho en nuestro estudio es dibujar y analizar las medidas descriptivas básicas.<br />

Tendencia:<br />

Cambio a largo plazo que se produce<br />

en relación al nivel medio, o el cambio<br />

a largo plazo de la media. La tendencia<br />

se identifica con un movimiento suave<br />

de la serie a largo plazo.<br />

Estacionalidad:<br />

Periodicidad o variación de cierto<br />

periodo (anual, mensual ...). Ej. el paro<br />

laboral aumenta en invierno y<br />

disminuye en verano. Estos tipos de<br />

efectos se pueden eliminar del<br />

conjunto de los datos<br />

desestacionalizando la serie original.<br />

Componente aleatoria:<br />

Valores que afectan de forma aleatoria.<br />

Se puede estudiar qué tipo de<br />

comportamiento aleatorio presentan<br />

estos residuos, utilizando algunos tipos<br />

de modelo probabilístico que los<br />

describa.<br />

ANÁLISIS UFOS<br />

41


Este enfoque no siempre resulta ser el más adecuado, pero es interesante cuando en la serie se<br />

observa cierta tendencia o cierta periodicidad.<br />

Más adelante mostraremos el resultado de nuestro estudio, y aún a riesgo de caer en el spoiler,<br />

adelantaremos que nuestra serie presenta una tendencia al alza, una estacionalidad acusada en los<br />

meses de veranos y algún outlier en el mes de noviembre.<br />

CLASIFICACIÓN DESCRIPTIVA DE LAS SERIES TEMPORALES<br />

Una serie es estacionaria cuando es<br />

estable, es decir, cuando la media y la<br />

variabilidad son constantes a lo largo del<br />

tiempo. La serie tiende a oscilar<br />

alrededor de una media constante y la<br />

variabilidad con respecto a esa media<br />

también permanece constante en el<br />

tiempo. Es una serie constante a lo largo<br />

del tiempo<br />

Para este tipo de series tiene sentido<br />

conceptos como la media y la varianza.<br />

Sin embargo, también es posible aplicar<br />

los mismos métodos a series no<br />

estacionarias si se transforman<br />

previamente en estacionarias.<br />

No estacionarias:<br />

Son series en las cuales la media y/o<br />

variabilidad cambian en el tiempo.<br />

Los cambios en la media<br />

determinan una tendencia a crecer<br />

o decrecer a largo plazo, por lo que<br />

la serie no oscila alrededor de un<br />

valor constante.<br />

Hasta aquí la pequeña introducción de las series temporales, comenzamos con nuestro estudio<br />

práctico creando la serie temporal.<br />

Partiendo de nuestro data set hallamos la serie de estudio eligiendo la columna de avistamientos<br />

por año y mes. En el eje de coordenadas mostramos el número de avistamientos y en las abscisas el<br />

número de meses/año de nuestro estudio.<br />

Observamos que prácticamente hasta el año 1995 el número de avistamientos es reducido y<br />

constante. Aproximadamente en 1995, el número de avistamientos se incrementa claramente, la<br />

WE CAN MAKE INDIVIDUAL OFFER FOR YOU JUST<br />

tendencia alcista se suaviza hacia el 2005 puesto que el número de avistamientos se mantiene<br />

TELL US WHAT YOUR BUSINESS NEEDS<br />

bastante constante desde el 2005 a casi el 2010. Del 2010 al 2013 la tendencia alista es mucho más<br />

acusada y también lo es la diferencia entre el número máximo y mínimo de avistamientos. (fig 24)<br />

42<br />

ANÁLISIS UFOS


Fig24 –Serie Estacional modelada en R<br />

El siguiente gráfico que mostramos es un diagrama de cajas y bigotes por meses (fig 25). En él,<br />

podemos observar claramente que durante los meses de verano el número de avistamientos es<br />

mayor que en el resto del año. Es decir, presenta una estacionalidad clara.<br />

Fig25 –Serie Estacional modelada en R<br />

Dada la posición de la mediana muy próxima a los valores del primer cuartil en todos los meses,<br />

la distribución no es en absoluto simétrica. Además, en todos los meses el bigote inferior está<br />

mucho más cercano a los valores del primer cuartil y a la mediana; mientras que los valores del<br />

bigote superior están mucho más alejados de los valores del tercer cuartil.<br />

ANÁLISIS UFOS<br />

43


En el mes de noviembre observamos outliers más allá del límite superior. Si buscamos una razón<br />

con origen "social" podríamos encontrarla en las festividades de Halloween, Noche de los<br />

Muertos o Difuntos...<br />

A continuación, vamos a desglosar la serie temporal en sus componentes = Tendencia, Senoidal y<br />

Aleatoria.<br />

La línea random, muestra el incremento de avistamientos desde 2005 aproximadamente y un<br />

fuerte incremento alrededor del año 2010.<br />

La curva que representa la estacionalidad nos confirma lo que veníamos comentando hasta<br />

ahora, nuestros avistamientos tienen una fuerte componente estacional.<br />

Y, por último, si nos apoyamos en la línea de tendencia confirmamos la tendencia alcista a partir<br />

de 1998.<br />

Fig26 –Serie Estacional modelada en R<br />

44<br />

ANÁLISIS UFOS


Continuando con la figura 26, observamos cómo la última gráfica del set muestra una tendencia al<br />

alza y una estacionalidad perfecta. No obstante en el periodo posterior a la década de los 90<br />

empezamos a ver cierta aleatoriedad.<br />

Es decir, la gráfica nos muestra que existe una variable o variables no identificadas que están<br />

interrumpiendo en el análisis. Eso quiere decir que existe una variable no identificada que está<br />

influyendo en los datos.<br />

Para continuar, si deseamos estabilizar la varianza debemos tomar logaritmos. Por tanto,<br />

dibujamos el logaritmo de nuestra serie temporal. Observamos que hasta 1998 aproximadamente<br />

la varianza es mucho mayor que en los años sucesivos donde se mantiene prácticamente estable.<br />

Consideramos que la explicación se debe al incremento significativo del número de datos<br />

disponible desde esta fecha.<br />

Fig27 –Serie Estacional modelada en R<br />

Para eliminar la tendencia en la serie temporal realizamos un estudio de las diferencias entre el<br />

número de avistamientos t con el anterior, es decir, t-1.<br />

Al igual que en la gráfica anterior la diferencia es significativamente menor desde 1998 por el<br />

incremento del número de registros.<br />

ANÁLISIS UFOS<br />

45


Vemos representado un correlograma de la serie (fig 27b), es decir, una representación gráfica de<br />

las autocorrelaciones entre xt y xt+k, en función de k. Donde k es igual a 1 año.<br />

Vemos que las dos primeras autocorrelaciones se salen de las bandas de Barlett . Además, se<br />

muestra periodos de incremento y luego de decrecimiento que pueden tomarse como evidencia<br />

de autocorrelación<br />

Fig27b –Serie Estacional modelada en R<br />

Observamos que tenemos estacionalidad anual eliminamos la serie temporal t-12. En este caso en<br />

vez de estudiar la diferencia con el avistamiento anterior, se contrastará con el avistamiento<br />

situado en doce posiciones anteriores.<br />

Fig28 –Serie Estacional modelada en R<br />

44<br />

ANÁLISIS UFOS


Para dar respuesta a los entusiastas de los fenómenos ovnis, con la función auto.arima hemos<br />

dibujado un predictivo<br />

Fig29 –Serie Estacional modelada en R<br />

Fig30 –Serie Estacional modelada en R<br />

La predicción descrita por la línea azul muestra un comportamiento bastante similar al de los años<br />

inmediatamente anteriores, es decir, continuar con la tendencia al alza y una diferencia bastante<br />

acusada entre el número máximo y mínimo de avistamientos.<br />

ANÁLISIS UFOS<br />

45


Influencia cinematográfica en los<br />

avistamientos<br />

COMPROBAMOS SI EXISTE UNA RELACIÓN ENTRE LO GRABADO EN EL<br />

IMAGINARIO COLECTIVO Y EL AUMENTO DE LOS AVISTAMIENTOS.<br />

Profundizando en el estudio de los avistamientos ovnis, a continuación, vamos a intentar<br />

determinar si esta influencia existe.<br />

Tomando como base los data set de IMBD y el de avistamientos ovnis, enfrentamos las gráficas<br />

del acumulado intentando ver si mantienen una forma o tendencia similares.<br />

Tendremos en cuenta dos campos de la BBDD de IMDB para llevar a cabo esta comparativa:<br />

- El volumen de películas: Presuponiendo que un mayor de títulos en cartelera en el<br />

periodo de un año pueden marcar la conversación social en torno a la temática<br />

extraterrestre.<br />

- La valoración de las películas será el segundo campo a analizar presuponiendo que a<br />

mayor número de votos tienen mayor posibilidad de influencia sobre los avistamientos.<br />

En ambos casos, la correlación con los avistamientos, nos llevaría a pensar que existe una<br />

influencia cultural que condiciona a la población a la hora de asemejar objetos no identificados<br />

con visitantes de otros planetas. Este factor nos ayudaría a identificar “fraude” en los<br />

avistamientos registrados.<br />

Recuperamos el evolutivo anual de<br />

avistamientos hasta 2014. Observamos<br />

un incremento de registros que<br />

relacionamos con el mayor acceso de la<br />

población a Internet.<br />

Fig31 –Evolutivo Anual Avistamentos en R<br />

.<br />

46 ANÁLISIS UFOS


En la fig. 32 vemos como la temática extraterrestre en el<br />

cine concentra mayor número de lanzamientos entre los<br />

años 50 y 90, periodo inmediatamente anterior al<br />

crecimiento de avistamientos registrados.<br />

Pese a que el volumen de referencias cinematográficas se<br />

ha mantenido estable estos últimos años, no observamos<br />

que haya una relación directa con el aumento de<br />

avistamientos. Si nos demuestra, no obstante, que el<br />

interés en esta temática sigue despertando inquietudes que<br />

se reflejan en la creación de nuevas producciones.<br />

Fig32 –Evolutivo Número de Peliculas - R<br />

Fig33 –Evolutivos Votos de Cine<br />

Lo mismo sucede en la comparación con las<br />

votaciones.<br />

Ambos casos muestran un pico previo a 2010,<br />

con un incremento en el número de películas,<br />

cuyo efecto apenas se ve representado en el<br />

evolutivo de avistamientos.<br />

NO PODEMOS<br />

ESTABLECER UNA<br />

RELACIÓN ENTRE EL<br />

NÚMERO DE<br />

AVISTAMIENTOS Y EL<br />

NÚMERO DE PELÍCULAS<br />

O VOTOS.<br />

ANÁLISIS UFOS<br />

47


Análisis por localización<br />

EEUU CONCENTRA EL 88% DEL VOLUMEN TOTAL DE AVISTAMIENTOS<br />

RECOGIDOS<br />

Tanto en las series temporales, como en los análisis anteriores ya habíamos visto cómo con el<br />

asentamiento de la penetración de internet aumentan exponencialmente el número de<br />

avistamientos registrados.<br />

De igual manera, EEUU aparece como zona principal en la que se producen estos avistamientos.<br />

Visualización de Avistamientos OVNIs<br />

en la última década (Mundial)<br />

Hemos realizado un análisis para visualizar cómo es esta evolución en las diferentes zonas del<br />

planeta.<br />

Como veremos en los mapas, la evolución por décadas demuestra claramente este aumento de<br />

avistamientos.<br />

48<br />

ANÁLISIS UFOS


De nuevo, nos apoyamos en RStudio para mostrar sobre un mapa la evolución de los<br />

avistamientos OVNI.<br />

Hemos ido modificando el código para obtener diferentes vistas, trabajamos con tres principales<br />

enfoques. En primer lugar, avistamientos globales, es decir el globo terráqueo tal y como lo<br />

muestra RStudio por defecto. La vista desde el meridiano de Greenwich, y dado que los<br />

avistamientos se concentran en USA la impresión de los avistamientos desde aquí.<br />

En el archivo anexo “Gráficas avistamientos.rmd” hemos ido comentando paso a paso el código.<br />

En enfoque de trabajo ha sido el siguiente, teniendo en cuenta el volumen de los avistamientos<br />

codificamos nuestro data set por décadas para poder agrupar los datos por décadas comenzando<br />

en 1910.<br />

Fig34-39 –Evolución x décadas #Avistamientos (RStudio)<br />

Luego eliminamos las filas con elementos vacíos, generamos la columna de latitud y longitud<br />

para trabajar, cargamos el mapa y lo dibujamos el mapa con todos los avistamientos. Fijamos el<br />

punto de vista que queramos en cada momento, y continuación generamos archivos pngs y a<br />

partir de ellos creamos el GIF.<br />

ANÁLISIS UFOS<br />

49


Cuadro de<br />

Mando<br />

REPRESENTACIÓN VISUAL DE LA INFORMACIÓN DE LA BASE DE<br />

DATOS NUFORC MEDIANTE UN CUADRO DE MANDOS<br />

TABLEAU<br />

Entre las diferentes soluciones de BI disponibles en el mercado para dashboarding,<br />

seleccionamos Tableau como base para nuestro desarrollo del cuadro de mandos.<br />

La facilidad de acceso a una licencia completa mediante nuestro carné de estudiante, así como<br />

su sencilla conexión con SQL son las principales características para tomar esta decisión.<br />

Desarrollamos un Dashboard sencillo, onepage, que permita acercarnos a los potenciales<br />

compradores de nuestra idea de negocio de una forma cercana, pero demostrando que<br />

dominamos las herramientas necesarias para ayudarles a desarrollar el producto final.<br />

50 ANÁLISIS UFOS


Fig40 – Captura Dashboard Tableau Análisis Final<br />

ANÁLISIS UFOS<br />

51


Conclusiones<br />

EFECTUADOS LOS ANÁLISIS ANTERIORES SOBRE NUESTRAS BASE<br />

DE DATOS, RESUMIMOS LAS CONCLUSIONES EXTRAÍDAS.<br />

NOS DECLARAMOS<br />

DATA BELIEVERS<br />

52 ANÁLISIS UFOS


LOS AMANTES DE LOS<br />

<strong>OVNIS</strong> SI EXISTEN<br />

El volumen de<br />

avistamientos ha sido<br />

constante en los últimos<br />

años e independiente de<br />

otras referencias culturales<br />

NO HAY PRUEBAS<br />

CONCLUYENTES DE<br />

FRAUDE<br />

Al igual que en el Proyecto Libro<br />

Azul, no hemos podido verificar la<br />

autenticidad o no de las<br />

declaraciones de avistamientos<br />

EL CINE NO FOMENTA<br />

LOS AVISTAMIENTOS<br />

Se ha diluido el fenómeno ovni<br />

entre películas de zombies,<br />

super heroes,etc., a pesar de<br />

ello continúa produciéndose<br />

trabajos audiovisuales de<br />

temática OVNI.<br />

FACTORES FAVORABLES PARA LOS<br />

AVISTAMIENTOS<br />

Observamos estacionalidad en los meses de verano, especialmente en<br />

climas despejados por lo que deducimos que o a los extraterrestres les gusta<br />

el buen tiempo o la visibilidad es un factor clave para los avistamientos.<br />

POSIBILIDADES DE MONETIZACIÓN<br />

EL SECTOR TURÍSTICO ES ADECUADO PARA APROVECHAR LAS<br />

POSIBILIDADES DE NEGOCIO DEL FENOMENO OVNI<br />

CONSIDERANDO LAS ESTACIONALIDAD DE LOS AVISTAMIENTOS<br />

Y EL INCREMENTO SIGNIFICATIVO DE AVISTAMIENTOS EN LAS<br />

ULTIMAS DOS DÉCADAS<br />

ANÁLISIS UFOS<br />

53


Próximos<br />

Pasos<br />

<br />

¿CUÁLES SERÍAN LOS PRÓXIMOS PASOS SI DECIDIÉRAMOS LLEVAR A LA<br />

REALIDAD EL OBJETO DE ESTE <strong>TFM</strong>?<br />

BUSINESS CANVAS >><br />

PLAN DE MARKETING >><br />

Partiremos del modelo de negocio de negocio<br />

descrito al comienzo de esta memoria, trabajando<br />

con la segmentación de clientes mencionada y el<br />

modelo canvas.<br />

VIABILIDAD >><br />

Es imprescindible profundizar en el análisis de<br />

viabilidad del negocio contrastando los costes e<br />

ingresos a corto, medio y largo plazo en los<br />

diferentes escenarios que se puedan plantear.<br />

Teniendo en cuenta lo sui generis de nuestro<br />

negocio siempre nos plantearíamos un escenario<br />

pesimista en los cálculos.<br />

BUSINESS ROADMAP. >><br />

Definiremos los principales milestones y el tiempo<br />

necesario para crear la infraestructura del negocio<br />

(RRHH, local físico o trabajo en remoto…). El<br />

enfoque siempre será intentar mantener los<br />

costes bajo un estricto control partiendo del MVP<br />

(Minimum Viable Product).<br />

Nos apoyaremos en foros<br />

especializados, es posible que<br />

decidamos lanzar alguna acción paralela<br />

de crowdfunding en foros especializados<br />

y evaluando a nuestro target<br />

desarrollemos una app con un predictivo<br />

de los avistamientos, aprovechando la<br />

data de TRAPPIST para fomentar el<br />

acercamiento a los más escépticos<br />

desde el humor.<br />

AGILE >><br />

Apostaremos por la mejora continua. No<br />

sólo nos mantendríamos focalizados en<br />

mantener una estructura ágil, sino que<br />

extrapolando algunas lessons learnt de<br />

las metodologías Lean y Agile de manera<br />

frecuente haremos un “sprint review”<br />

corrigiendo de la manera más rápida<br />

posible los errores que se hayan<br />

detectado.<br />

54 ANÁLISIS UFOS


Bibliografía<br />

MATERIAL DEL MASTER<br />

Campus EAE<br />

Egighian, G. (2014). “A transatlantic buzz”: flying saucers, extraterrestrials and<br />

America in the postwar Germany. Journal of Transatlantic Studies<br />

Eghigian, G. (2015). Making UFOs make sense: Ufology, science, and the history of<br />

their mutual mistrust. Public Understanding of Science<br />

Programación y estadística con R: Fundamentos de programación y técnicas para<br />

el análisis exploratorio, contraste de hipótesis y aprendizaje automático, Juan José<br />

de Haro<br />

Learning R, Richard Colton<br />

R for everyone, Jared Lander<br />

Python 3 para no programadores, Patricia González R<br />

Python Crash Course, Eric Mattes<br />

Learning Python, Mark Lutz, David Ascher<br />

SQL: QuickStart Guide – The Simplified Beginner’s Guide To SQL” By<br />

ClydeBank Technology<br />

“SQL Queries for Mere Mortals” By John L. Viescas and Michael J.<br />

Hernandez<br />

ANÁLISIS UFOS<br />

55


ANEXOS<br />

CODIGOS R<br />

Código 1. SERIE TEMPORAL<br />

<strong>TFM</strong>_<strong>OVNIS</strong>_SerieTemporal.Rmd<br />

Código 2. COMPARATIVA DE AVISTAMIENTOS VS. PELICULAS<br />

<strong>TFM</strong>_<strong>OVNIS</strong>_ComparativaAvistamientosVSPeliculas.Rmd<br />

Código 3. GRÁFICAS AVISTAMIENTOS<br />

<strong>TFM</strong>_<strong>OVNIS</strong>_GráficasAvistamientos.Rmd<br />

MAPAS<br />

MUNDIAL<br />

56 ANÁLISIS UFOS


EUROASIA<br />

EEUU<br />

ANÁLISIS UFOS<br />

57


CODIGOS PYTHON<br />

Código Scraping NUFORC<br />

scrappingNUFORC_UFO_ddbb_ok2.py<br />

Código conéxión API Youtube<br />

ConectarAPIYoutube_ok4.py<br />

DASHBOARD TABLEAU<br />

Análisis_Avistamientos_UFO.twb<br />

ENLACE A “ENCUESTA ONLINE”<br />

https://www.onlineencuesta.com/s/d3b8559<br />

INFOGRAFÍA COMPLETA RESULTADOS ENCUESTA “HABITOS DE VIAJE”<br />

Infografía_Hábitos<br />

deViaje.pdf<br />

ANÁLISIS UFOS<br />

57


09/2018<br />

<strong>TFM</strong><br />

BI & Innovación<br />

Tecnológica<br />

KAMILA LIS | CINTA SIMON | JUAN ROJO | CARMEN VALDÉS

Hooray! Your file is uploaded and ready to be published.

Saved successfully!

Ooh no, something went wrong!