TFM_Grupo-OVNIS_vfinal8-split-merge
Create successful ePaper yourself
Turn your PDF publications into a flip-book with our unique Google optimized e-Paper software.
MASTER EN BUSINESS INTELLIGENCE & INOVACIÓN TECNOLÓGICA.<br />
TRABAJO FINAL DE MÁSTER<br />
Análisis explicativo de<br />
avistamientos<br />
UFO.<br />
EAE Business School<br />
Campus Joaquin Costa<br />
Madrid<br />
Autores: Kamila Lis<br />
Juan Rojo<br />
Cinta Simón<br />
Carmen Valdés<br />
Tutores:<br />
Izaskun López-Samaniego<br />
Yolanda Alfaro Peral<br />
Joseba López-Samaniego
CREATIVE DIMENSION<br />
DESIGN STUDIO
Índice<br />
General<br />
1.INTRODUCCION<br />
Presentación de la idea de<br />
Proyecto y hechos generales<br />
sobre el objeto de nuestro<br />
análisis<br />
2.PROPUESTA DE VALOR<br />
Detalle de modelo de<br />
negocio que planteamos<br />
desarrollar<br />
3. DESARROLLO TECNICO<br />
Procesos de extracción y<br />
análisis de las bases de datos<br />
4. ANÁLISIS Y MODELADO<br />
Desarrollo del estudio<br />
basándonos en modelos<br />
temporales y apoyándonos<br />
en R Studio.<br />
Acercando el<br />
Business<br />
Intelligence a lo<br />
sobrenatural<br />
4. CONCLUSIONES & NEXT<br />
STEPS<br />
Resumen del aprendizaje y<br />
aproximación a las siguientes<br />
fases del negocio.<br />
ANÁLISIS UFOS<br />
00
Agradecimientos<br />
Queremos agradecer a nuestros tutores, la confianza mostrada desde un principio ante un<br />
grupo sin conocimientos técnicos ni experiencia en el terreno del Business Intelligence y<br />
Big Data. Mención especial a ellos también por su apoyo incondicional en la temática de<br />
nuestro <strong>TFM</strong>.<br />
Agradecer también a EAE Business School el poner a nuestra disposición sus instalaciones y<br />
permitirnos hacer uso de ellas durante las largas horas invertidas en este proyecto,<br />
facilitando un espacio de trabajo que ha acabado por convertirse en una segunda casa<br />
para nuestro equipo.<br />
Por último, aunque no menos importante, gracias a nuestras familias y amigos por la<br />
paciencia demostrada a lo largo del master.
INTRODUCCIÓN<br />
Contexto y Justificación<br />
El debate sobre si estamos solos en el universo no es una novedad; esta es una pregunta que se<br />
repite de forma continuada desde el principio de siglo. No importa cuántos años hayan pasado, lo<br />
cierto es que a día de hoy sigue tratándose de un tema sujeto a las opiniones subjetivas de<br />
científicos y aficionados, pues no se ha llegado a confirmar ni desmentir ninguna de las teorías.<br />
Después de años de investigación, en los que siguen apareciendo comentarios en las redes de<br />
miles de personas expuestas a avistamientos de objetos no identificados, la cantidad de<br />
información disponible acerca de esta temática es inmensurable. No son pocos los institutos<br />
oficiales que se encargan de recoger y archivar estas declaraciones de forma rigurosa, sin<br />
embargo, no existe una explotación pública de esta base de datos.<br />
Con las técnicas aprendidas durante este master nuestro objetivo es acceder y trabajar estas<br />
bases de datos con el fin de buscar resultados más concluyentes sobre los avistamientos<br />
recogidos en los últimos años.<br />
Objetivo<br />
Como detallaremos más adelante, nuestro objetivo tras el análisis de esta información es doble:<br />
a) Por un lado, dar respuesta a algunas de las dudas populares más frecuentes a través de un<br />
análisis explicativo de los datos, mediante el desarrollo de un dashboard ad hoc con los<br />
resultados y conclusiones obtenidas.<br />
b) Explotar los resultados en un modelo de negocio que reporte beneficios tanto para los<br />
investigadores interesados en la ufología, como para sectores que puedan encontrar un<br />
beneficio directo en ella, como es sector turístico y recreacional.<br />
La investigación se centra en los avistamientos de OVNIs declarados a nivel mundial, pero para<br />
dotales de valor, otras fuentes de datos se incorporarán a este estudio para alcanzan una mayor<br />
profundidad en el contenido.<br />
ANÁLISIS UFOS 01
Metodología y Fuentes<br />
Tras analizar varias fuentes de datos de donde obtener el registro de avistamientos <strong>OVNIS</strong> más<br />
cualificados, la opción seleccionada para la extracción de la información es NUFORC en base a<br />
variables cuantitativas – cerca de 90.000 registros de avistamientos en su BBDD – y cualitativas,<br />
pues se recogen a través de formularios con campos cerrados que facilitarán la normalización<br />
posterior<br />
Fig. 1 – Captura web NUFORC<br />
www.nuforc.org<br />
Director: Peter Davenport<br />
NUFORC<br />
N<br />
U<br />
F<br />
O<br />
R<br />
C<br />
National<br />
Unidentified<br />
Flying<br />
Object<br />
Report<br />
Center<br />
Fundada en 1974 por Robert J. Gribble, NUFORC cumple la función pública de recibir, registrar y,<br />
en la medida de lo posible, corroborar y documentar los informes de avistamientos de fenómenos<br />
inusuales (generalmente relacionados con <strong>OVNIS</strong>) efectuados por individuos a lo largo de todo el<br />
planeta.<br />
El principal canal de recepción de información de NUFORC es el telefónico, su línea ha funcionado<br />
de manera continuada desde su fundación y ha procesado decenas de miles<br />
02<br />
ANÁLISIS UFOS
de llamadas, contribuyendo al crecimiento reputacional del centro.<br />
NUFORC es, además, independiente de cualquier otra organización relacionada con los <strong>OVNIS</strong>.<br />
Sus registros se realizan de forma anónima, lo que ha fomentado que esta organización se<br />
convierta en el servicio de información OVNI más popular y ampliamente aceptado en todo el<br />
mundo.<br />
Una de las políticas del centro, que distingue sus operaciones de la mayoría de las demás<br />
organizaciones de <strong>OVNIS</strong>, es que pone a disposición del público todos sus datos en forma<br />
resumida. La información detallada se pone a disposición de los investigadores OVNI<br />
experimentados. Los resúmenes mensuales del informe de avistamiento se publican en este sitio<br />
web.<br />
Además, de la línea telefónica, NUFORC cuenta con un formulario online a través del que dejar<br />
registro de los avistamientos mediante campos predefinidos que obligan a los usuarios a dejar<br />
constancia de la fecha, la duración, la provincia, el estado, el código postal, la forma del objeto<br />
avistado y el número de objetos y testigos del avistamiento.<br />
Fig. 2 – Captura web NUFORC<br />
Fig. 3 – Captura web NUFORC<br />
Mensualmente, la organización revisa y corrige los informes recibidos tanto a través del<br />
formulario como vía telefónica y los pública en su web. Sin embargo, NUFORC no cuenta con un<br />
archivo descargable de información, lo que dificulta el acceso a la base de datos.<br />
ANÁLISIS UFOS 03
NUFORC: extracción de la BBDD<br />
Puesto que la información se encuentra reflejada en la web, en formato HTML, en tablas<br />
mensuales desde 1947, con un rango de entre 200 y 700 registros por mes, la extracción manual<br />
de la información se convierte en una tarea inviable.<br />
La primera opción para acceder a la información es ponernos en contacto con el director de la<br />
organización para explicar la envergadura del proyecto y la necesidad de acceder a una base de<br />
datos tratada para poder llevarlo a cabo. Pese a que inicialmente NUFORC se presenta dispuesto a<br />
colaborar con el proyecto, la realidad es que no cuentan con una BBDD agregada y limpia que<br />
puedan compartir con nosotros por contener datos personales que, por razones obvias, no<br />
pueden compartir con entidades externas sin incumplir la normativa de protección de datos.<br />
Ante esta situación, recurrimos a técnicas de web scraping para acceder de manera automatizada<br />
a las más de 1000 páginas en las que se muestra la información mensual.<br />
WWW<br />
Web Scraping<br />
INTRODUCCION AL SCRAPING<br />
Web scraping es una técnica que sirve para extraer información de una web de<br />
forma automatizada.<br />
El scraping de datos se basa en transformar el contenido no estructurado de un<br />
sitio web en datos estructurados los cuales pueden ser almacenados<br />
posteriormente en una base de datos o en una hoja de cálculo.<br />
Esta técnica se relaciona directamente con la indexación web para organizar el<br />
contenido que encontramos en los motores de búsquedas.<br />
04<br />
ANÁLISIS UFOS
En este caso concreto, para extraer la información mediante scraping optamos por desarrollar<br />
nuestro propio código Python, en lugar de seleccionar alguna de las múltiples herramientas webs<br />
disponibles. Esto nos permitirá modelar la información en el momento de la recuperación y<br />
facilitar la posterior normalización de los datos.<br />
El código se conecta con la web http://www.nuforc.org/webreports/ndxevent.html, donde<br />
encontramos un listado de 915 enlaces que redirigen a las páginas que contienen la información<br />
mensual completa.<br />
Con la librería Beautiful Soup identificamos las etiquetas de formato link en el formato HTML de<br />
la página anterior. Mediante un bucle, ordenamos al código que cada vez que encuentre una<br />
etiqueta , acceda a la web y parsee la información para crear un segundo bucle en el que<br />
escriba la información de la tabla que se encuentra en la página de destino del link (sólo existe<br />
una única tabla, lo que simplifica el código final) en un csv, con filas y columnas a las que<br />
previamente les hemos dado formato.<br />
En el momento de la extracción se eliminan las comillas, dobles espacios, comas simples, y todo<br />
aquel carácter que pueda dificultar el tratamiento posterior de la información<br />
Una vez hecho esto, el código vuelca la<br />
información sobre un fichero csv y vuelve a<br />
ejecutar el bucle inicial para continuar con la<br />
extracción de la información contenida en el<br />
segundo enlace, que almacenará en el mismo<br />
fichero csv, a continuación de la extraída<br />
anteriormente.<br />
La extracción total de la información tarda<br />
unos 40 minutos en ejecutarse, y devuelve<br />
más de 85K filas de información. Pese a<br />
tratarse de una cantidad más que suficiente<br />
para llevar a cabo nuestro análisis, vemos<br />
que no todos los registros de la web han sido<br />
almacenados en el fichero csv. Tras hacer una<br />
comprobación manual en la web,<br />
observamos que algunos de los enlaces están<br />
corrompidos o no contienen información.<br />
Aceptamos la extracción del fichero como<br />
válida y procedemos a la normalización de la<br />
información de la base de datos.<br />
Fig. 4 – Código Python scraping<br />
ANÁLISIS UFOS 05
Primeros Resultados<br />
NUFORC<br />
Antes de normalizar la BBDD hacemos un<br />
primer análisis descriptivo que nos ayude a<br />
plantear las bases de nuestra propuesta de<br />
negocio.<br />
EEUU COMO PRINCIPAL PAÍS CON<br />
AVISTAMIENTOS<br />
TERRITORIO MUY<br />
DEFINIDO<br />
EEUU deberá ser el centro de la propuesta<br />
de negocio que presentemos<br />
88%<br />
41%<br />
Le sigue muy de lejos Canadá (4,5%) y<br />
UK (3%).<br />
Tanto la organización como la página<br />
web tienen su origen en Seattle, por lo<br />
que no es de extrañar que el 95% de los<br />
registros provengan de países de habla<br />
inglesa.<br />
A PARTIR DE 2008 CRECE EL NÚMERO<br />
DE AVISTAMIENTOS<br />
Entre el 2008 y el 2013 se producen el<br />
41% de los avistamientos Ovnis,<br />
Aunque es realmente a partir de 1995<br />
cuando empieza a aumentar el volumen<br />
de registros<br />
VERACIDAD<br />
CUESTIONABLE<br />
Los avistamientos se concentran a partir<br />
del atardecer, y 1 de cada 4 no tiene una<br />
descripción precisa, será necesario verificar<br />
la información con otras fuentes.<br />
31%<br />
LA MAYORÍA DE LOS REGISTROS DE<br />
<strong>OVNIS</strong> TIENEN UNA FORMA<br />
DEFINIDA<br />
Sólo el 31% de los avistamientos<br />
corresponden a formas luminosas.<br />
No existe una forma predominante<br />
entre los registros, aunque las formas<br />
circulares son más frecuentes.<br />
REGISTROS TOTALES EN LA BBDD >> 86.246<br />
Con estos resultados, y antes de continuar ejecutando análisis,<br />
vamos a continuar con la definición de nuestra propuesta de<br />
negocio.<br />
TEMÁTICA DE INTERÉS<br />
GLOBAL<br />
Aunque en menor medida, encontramos<br />
registros en casi todos los países<br />
06<br />
ANÁLISIS UFOS
Explotación de<br />
la información<br />
Antes de adentrarnos en las técnicas necesarias para desarrollar y evaluar nuestra idea de<br />
negocio, repasemos los conceptos básicos de este territorio, así como la historia y evolución del<br />
mismo, con el fin de situar la propuesta en un contexto social acertado.<br />
PSEUDOCIENCIA<br />
Afirmación o creencia que<br />
es presentada<br />
incorrectamente como<br />
científica, pese a carecer<br />
de estatus científico ni<br />
poder ser comprobada de<br />
forma fiable.<br />
EXTRATERESTRE<br />
Popularmente, se denomina<br />
así a todo ser vivo originario<br />
de algún sitio ajeno a la<br />
tierra.<br />
Comúnmente al nombrado<br />
“marciano”, cuya definición<br />
aplicaría sólo a los habitantes<br />
de Marte.<br />
OVNI<br />
Objeto volador no identificado.<br />
Se refiere a la observación de<br />
un objeto que no puede ser<br />
identificado por el<br />
observador y cuyo origen<br />
sigue siendo desconocido<br />
después de una<br />
investigación.<br />
ANÁLISIS UFOS 07
Un poco de histórico<br />
UFOLOGÍA: CIENCIA O PSEUDOCIENCIA<br />
(TERMINOLOGÍA INGLESA QUE PROCEDE DEL TÉRMINO UFO)<br />
1<br />
Europa<br />
02<br />
Estados Unidos<br />
Finlandia, Noruega, Suiza o<br />
Alemania son los primeros países<br />
europeos en reportar<br />
avistamientos de extrañas<br />
formas en el cielo.<br />
La Fuerza Aérea de Estados Unidos<br />
crea un organismo para investigar<br />
las crecientes declaraciones de<br />
avistamientos <strong>OVNIS</strong> en el país.<br />
08 ANÁLISIS UFOS
Es a partir de 1946 cuando comienzan las<br />
primeras declaraciones de avistamientos <strong>OVNIS</strong>.<br />
Han pasado más de 70 años, y aún a día de hoy<br />
siguen identificándose en el cielo luces, discos y<br />
otras formas de las que no es posible explicar su<br />
procedencia. La Ufología se abría paso, así como<br />
disciplina científica cuyo objetivo se centraba en<br />
el estudio de estos objetos volantes.<br />
Algunos meses después el fenómeno llegó a EEUU<br />
a raíz de las declaraciones de Kenneth Arnold, un<br />
piloto civil que en junio de 1947 avisto nueve<br />
extrañas naves volando sobre Washington, en el<br />
oeste de los Estados Unidos, se acuñó el término<br />
OVNI por vez primera.<br />
La prensa bautizó estas naves<br />
como “platillos volantes”.<br />
Las declaraciones de Arnold (quien además<br />
de piloto, era considerado un respetable<br />
hombre de negocios), unidas a otros<br />
fenómenos inexplicables, como la supuesta<br />
llegada a Roswell, Nuevo México, de un OVNI<br />
en el mismo año, obligó a la Fuerza Aérea<br />
estadounidense a crear un organismo de<br />
investigación sobre lo sucedido.<br />
Llamado Proyecto Libro Azul, con sede en<br />
Ohio, se decidió incluir en el programa a un<br />
número muy limitado de personas. Pese a su<br />
reducido número, este equipo investigó en<br />
poco más de veinte años más de 12.618<br />
avistamientos de <strong>OVNIS</strong>.<br />
Réplica de un extraterrestre en el Museo y Centro de<br />
Investigación de Ovnis, en Roswell, Nuevo Mexico.<br />
ANÁLISIS UFOS<br />
09
Proyecto Libro Azul<br />
Las fechas de la creación del proyecto coinciden con el final de la II Guerra Mundial y el inicio de<br />
la Guerra Fría, un periodo de inestabilidad política en el que se propagaban el número de<br />
avistamientos de objetos no identificados. La intención del proyecto era disminuir la inquietud<br />
pública y devolver a la sociedad un clima de normalidad.<br />
Entre los años 40 y 50 el tema de los <strong>OVNIS</strong> se asentó en las discusiones políticas del país como<br />
algo que todos los jefes de gobierno entendían de suma importancia.<br />
En 1966 un comité independiente de la Fuerza Aérea fue creado para profundizar en algunos de<br />
los casos del Proyecto Libro Azul. Este grupo concluyó tras su investigación que no había<br />
evidencia de actividad de <strong>OVNIS</strong>, lo que llevó a la clausura definitiva del proyecto en 1969.<br />
No hay indicio<br />
alguno de ser<br />
una amenaza<br />
para la seguridad<br />
nacional.<br />
No existen<br />
pruebas que<br />
demuestre<br />
adelantos o<br />
tecnología<br />
superior.<br />
No se puede<br />
probar que los<br />
avistamientos<br />
correspondan a<br />
vehículos.<br />
extraterrestres.<br />
Pese al fin del proyecto, no se recupera la tranquilidad. Más de 700 casos del proyecto no<br />
pueden ser explicados por falta de información; algunos de los casos cerrados despiertan más<br />
preguntas que respuestas para los ufólogos, y pese a que muchos de estos documentos se han<br />
hecho públicos, todavía continúa la solicitud de información al gobierno estadounidense.<br />
A pesar de estos hechos, los científicos, no sólo no creen en <strong>OVNIS</strong> y extraterrestres, sino que los<br />
estigmatizan y los consideran, desde el enfoque de la ciencia oficial, como tabúes a evitar e<br />
ignorar. Lo que, a su vez, alimenta la acusación de los ufólogos hacia los científicos como<br />
personas de mente estrecha y, en último término, como miembros de una organización que, no<br />
solo rechaza, sino que conspira para ocultar al público información importante y valiosa.<br />
NO PUEDE CONSIDERARSE CIENCIA A LA UFOLOGIA<br />
Es innegable que el fenómeno ha despertado el interés de disciplinas como la sociología,<br />
psicología y antropología que encuentran fascinante la reacción ante el fenómeno OVNI,<br />
con especial interés en las abducciones y en las teorías conspiratorias.<br />
10 ANÁLISIS UFOS
En conclusión, la ufología surge a raíz de la<br />
Segunda Guerra Mundial, marcada por<br />
inestabilidad social y miedo y se enfrenta<br />
directamente con la ciencia, no por los objetos<br />
de estudio, si no por las metodologías aplicadas<br />
y la falta de evidencias concluyentes.<br />
El clima de misterio creado en torno a esta<br />
materia ha despertado el interés de los medios<br />
de comunicación y la cultura, desarrollándose<br />
un fenómeno fan centrado en los<br />
extraterrestres que ha llevado a la industria<br />
cinematográfica, junto a otras, a ganar millones<br />
de dólares con su explotación<br />
Roswell (Nuevo México), el Área 51 (Nevada), el<br />
Triángulo M (Rusia), el parque nacional de<br />
Árboles de Josué (California), Wycliffe Well<br />
(Australia), Sedona (Arizona), San Clemente<br />
(Chile), Wiltshire (Reino Unido) … Estos destinos<br />
son el foco de muchos turistas ávidos de<br />
encontrarse de frente con vida extraterrestre y<br />
podrán constituir parte de nuestro target final en<br />
el modelo de negocio que desarrollaremos.<br />
Más de 200.000<br />
personas al año<br />
visitan Roswell y gastan<br />
unos 5 millones de<br />
dólares entre<br />
recuerdos y servicios de<br />
hotelería.<br />
ANÁLISIS UFOS<br />
11
Propuesta de Valor<br />
A pesar de la insistencia del gobierno americano por rebajar importancia a este nuevo<br />
fenómeno, un promedio de 226 avistamientos se registra al día desde los últimos 20 años<br />
según NUFORC.<br />
IDENTIFICAMOS 3 SEGMENTOS<br />
A EXPLOTAR<br />
Turismo<br />
PARTICULARES<br />
Turismo<br />
EMPRESAS<br />
Investigación<br />
PUBLICACIONES<br />
Interesados en actividades<br />
diferentes, ocio cultural y<br />
familiar.<br />
Agencias y Organizaciones que<br />
unifiquen paquetes<br />
vacacionales.<br />
Sector especializado en el<br />
estudio y la investigación de<br />
estos fenómenos.<br />
12<br />
ANÁLISIS UFOS
Business Canvas Model<br />
DISEÑO DEL SUPUESTO MODELO DE NEGOCIO.<br />
Fig. 5 – Canvas Business Model<br />
ANÁLISIS UFOS<br />
13
En el canvas anterior identificamos tres tipologías de clientes en los que enfocaremos la<br />
investigación con el fin de poder constituir un modelo de negocio rentable a partir de un análisis<br />
explicativo de los avistamientos OVNI registrados desde 1950 en EEUU<br />
1. Segmento de Clientes Particulares<br />
Pese a que los particulares serán los usuarios finales del producto desarrollado, será a través de las<br />
empresas de viaje y turismo como moneticemos los resultados del análisis.<br />
No obstante, será necesario tener en mente cuales son las necesidades de este tipo de clientes<br />
para asegurarnos que el producto final se ajusta a sus expectativas. Identificamos 3 tipos de<br />
clientes diferentes dentro del segmento de Particulares:<br />
Aficionados a<br />
viajar<br />
Aficionados al<br />
turismo de<br />
aventuras<br />
Aficionados a la<br />
ufología<br />
Constituyen el subsegmento<br />
más amplio y<br />
genérico, puesto que no<br />
muestran un particular<br />
interés en ufología. No<br />
obstante, pueden llegar a<br />
constituir la mayor fuente<br />
de ingresos por el<br />
volumen que suponen.<br />
Suponen una combinación<br />
interesante entre los viajeros<br />
habituales y aquellos que<br />
buscan nuevas experiencias en<br />
sus aventuras. No son grandes<br />
aficionados a la ufología,<br />
aunque el tema es susceptible<br />
de despertarles suficiente<br />
curiosidad para contratar el<br />
paquete de viaje ofrecido por la<br />
agencia.<br />
Adicionalmente, a este tipo de<br />
viajeros se les presupone la<br />
necesidad de compartir con su<br />
entorno las experiencias<br />
desarrolladas en sus viajes con<br />
el fin de diferenciarse de los<br />
turistas más comunes, por lo<br />
que constituirán un altavoz<br />
social para dar a conocer estos<br />
nuevos paquetes de viajes.<br />
Serán los más interesados en<br />
los resultados de la<br />
investigación, aunque no<br />
necesariamente son el<br />
público habitual de las<br />
agencias de viajes. Para llegar<br />
a ellos serán necesario<br />
hacerlo a través de un<br />
método no convencional,<br />
bien utilizando los propios<br />
portales online sobre<br />
fenómenos extraterrestres<br />
bien a través de participación<br />
en convenciones<br />
relacionadas.<br />
Este target se encuentra a<br />
medio camino entre el<br />
público directo del negocio<br />
orientado al turismo y el<br />
interesado en la publicación<br />
de la investigación.<br />
Contra este segmento de público se lanzarán, además, propuestas en paralelo con el fin de<br />
ayudar a la financiación del proyecto de investigación, como aplicaciones móviles para detectar:<br />
1. Avistamientos de OVNIs el día de tu cumpleaños.<br />
2. Dónde/cuándo se producirá el próximo avistamiento.<br />
14 ANÁLISIS UFOS
2. Segmento de Clientes Empresas<br />
Como se ha mencionado anteriormente, será a través de las empresas donde encontremos la<br />
fuente de ingreso para el modelo de negocio orientado a Turismo.<br />
Clasificamos las empresas en dos tipologías que pueden requerir de una aproximación<br />
diferenciada a la hora de presentarle nuestro Plan de Negocio:<br />
2.1 Agencias de Viajes<br />
Hablaremos aquí tanto de agencias presenciales como de OTAs (Online<br />
Travel Agencies) ya que el acercamiento a ambas será similar.<br />
Ofreceremos un servicio de información sobre avistamientos <strong>OVNIS</strong> no sólo<br />
en las localizaciones más conocidas por el gran público (a través del cine o<br />
la televisión) si no que ampliaremos a todos los estados de USA de los que<br />
dispongamos suficiente información tras la investigación.<br />
2.2 Oficinas de Turismo Locales<br />
Con el fin de ampliar nuestro radio de acción, no nos limitaremos sólo a las<br />
agencias, puesto que en la actualidad existe una tendencia creciente a la<br />
organización individual de los viajes, independientemente del destino o las<br />
necesidades.<br />
Para evitar que la caída del negocio de las agencias afecte al nuestro<br />
directamente, ofreceremos a las oficinas de turismo locales las rutas con<br />
mayor probabilidad de avistamientos junto con la información<br />
complementaria sobre el análisis explicativo que las dotará de la veracidad<br />
necesaria para que resulte interesante para el gran público.<br />
2.3 Empresas Organización de Eventos<br />
Un sector relacionado con las agencias de turismo y las oficinas de Turismo<br />
WE CAN locales, MAKE son las INDIVIDUAL empresas dedicadas OFFER a la organización FOR YOU de eventos. JUST<br />
TELL Ofreceremos US WHAT alternativas YOUR de experiencias BUSINESS de coaching NEEDS y actividades<br />
grupales para aquellas pymes y multinacionales que busquen desarrollar<br />
actividades de cohesión entre sus trabajadores en una temática totalmente<br />
ajena al mundo empresarial.<br />
ANÁLISIS UFOS<br />
15
3 Segmento de clientes Publicaciones<br />
Como tercer y último segmento de cliente, encontramos a las diferentes agencias tanto<br />
nacionales como internacionales que se ocupan de temas de estas características.<br />
Ofreceremos los resultados finales de la investigación con el fin de demostrar a la comunidad de<br />
ufólogos la relación encontrada entre los avistamientos registrados a lo largo de los últimos 70<br />
años y otros fenómenos externos que puedan sacar a la luz supuestos fraudes en los<br />
avistamientos. Así como poner de manifiesto aquellos resultados que con los registros obtenidos<br />
den lugar a una duda razonable sobre la veracidad de la información, puesto que como veíamos<br />
al principio, no existen explicación lógica y/o científica para alguno de estos fenómenos y las<br />
principales instituciones gubernamentales los consideran un engaño.<br />
No obstante, no será suficiente con identificar el público más adecuado para nuestro modelo de<br />
negocio, si no que necesitaremos contar con producto capaz de diferenciarse entre los similares<br />
ya existentes en el mercado, y aportar un valor añadido a nuestros clientes para conseguir tanto<br />
la satisfacción del cliente final como la distribución orgánica de la información que suponga un<br />
beneficio extra para las Agencias y Oficinas de Turismo.<br />
Para ello identificamos cuáles serán las actividades claves para poder dotarlas a continuación de<br />
contenido relevante para todos nuestros públicos.<br />
16<br />
ANÁLISIS UFOS
Actividades clave<br />
CLASIFICACIÓN DE LA INFORMACIÓN POR ESTADOS<br />
A través del cine y la televisión unos pocos estados de América del Norte se han convertido<br />
en protagonistas de los fenómenos extraterrestres, mientras que los registros de<br />
avistamientos se han venido sucediendo a lo largo de todo el país.<br />
Nuestro objetivo con este análisis es dotar a las agencias de viajes de nuevos puntos de<br />
interés y valor añadido que puedan constituir fuentes de ingreso adicionales, bien como<br />
rutas añadidas a los viajes habituales o bien como incremento en el ingreso por<br />
excursiones organizadas en destinos frecuentes.<br />
ANÁLISIS DE PROBABILIDAD DE FRAUDE<br />
Los registros de avistamientos son muchos y constantes a lo largo de los últimos años. El<br />
interés turístico despertado en lugares como Roswell supone una fuente de ingresos<br />
fundamental para una población relativamente pequeña, por lo que existen sospechas de<br />
que los propios nativos de la ciudad reporten falsos avistamientos con el fin de seguir<br />
atrayendo la atención de los turistas.<br />
Con el fin de despejar todas las dudas posibles, analizaremos qué factores externos pueden<br />
influir en el incremento de avistamientos por cada uno de los estados para procurar una<br />
información lo más contrastada posible a las empresas y desmentir los mitos más obvios.<br />
PROBABILIDAD DE AVISTAMIENTOS<br />
La frecuencia de registros de avistamientos en EEUU es constante y con una media de más<br />
de 200 avistamientos diarios, lo que nos permite calcular donde existe mayor probabilidad<br />
de que se produzca el siguiente avistamiento con un análisis predictivo.<br />
La incorporación de nuevos destinos junto con la probabilidad de avistamientos basado en<br />
los acontecimientos más recientes dotará a las agencias que comercialicen este producto<br />
de información más precisa que sin duda añadirá valor extra para sus clientes finales.<br />
DIVULGACIÓN DEL ANÁLISIS<br />
Al buscar medios de comunicación especializados y agencias internacionales dedicadas a<br />
este tipo de fenómenos para distribuir los resultados de nuestra investigación<br />
conseguiremos acercarnos al público más interesado en avistamientos OVNIs, lo que<br />
permitirá (en la medida de las posibilidades de distribución de estos medios) acercar al<br />
público nueva información.<br />
El objetivo de la divulgación en publicaciones especializadas es doble: por un lado,<br />
pretendemos dotar de fiabilidad científica a los resultados obtenidos; por otro, encontrar<br />
una fuente de ingresos adicional que permita financiar futuros análisis<br />
ANÁLISIS UFOS<br />
17
Evaluando al Target<br />
ENCUESTA SOBRE HÁBITOS DE VIAJE<br />
De cara a anticipar el éxito del proyecto en la medida de lo posible, se desarrolla una encuesta<br />
online en la que se pregunta sobre los diferentes hábitos de consumo de la población.<br />
Se envía una encuesta online a una BBDD de en torno a 1200 personas, todos ellos trabajadores<br />
mayores de 18 años, entre los que se recoge una muestra de 793 respuestas.<br />
El 76,7% declara que le gusta<br />
viajar, un total de 608<br />
entrevistados; sobre ellos<br />
realizaremos nuestro estudio<br />
para determinar cómo<br />
ofrecerles el mejor producto.<br />
La encuesta se divide en tres<br />
bloques, en los que se pretende<br />
determinar su perfil socio<br />
económico, así como los hábitos<br />
más frecuentes en sus viajes,<br />
tanto en la ejecución como en la<br />
planificación de las mismas.<br />
Determinamos con la encuesta<br />
que el 33,7% de los encuestados<br />
prefiere los destinos exóticos y<br />
diferentes. Si le preguntamos<br />
qué tipo le viaje les gustaría que<br />
las agencias de viajes le<br />
ofrecieran, el 43% responde que<br />
le gustaría recibir una<br />
“experiencia diferente”.<br />
Fig.6 – Infografía (parte 1)<br />
18 ANÁLISIS UFOS
Puesto que viajar es una actividad que le gusta a<br />
la mayoría de la población y, en la que<br />
detectamos un cierto interés por la<br />
diferenciación, creemos que un paquete de viaje<br />
que combine aspectos más tradicionales con<br />
experiencias al aire libre para el avistamiento de<br />
ovnis en directo podría suponer una fuente de<br />
negocio importante tanto para agencias de viaje<br />
tradicionales como para OTAs (Online Travel<br />
Agencies).<br />
Se elabora una<br />
infografía con los<br />
resultados de la<br />
encuesta<br />
19<br />
Fig.7 – Infografía (parte 2)<br />
ANÁLISIS UFOS
Desarrollo<br />
PLANTEADO EL ESCENARIO A DESARROLLAR, FASEAMOS EL PROYECTO<br />
ANTE EL QUE NOS ENFRENTAMOS<br />
Paso 01. Nuevas Fuentes de Información<br />
Buscaremos datos externos a la información obtenida de<br />
NUFORC con el fin de complementar la información con<br />
factores que puedan ayudarnos a certificar la veracidad de los<br />
registros.<br />
Los datos a encontrar serán los siguientes:<br />
01. Referencias Cinematográficas<br />
02. Referencias Web<br />
03. Variables Meteorológicas<br />
Paso 02. Limpieza y Normalización<br />
Una vez tengamos localizadas las fuentes complementarias,<br />
procederemos a normalizarlas junto a la BBDD inicial para<br />
desarrollar el modelo óptimo sobre el que trabajaremos.<br />
Dependiendo de la complejidad de las BBDD encontradas, la<br />
normalización será manual, o se automatizará a través de funciones<br />
en R.<br />
20 ANÁLISIS UFOS
Desarrollo<br />
del Proyecto<br />
Paso 03. Almacenamiento de<br />
datos<br />
Sobre el que trabajar las consultas<br />
necesarias para los análisis posteriores.<br />
Paso 04. Análisis y modelado<br />
Aplicaremos los lenguajes y herramientas<br />
aprendidas para el desarrollo del análisis<br />
descriptivo.<br />
FIN DEL<br />
PROYECTO<br />
Paso 05. Cuadro de Mandos<br />
Los resultados finales se presentarán<br />
volcados sobre un cuadro de mandos,<br />
para el que se seleccionará la<br />
herramienta de visualización más<br />
adecuada según las necesidades del<br />
proyecto.<br />
Conclusiones<br />
Resumen del<br />
aprendizaje.<br />
ANÁLISIS UFOS<br />
21
Extracción<br />
BBDD<br />
SELECCIONAMOS EL ORIGEN DE LAS FUENTES Y LA MEJOR MANERA DE<br />
OPTENER LA INFORMACIÓN<br />
REFERENCIAS CINEMATOGRÁFICAS<br />
El mayor archivo de cine y televisión global actual se encuentra agregado en el “INTERNET<br />
MOVIE DATA BASE”, que se aloja bajo el dominio IMDB.com en Internet. La web fue creada en<br />
octubre de 1990, y poco tiempo después, en 1998 fue adquirida por Amazon.<br />
IMDB se constituyó en sus inicios como una base de datos pública, alimentada por usuarios<br />
anónimos que fueron completándola hasta convertirla hoy en día el mayor repositorio de cine.<br />
22 ANÁLISIS UFOS
A través del motor de búsqueda de la web,<br />
encontramos un listado de referencias<br />
cinematográficas sobre temática<br />
extraterrestre agregado desde1898 hasta<br />
2016.<br />
Un total de 268 títulos cinematográficos,<br />
recopilados por los usuarios de IMDB.<br />
Puesto que se trata de una base de datos<br />
creada por usuarios, asumimos que existe un<br />
margen de error que consideramos aceptable<br />
dado el volumen de información obtenido.<br />
Fig. 8 – Captura IMDB<br />
https://www.imdb.com/list/ls055028710/<br />
Analizado el entorno, optamos por utilizar una de las herramientas de scraping que ofrece el<br />
mercado en lugar de desarrollar un nuevo código. La herramienta seleccionada es IMPORT IO, a<br />
través de su aplicación web nos permitirá rastrear el contenido de una web, seleccionar los datos<br />
que deseamos extraer y guardarlos en un archivo .csv o json.<br />
El proceso que seguimos es el siguiente:<br />
1. Registro en la web con una licencia de prueba.<br />
Esta licencia nos ofrece acceso libre a todas las características de la herramienta, limitando el<br />
número de consultas máximas que podemos hacer, 500. Para nuestro ejercicio, lo<br />
consideramos aceptable.<br />
2. Introducimos la URL de la web de<br />
IMDB que deseamos.<br />
En este momento se carga una<br />
réplica de la web sobre Import IO en<br />
la que aparecen claramente<br />
identificadas las áreas con formato<br />
tabla cuando pasamos el cursor<br />
sobre ellas.<br />
Fig.9 –Captura Import IO<br />
ANÁLISIS UFOS<br />
23
3. Comprobación de la tabla resultante.<br />
Antes de proceder a la extracción de la<br />
información, la herramienta ofrece la<br />
posibilidad de pre visualizar el<br />
resultado que obtendríamos con los<br />
elementos seleccionados, así como del<br />
formato de la tabla y las columnas de<br />
las que se compondría.<br />
Fig10 –Captura Import IO<br />
Esta es una de las facetas de la herramienta que consideramos más valiosas, puesto que la<br />
conversión de la información al fichero definitivo es un proceso lento, y la pre visualización permite<br />
corregir errores antes de solicitar la descarga.<br />
4. Extracción de la data del website.<br />
Como último paso, y simplemente tras pulsar un botón, procedemos a la extracción de la<br />
información.<br />
La herramienta permite repetir la consulta con la periodicidad deseada (días, semanas, meses…), lo<br />
que resulta muy útil para extraer información de aquellos sites que se actualizan de forma<br />
continuada. Para este tipo de ejemplos, excederíamos las limitaciones de la versión gratuita y sería<br />
necesario contratar una licencia.<br />
Con este sencillo proceso, obtenemos un archivo en csv con la información de las referencias de cine<br />
que buscamos.<br />
El objetivo de esta tabla será cruzar su información con los datos extraídos a partir de NUFORC para<br />
analizar si los años con lanzamientos cinematográficos están directamente relacionados con los<br />
periodos de mayor número de avistamientos.<br />
Los resultados deberán dar respuesta a nuestra hipótesis número 1:<br />
WE CAN MAKE INDIVIDUAL OFFER FOR YOU JUST<br />
TELL US WHAT YOUR BUSINESS NEEDS<br />
Las referencias culturales producen ruido sobre los medios de<br />
comunicación que sugestionan a la población y aumentan el<br />
número de avistamientos.<br />
24<br />
ANÁLISIS UFOS
VIDEOS UFO SUBIDOS A YOUTUBE<br />
Siguiendo la lógica de la primera hipótesis, presuponemos que al igual que puede existir una<br />
relación directa entre el cine y los avistamientos, los videos que los usuarios suben de manera<br />
orgánica a sus canales de YouTube deberían coincidir en fecha y lugar con los eventos más<br />
importantes recogidos en la base de datos de NUFORC.<br />
En el caso de YouTube contamos con una gran desventaja al tratarse de una plataforma<br />
relativamente joven. YouTube se crea en 2005 como una plataforma privada agregadora de<br />
videos.<br />
En 2006 esta plataforma es adquirida por Google, quien empieza su explotación comercial hasta<br />
transformarla en la mayor plataforma de consumo de video online a nivel mundial.<br />
El repositorio de datos con el que cuenta YouTube es infinito, no obstante, para resolver nuestro<br />
proyecto necesitamos contar tan sólo con información de videos relacionados con Ovnis.<br />
Para acceder a la información de YouTube lo hacemos a través de su API oficial.<br />
A través de la web para developers de Google, obtenemos el listado de información que<br />
podremos extraer del canal para la operación “list”, que será la que recupere información. El<br />
resto de operaciones disponibles a través de la API no resultan interesantes para este proyecto.<br />
Fig11 –Captura YT Developers site<br />
ANÁLISIS UFOS<br />
25
LA API PERMITE UN MÁXIMO DE 50<br />
REGISTROS POR CONSULTA,<br />
por lo que no es posible hacerlo en una sola llamada, si no<br />
que será necesario ir iterando las fechas para que alcanzar<br />
un número de registros más amplio.<br />
La iteración de fechas la haremos a nivel diario, por lo que<br />
le pediremos al código que para cada día desde 2005,<br />
devuelva información sobre las consultas relacionadas con<br />
“UFO”. Esta información la acompañaremos de<br />
parámetros adicionales para completar el registro final:<br />
- Fecha de Publicación del Video<br />
- Título<br />
- Descripción del video<br />
Fig12 –Código Python Conexión API YT<br />
Le pedimos al código que nos devuelva los 50<br />
primeros vídeos más vistos cada día desde la<br />
fecha de creación del canal hasta hoy.<br />
Este tipo de contenido no es muy frecuente en<br />
YouTube, día tras días, los videos más vistos<br />
aparecen repetidos.<br />
LA ITERACIÓN<br />
PROVOCA LA<br />
DUPLICIDAD DE<br />
REGISTROS<br />
26<br />
ANÁLISIS UFOS
BASE DE DATOS METEOROLÓGICA<br />
En tercer lugar, nos planteamos una última hipótesis:<br />
Las condiciones climatológicas afectan a la visibilidad y, por tanto, a la<br />
veracidad de los avistamientos.<br />
La cuarta base de datos con la que trabajaremos la encontramos ya creada en la web.<br />
Buscábamos un histórico de datos climatológicos que comprendieran un rango de fechas de al<br />
menos 20 años para poder contar con al menos el 50% de la información extraída en NUFORC.<br />
La BBDD la encontramos a partir de Kaggle. Tras encontrar varios proyectos basados en<br />
climatología, nos ponemos en contacto con el creador de un proyecto que tiene por objeto la<br />
evolución del clima a nivel mundial.<br />
Puesto que la BBDD subida en este proyecto no contiene los campos exactos que necesitábamos,<br />
nos ponemos en contacto con el usuario, quien nos facilita la BBDD original que el mismo había<br />
obtenido mediante scraping de la web WEATHER UNDERGROUNDG.<br />
Esta base de datos contiene registros desde 1995, pero sólo nos interesarán aquellos que<br />
coincidan en localización y timestamp con la base de datos de avistamientos.<br />
ANÁLISIS UFOS<br />
27
Normalización<br />
Las diferentes bases de datos con las que vamos<br />
a trabajar en este proyecto se han extraído<br />
mediante técnicas de scraping.<br />
Esta información, pese a ser visualmente<br />
correcta desde el navegador, en el momento de<br />
rastrearse y archivarse en un nuevo documento,<br />
ve comprometido el formato inicial añadiendo<br />
columnas o filas en blanco, con caracteres no<br />
UTF, etc.<br />
PROCESO DE LIMPIEZA<br />
El proceso de limpieza y normalización es la fase previa e indispensable al ETL (siglas que<br />
corresponden a Extracción – Transformación y Load (Carga)) y que constituyen un elemento<br />
importante cuya función completa el resultado de todo el desarrollo de la cohesión de<br />
aplicaciones y sistemas.<br />
La limpieza asegura la calidad de los datos que vamos a procesar. Evita, además la información<br />
no relevante o errónea antes de su volcado, lo que aligera el peso de la carga.<br />
La eliminación de información duplicada ayuda a ahorrar espacio en disco y agiliza las consultas.<br />
Para aplicar una normalización de forma correcta debemos tener en cuenta una serie de<br />
premisas:<br />
1. Aplicar reglas de unificación de datos Ej. Todo en minúsculas.<br />
2. Validación única de los datos de un campo Ej. Sustituir datos vacíos por “na”.<br />
3. Estandarización de datos Ej. Campo DNI siempre sin letra.<br />
28 ANÁLISIS UFOS
Extraction<br />
Transformation<br />
Load<br />
No es posible lograr un buen resultado final en un<br />
proceso ETL, acorde a los objetos marcados, sino se<br />
realiza previamente una buena limpieza de los datos.<br />
EXTRACCION<br />
Es necesario tener en cuenta lo siguiente:<br />
LA EXTRACCION NO<br />
DEBE ALTERAR LA BBDD<br />
DE ORIGEN<br />
1. Extraer los datos desde los sistemas de origen.<br />
2. Analizar los datos extraídos obteniendo un chequeo.<br />
3. Interpretar este chequeo para verificar que los datos<br />
extraídos cumplen la estructura que se esperaba.<br />
3. Convertir los datos a un formato preparado para<br />
iniciar el proceso de transformación.<br />
Además, uno de las prevenciones más importantes que<br />
se deben tener en cuenta durante el proceso de<br />
extracción sería el exigir siempre que esta tarea cause<br />
un impacto mínimo en el sistema de origen. Este<br />
requisito se basa en la práctica ya que, si los datos a<br />
extraer son muchos, el sistema de origen se podría<br />
ralentizar e incluso colapsar, provocando que no<br />
pudiera volver a ser utilizado con normalidad para su<br />
uso cotidiano.<br />
TRANSFORMATION<br />
La fase de transformación de un proceso de ETL aplica<br />
una serie de reglas de negocio o funciones, sobre los<br />
datos extraídos para convertirlos en datos que serán<br />
cargados.<br />
Declarativas. | Independientes. | Claras. | Inteligibles.<br />
CARGA (LOAD)<br />
A la hora de cargar los datos al sistema de destino se<br />
deberá considerar cual es el nivel de granularidad<br />
óptimo teniendo en cuenta el objetivo del proyecto.<br />
El trabajo de análisis se realizará sobre los datos<br />
cargados en el proceso ETL, no sobre la base de datos<br />
original.<br />
ANÁLISIS UFOS<br />
LA TRANSFORMACIÓN<br />
DEBERÁ IGNORAR TODO<br />
DATO NO ÚTIL PARA EL<br />
NEGOCIO<br />
LA CARGA AGREGADA DE<br />
INFORMACIÓN AGILIZA<br />
TIEMPOS DE CONSULTA<br />
29
Normalización NUFORC<br />
A TRAVÉS DEL SCRAPING WEB QUE EFECTUAMOS PARA OBTENER LA<br />
INFORMACIÓN ADQUIRIMOS UNA TABLA CON 114K REGISTROLSS (FILAS)<br />
Como hemos visto anteriormente, el propio código desarrollado en Python está configurado para<br />
eliminar aquellos caracteres que inicialmente sabemos que nos darán problemas en la<br />
consolidación final de los datos: comillas dobles, comillas simples, espacios, saltos de página, …<br />
Esta pequeña corrección facilita el trabajo de normalización posterior, pero no es suficiente<br />
para poder considerarla estándar.<br />
La tabla original cuenta con los siguientes campos, que pasaremos a comentar para detallar su<br />
normalización.<br />
DATE / TIME<br />
Fecha en la que se produce el<br />
avistamiento.<br />
Se devuelve en formato<br />
mm/dd/aa hh:mm en la<br />
mayoría de los registros, pero<br />
encontramos variaciones a lo<br />
largo de las más de cien mil<br />
filas.<br />
Localizamos y eliminamos las<br />
filas sin dato en este campo.<br />
Con los resultados restantes,<br />
hacemos una segunda<br />
normalización con el fin de que<br />
todas las fechas tengan<br />
exactamente el mismo<br />
formato.<br />
CITY<br />
El campo ciudad tiene una<br />
dificultad añadida pues el<br />
volumen de ciudades supera<br />
las 24K.<br />
Puesto que la existen faltas de<br />
ortografía, ciudades escritas en<br />
varios idiomas y lugares<br />
concretos que no<br />
corresponden con ninguna<br />
ciudad, el trabajo no puede<br />
automatizase y tenemos que<br />
recurrir a una automatización<br />
manual.<br />
DEVELOPMENT<br />
STATE<br />
Los datos están compuestos<br />
por estados y países en código<br />
ISO. Para facilitar la lectura de<br />
la información se añade una<br />
columna descriptiva que<br />
contiene el nombre completo<br />
del país/estado.<br />
Los campos vacíos se<br />
completan con el código ISO y<br />
descripción correspondiente.<br />
Esta tarea no es sencilla pues<br />
nuestra referencia principal es<br />
el campo ciudad y existen<br />
ciudades con el mismo nombre<br />
en diversos lugares del planeta.<br />
Lorem ipsum dolour siter amet, consectetur<br />
30 adipiscing elites unc<br />
ANÁLISIS UFOS<br />
DEVELOPMENT<br />
Lorem ipsum dolor siter amet, consectetur adipiscing<br />
elites unc<br />
ac laoreet nisi. Doneci eget<br />
ac laoreet nisi. Doneci eget
Otros campos que contiene esta tabla son:<br />
1. Shape: Corresponde con la forma declarada del avistamiento y encontramos un total de<br />
29 referencias diferentes que agregamos y estandarizamos, dejando un total de 18<br />
formas distintas.<br />
2. Duración: Campo numérico que representa el tiempo de exposición al avistamiento y que<br />
unificaremos en segundos para todas las celdas.<br />
3. Comentarios: Este campo no lo trabajaremos en nuestro análisis, por lo que se mantiene<br />
el contenido original.<br />
4. Fecha de publicación: No lo consideramos relevante y se elimina de la tabla normalizada.<br />
Además de la estandarización, completamos la información con datos que necesitaremos para<br />
profundizar en el análisis:<br />
Coordenadas de geolocalización por ciudad.<br />
Día de la semana, nombre del mes.<br />
Por último, con el fin de explotar la información con un objetivo lúdico a posteriori, creamos<br />
campos que relacionen los datos reales de NUFORC con contenido literario sobre la posible<br />
procedencia de los avistamientos.<br />
https://www.nasa.gov/feature/jpl/new-clues-to-trappist-1-planet-compositions-atmospheres<br />
Fig13 –Captura NASA, Composición Sistemas Solares<br />
ANÁLISIS UFOS 31
PLANETAS HABITABLES<br />
En febrero de 2018 la NASA publica la<br />
composición de los siete planetas que<br />
orbitan a la cercana estrella enana ultra<br />
fría TRAPPIST-1, es básicamente rocosa<br />
y, potencialmente, algunos podrían<br />
albergar más agua que la Tierra.<br />
El sistema planetario de esta estrella está<br />
compuesto de siete planetas terrestres templados,<br />
de los cuales cinco (b, c, e, f y g) son similares en<br />
tamaño a la Tierra, y dos (d y h) son de tamaño<br />
intermedio entre Marte y la Tierra. Tres de los<br />
planetas (e, f y g) orbitan dentro de la zona<br />
habitable<br />
120 Horas de trabajo invertidas en la<br />
normalización de las BBDD<br />
CÓMO COMBINAMOS LA<br />
INFORMACIÓN DE LA NASA<br />
Partimos de los datos reales: nombre del<br />
planeta, nombre del Sistema solar, color y<br />
temperatura y establecemos una relación<br />
basada en la siguiente hipótesis:<br />
A más frio y menor luminosidad, mayor<br />
probabilidad de Éxodo<br />
Establecemos una relación entre la frecuencia de<br />
viaje y la forma del avistamiento:<br />
45% Total -Muy frecuente: luces, formaciones<br />
de varios objetos y naves triangulares...<br />
33% Total- Frecuentes: formas circulares y<br />
esféricas.<br />
22% Total -Poco frecuente: formas cilíndricas e<br />
indefinidas.<br />
32<br />
Damos así coherencia a la información pese a<br />
tratarse de datos ficticios<br />
ANÁLISIS UFOS
Normalización resto de BBDD<br />
BBDD IMBD – CINE Y TV<br />
Esta base cuenta con 276 entradas, cada entrada corresponde a un título de película o serie de<br />
televisión relacionada con UFOS o visitas alienígenas.<br />
La tabla se compone de 26 columnas diferentes, de las que extraeremos solo la información<br />
relevante para nuestro análisis, mientras que el resto las descartaremos.<br />
Campos de la BBDD:<br />
- TITLE(srt): Título de la película.<br />
- YEAR(srt): Año de lanzamiento y tipo de pantalla.<br />
- CERTIFICATE(srt): Clasificación por edades.<br />
- RUNTIME(srt): Duración de la película.<br />
- GENRE(srt): Género cinematográfico.<br />
- VALUE(int): Puntuación de la película del 1 al 10.<br />
- SUMMARY(srt): Sinopsis.<br />
- DIRECTOR/sTART(srt): Director y reparto.<br />
Se eliminan acentos y caracteres especiales. Los títulos se pasan a formato frase. Se comprueba<br />
que las duraciones y los años de lanzamientos tengan el mismo formato en todos los campos<br />
para su posterior utilización.<br />
BBDD YOUTUBE<br />
La extracción de YouTube ha tenido como resultado 3.500 registros en 3 columnas:<br />
- TITLE (srt): Título del video.<br />
- DESCRIPTION (SRT): Resumen del contenido del vídeo<br />
Coincide con el título.<br />
PUBLISHED AT Fecha de publicación del video.<br />
No obstante, esta información está altamente duplicada debido a la iteración diaria del bucle.<br />
De los más de 220K registros, sólo extraemos 371 videos de duplicados.<br />
La información de los campos no es determinante para establecer una localización del UFO, por<br />
lo que a priori descartamos esta tabla para nuestro análisis.<br />
ANÁLISIS UFOS 33
Almacenamiento<br />
de<br />
datos<br />
LAS REGLAS DE NORMALIZACIÓN NO CONSIDERAN EL<br />
RENDIMIENTO. EN ALGUNOS CASOS ES NECESARIO CONSIDERAR<br />
LA DESNORMALIZACIÓN PARA MEJORAR EL RENDIMIENTO.<br />
DESNORMALIZACIÓN<br />
La desnormalización es la duplicación intencionada de columnas en varias tablas, lo cual aumenta<br />
la redundancia de datos. Crear más tablas es necesario, pues, para llegar a una mejor<br />
normalización. Sin embargo, a mayor número de tablas, mayor número de combinaciones al<br />
recuperar los datos; lo que contribuye a la ralentización de las consultas.<br />
La unión de muchas tablas requiere operaciones de entrada/salida (I/O) y lógica de<br />
procesamiento adicional en el disco, por lo que requeriremos de la ayuda de un software para<br />
realizar las consultas.<br />
34 ANÁLISIS UFOS
Rehacemos la información de la tabla normalizada de NUFORC para crear el modelo óptimo de<br />
nuestra base de datos.<br />
Nuestro objetivo es alcanzar un modelo estrella, donde nuestra tabla de hechos esté acompañada de<br />
5 tablas de dimensiones. Estas tablas estarán compuestas por la siguiente información:<br />
TABLA DE HECHOS<br />
Fig13 –Captura Tabla BBDD NUFORC<br />
TABLAS DE DIMENSIONES<br />
DIMENSION LOCATION<br />
DIMENSION DATE<br />
Fig14 –Captura Tabla BBDD NUFORC<br />
Fig15 –Captura Tabla BBDD NUFORC<br />
ANÁLISIS UFOS<br />
35
TABLAS DE DIMENSIONES<br />
DIMENSION PLANET<br />
Fig16 –Captura Tabla BBDD NUFORC<br />
DIMENSION TIME<br />
DIMENSION SHAPE<br />
Fig17 –Captura Tabla BBDD NUFORC<br />
Fig18 –Captura Tabla BBDD NUFORC<br />
MODELO DE DATOS<br />
Nuestro modelo de estrella dibujará un mapa de relación que en teoría debería ser similar a la<br />
siguiente figura:<br />
Fig19 –Modelo Estrella Teórico<br />
36<br />
ANÁLISIS UFOS
En este diseño del almacén de datos la Tabla de Variables (Hechos) está rodeada por<br />
Dimensiones y juntos forman una estructura que permite implementar mecanismos básicos para<br />
poder utilizarla con una herramienta de consultas OLAP.<br />
Esquema estrella del Almacén de Datos implementa un diseño lógico relacional de base de datos<br />
que resulta en que las tablas de hechos representan la Tercera Forma Normal (3FN) y las<br />
dimensiones representan la Segunda Forma Normal (2FN).<br />
El motivo de mantener las tablas en el modelo relacional y permitir el almacenamiento de<br />
información redundante es optimizar el tiempo de respuesta de base datos y dar información a<br />
un usuario en el menor tiempo posible. En este modelo, para obtener la información solicitada,<br />
no hay que construir una sentencia SQL muy compleja que lea muchas tablas de una vez. Una<br />
herramienta de consultas sólo tiene que acceder una tabla.<br />
Se puede encontrar casi cada información de una tabla de hechos en una tabla de dimensiones.<br />
Lo característico de la arquitectura de estrella es que sólo existe una tabla de dimensiones para<br />
cada dimensión y esta tabla representa la segunda forma normal.<br />
Fig20 –Captura SQL server. Modelo Estrella Real<br />
ANÁLISIS UFOS<br />
37
Gestor BBDD: SQL SERVER<br />
Structured Query Language, más conocido por su acrónimo SQL, es un lenguaje de<br />
programación diseñado para administrar sistemas de gestión de bases de datos.<br />
SQL Server es un sistema de BBDD relacionales de Microsoft diseñado para el entorno<br />
empresarial diseñada para el procesamiento de transacciones en línea y el almacenamiento de<br />
datos<br />
En su versión SQL Server Express, encontramos una edición SQL Server que ofrece un almacén<br />
de datos gratuito, fiable y potente, ideal para manejar BBDD ligeras. Esta solución nos evita<br />
hacer un desembolso económico, y pese a sus limitaciones, nos permite trabajar nuestro<br />
proyecto sin dificultades.<br />
Otro punto a favor de la aplicación es que los requerimientos para su instalación no son muy<br />
elevados, con 512Mb de RAM y 4,2GB de espacio disponible en el disco duro de nuestras<br />
máquinas, podemos hacer correr esta aplicación.<br />
Para nuestro proyecto, SQL Server nos facilitará la manera de hacer consultas a la BBDD NUFORC<br />
que, por el volumen de datos, no podríamos hacer desde una hoja de cálculo convencional.<br />
En un futuro, nos permitirá hacer conexiones directas a otras herramientas como Tableau para<br />
completar el cuadro de mandos en tiempo real.<br />
38 ANÁLISIS UFOS
SE HA TRABAJADO CON SQL SERVER EN EL DESARROLLO DEL<br />
PROYECTO PARA PROFUNDIZAR EN EL ANÁLISIS.<br />
A continuación, ilustramos con ejemplos como han sido algunas de esas<br />
consultas:<br />
¿AVISTAMIENTOS POR CIUDAD EN 2012?<br />
?<br />
Fig21 –Captura SQL Server<br />
¿AVISTAMIENTOS POR CIUDAD EN 2012 Y MES?<br />
?<br />
Fig22 –Captura SQL Server<br />
¿PLANETA DE PROCEDENCIA EL LOS<br />
AVISTAMIENTOS EN NEW YORK CITY?<br />
?<br />
Fig23 –Captura SQL Server<br />
ANÁLISIS UFOS<br />
39
Modelado y<br />
análisis<br />
SELECCIONAMOS EL ORIGEN DE LAS FUENTES Y LA MEJOR<br />
MANERA DE OPTENER LA INFORMACIÓN<br />
SERIE TEMPORAL<br />
Utilizando R Studio hemos realizado el estudio de nuestro data set de avistamientos. No<br />
volveremos a extendernos en este apartado sobre el contenido del mismo, pero sí recordaremos<br />
que contamos con más de 80K de avistamientos. Por tanto, es aconsejable, sino imprescindible,<br />
apoyarnos en R para estudiar su contenido e intentar extraer conclusiones.<br />
Dadas las características de nuestro data set vamos a centrar nuestro estudio en las series<br />
temporales.<br />
40 ANÁLISIS UFOS
Una serie temporal se define como:<br />
Una colección de observaciones de una variable recogidas secuencialmente<br />
en el tiempo y, aunque no es nuestro caso, estas observaciones se suelen<br />
recoger en instantes equidistantes en el tiempo.<br />
Encontramos multitud de series temporales en todos los campos. Simplemente a modo de<br />
ejemplo citaremos algunos. En economía o marketing, la evolución del precio de la vivienda, el<br />
índice del barril de Brent, PIB anual…<br />
En factores socio demográficos, número de inmigrantes en una determinada región, tasa de<br />
natalidad anual, renta media per cápita…Incluso en medioambiente, podemos citar los índices de<br />
calidad del aire, la temperatura media mensual, la lluvia recogida diariamente en una ciudad y la<br />
cantidad de metros cúbicos recogidos en un embalse y su evolución.<br />
No citaremos más ejemplos porque son demasiado numerosos; sino que vamos a avanzar<br />
revisando algunas clasificaciones de las series temporales.<br />
Si se pueden predecir exactamente los valores, se dice que las series son<br />
determinísticas.<br />
Si el futuro sólo se puede determinar de modo parcial por las observaciones<br />
pasadas y no se pueden predecir exactamente, se considera que los futuros valores<br />
tienen una distribución de probabilidad que está condicionada a los valores<br />
pasados. En este caso, las series son así estocásticas.<br />
Siguiendo el modo habitual de estudio cuando se trabaja con una serie temporal lo que hemos<br />
hecho en nuestro estudio es dibujar y analizar las medidas descriptivas básicas.<br />
Tendencia:<br />
Cambio a largo plazo que se produce<br />
en relación al nivel medio, o el cambio<br />
a largo plazo de la media. La tendencia<br />
se identifica con un movimiento suave<br />
de la serie a largo plazo.<br />
Estacionalidad:<br />
Periodicidad o variación de cierto<br />
periodo (anual, mensual ...). Ej. el paro<br />
laboral aumenta en invierno y<br />
disminuye en verano. Estos tipos de<br />
efectos se pueden eliminar del<br />
conjunto de los datos<br />
desestacionalizando la serie original.<br />
Componente aleatoria:<br />
Valores que afectan de forma aleatoria.<br />
Se puede estudiar qué tipo de<br />
comportamiento aleatorio presentan<br />
estos residuos, utilizando algunos tipos<br />
de modelo probabilístico que los<br />
describa.<br />
ANÁLISIS UFOS<br />
41
Este enfoque no siempre resulta ser el más adecuado, pero es interesante cuando en la serie se<br />
observa cierta tendencia o cierta periodicidad.<br />
Más adelante mostraremos el resultado de nuestro estudio, y aún a riesgo de caer en el spoiler,<br />
adelantaremos que nuestra serie presenta una tendencia al alza, una estacionalidad acusada en los<br />
meses de veranos y algún outlier en el mes de noviembre.<br />
CLASIFICACIÓN DESCRIPTIVA DE LAS SERIES TEMPORALES<br />
Una serie es estacionaria cuando es<br />
estable, es decir, cuando la media y la<br />
variabilidad son constantes a lo largo del<br />
tiempo. La serie tiende a oscilar<br />
alrededor de una media constante y la<br />
variabilidad con respecto a esa media<br />
también permanece constante en el<br />
tiempo. Es una serie constante a lo largo<br />
del tiempo<br />
Para este tipo de series tiene sentido<br />
conceptos como la media y la varianza.<br />
Sin embargo, también es posible aplicar<br />
los mismos métodos a series no<br />
estacionarias si se transforman<br />
previamente en estacionarias.<br />
No estacionarias:<br />
Son series en las cuales la media y/o<br />
variabilidad cambian en el tiempo.<br />
Los cambios en la media<br />
determinan una tendencia a crecer<br />
o decrecer a largo plazo, por lo que<br />
la serie no oscila alrededor de un<br />
valor constante.<br />
Hasta aquí la pequeña introducción de las series temporales, comenzamos con nuestro estudio<br />
práctico creando la serie temporal.<br />
Partiendo de nuestro data set hallamos la serie de estudio eligiendo la columna de avistamientos<br />
por año y mes. En el eje de coordenadas mostramos el número de avistamientos y en las abscisas el<br />
número de meses/año de nuestro estudio.<br />
Observamos que prácticamente hasta el año 1995 el número de avistamientos es reducido y<br />
constante. Aproximadamente en 1995, el número de avistamientos se incrementa claramente, la<br />
WE CAN MAKE INDIVIDUAL OFFER FOR YOU JUST<br />
tendencia alcista se suaviza hacia el 2005 puesto que el número de avistamientos se mantiene<br />
TELL US WHAT YOUR BUSINESS NEEDS<br />
bastante constante desde el 2005 a casi el 2010. Del 2010 al 2013 la tendencia alista es mucho más<br />
acusada y también lo es la diferencia entre el número máximo y mínimo de avistamientos. (fig 24)<br />
42<br />
ANÁLISIS UFOS
Fig24 –Serie Estacional modelada en R<br />
El siguiente gráfico que mostramos es un diagrama de cajas y bigotes por meses (fig 25). En él,<br />
podemos observar claramente que durante los meses de verano el número de avistamientos es<br />
mayor que en el resto del año. Es decir, presenta una estacionalidad clara.<br />
Fig25 –Serie Estacional modelada en R<br />
Dada la posición de la mediana muy próxima a los valores del primer cuartil en todos los meses,<br />
la distribución no es en absoluto simétrica. Además, en todos los meses el bigote inferior está<br />
mucho más cercano a los valores del primer cuartil y a la mediana; mientras que los valores del<br />
bigote superior están mucho más alejados de los valores del tercer cuartil.<br />
ANÁLISIS UFOS<br />
43
En el mes de noviembre observamos outliers más allá del límite superior. Si buscamos una razón<br />
con origen "social" podríamos encontrarla en las festividades de Halloween, Noche de los<br />
Muertos o Difuntos...<br />
A continuación, vamos a desglosar la serie temporal en sus componentes = Tendencia, Senoidal y<br />
Aleatoria.<br />
La línea random, muestra el incremento de avistamientos desde 2005 aproximadamente y un<br />
fuerte incremento alrededor del año 2010.<br />
La curva que representa la estacionalidad nos confirma lo que veníamos comentando hasta<br />
ahora, nuestros avistamientos tienen una fuerte componente estacional.<br />
Y, por último, si nos apoyamos en la línea de tendencia confirmamos la tendencia alcista a partir<br />
de 1998.<br />
Fig26 –Serie Estacional modelada en R<br />
44<br />
ANÁLISIS UFOS
Continuando con la figura 26, observamos cómo la última gráfica del set muestra una tendencia al<br />
alza y una estacionalidad perfecta. No obstante en el periodo posterior a la década de los 90<br />
empezamos a ver cierta aleatoriedad.<br />
Es decir, la gráfica nos muestra que existe una variable o variables no identificadas que están<br />
interrumpiendo en el análisis. Eso quiere decir que existe una variable no identificada que está<br />
influyendo en los datos.<br />
Para continuar, si deseamos estabilizar la varianza debemos tomar logaritmos. Por tanto,<br />
dibujamos el logaritmo de nuestra serie temporal. Observamos que hasta 1998 aproximadamente<br />
la varianza es mucho mayor que en los años sucesivos donde se mantiene prácticamente estable.<br />
Consideramos que la explicación se debe al incremento significativo del número de datos<br />
disponible desde esta fecha.<br />
Fig27 –Serie Estacional modelada en R<br />
Para eliminar la tendencia en la serie temporal realizamos un estudio de las diferencias entre el<br />
número de avistamientos t con el anterior, es decir, t-1.<br />
Al igual que en la gráfica anterior la diferencia es significativamente menor desde 1998 por el<br />
incremento del número de registros.<br />
ANÁLISIS UFOS<br />
45
Vemos representado un correlograma de la serie (fig 27b), es decir, una representación gráfica de<br />
las autocorrelaciones entre xt y xt+k, en función de k. Donde k es igual a 1 año.<br />
Vemos que las dos primeras autocorrelaciones se salen de las bandas de Barlett . Además, se<br />
muestra periodos de incremento y luego de decrecimiento que pueden tomarse como evidencia<br />
de autocorrelación<br />
Fig27b –Serie Estacional modelada en R<br />
Observamos que tenemos estacionalidad anual eliminamos la serie temporal t-12. En este caso en<br />
vez de estudiar la diferencia con el avistamiento anterior, se contrastará con el avistamiento<br />
situado en doce posiciones anteriores.<br />
Fig28 –Serie Estacional modelada en R<br />
44<br />
ANÁLISIS UFOS
Para dar respuesta a los entusiastas de los fenómenos ovnis, con la función auto.arima hemos<br />
dibujado un predictivo<br />
Fig29 –Serie Estacional modelada en R<br />
Fig30 –Serie Estacional modelada en R<br />
La predicción descrita por la línea azul muestra un comportamiento bastante similar al de los años<br />
inmediatamente anteriores, es decir, continuar con la tendencia al alza y una diferencia bastante<br />
acusada entre el número máximo y mínimo de avistamientos.<br />
ANÁLISIS UFOS<br />
45
Influencia cinematográfica en los<br />
avistamientos<br />
COMPROBAMOS SI EXISTE UNA RELACIÓN ENTRE LO GRABADO EN EL<br />
IMAGINARIO COLECTIVO Y EL AUMENTO DE LOS AVISTAMIENTOS.<br />
Profundizando en el estudio de los avistamientos ovnis, a continuación, vamos a intentar<br />
determinar si esta influencia existe.<br />
Tomando como base los data set de IMBD y el de avistamientos ovnis, enfrentamos las gráficas<br />
del acumulado intentando ver si mantienen una forma o tendencia similares.<br />
Tendremos en cuenta dos campos de la BBDD de IMDB para llevar a cabo esta comparativa:<br />
- El volumen de películas: Presuponiendo que un mayor de títulos en cartelera en el<br />
periodo de un año pueden marcar la conversación social en torno a la temática<br />
extraterrestre.<br />
- La valoración de las películas será el segundo campo a analizar presuponiendo que a<br />
mayor número de votos tienen mayor posibilidad de influencia sobre los avistamientos.<br />
En ambos casos, la correlación con los avistamientos, nos llevaría a pensar que existe una<br />
influencia cultural que condiciona a la población a la hora de asemejar objetos no identificados<br />
con visitantes de otros planetas. Este factor nos ayudaría a identificar “fraude” en los<br />
avistamientos registrados.<br />
Recuperamos el evolutivo anual de<br />
avistamientos hasta 2014. Observamos<br />
un incremento de registros que<br />
relacionamos con el mayor acceso de la<br />
población a Internet.<br />
Fig31 –Evolutivo Anual Avistamentos en R<br />
.<br />
46 ANÁLISIS UFOS
En la fig. 32 vemos como la temática extraterrestre en el<br />
cine concentra mayor número de lanzamientos entre los<br />
años 50 y 90, periodo inmediatamente anterior al<br />
crecimiento de avistamientos registrados.<br />
Pese a que el volumen de referencias cinematográficas se<br />
ha mantenido estable estos últimos años, no observamos<br />
que haya una relación directa con el aumento de<br />
avistamientos. Si nos demuestra, no obstante, que el<br />
interés en esta temática sigue despertando inquietudes que<br />
se reflejan en la creación de nuevas producciones.<br />
Fig32 –Evolutivo Número de Peliculas - R<br />
Fig33 –Evolutivos Votos de Cine<br />
Lo mismo sucede en la comparación con las<br />
votaciones.<br />
Ambos casos muestran un pico previo a 2010,<br />
con un incremento en el número de películas,<br />
cuyo efecto apenas se ve representado en el<br />
evolutivo de avistamientos.<br />
NO PODEMOS<br />
ESTABLECER UNA<br />
RELACIÓN ENTRE EL<br />
NÚMERO DE<br />
AVISTAMIENTOS Y EL<br />
NÚMERO DE PELÍCULAS<br />
O VOTOS.<br />
ANÁLISIS UFOS<br />
47
Análisis por localización<br />
EEUU CONCENTRA EL 88% DEL VOLUMEN TOTAL DE AVISTAMIENTOS<br />
RECOGIDOS<br />
Tanto en las series temporales, como en los análisis anteriores ya habíamos visto cómo con el<br />
asentamiento de la penetración de internet aumentan exponencialmente el número de<br />
avistamientos registrados.<br />
De igual manera, EEUU aparece como zona principal en la que se producen estos avistamientos.<br />
Visualización de Avistamientos OVNIs<br />
en la última década (Mundial)<br />
Hemos realizado un análisis para visualizar cómo es esta evolución en las diferentes zonas del<br />
planeta.<br />
Como veremos en los mapas, la evolución por décadas demuestra claramente este aumento de<br />
avistamientos.<br />
48<br />
ANÁLISIS UFOS
De nuevo, nos apoyamos en RStudio para mostrar sobre un mapa la evolución de los<br />
avistamientos OVNI.<br />
Hemos ido modificando el código para obtener diferentes vistas, trabajamos con tres principales<br />
enfoques. En primer lugar, avistamientos globales, es decir el globo terráqueo tal y como lo<br />
muestra RStudio por defecto. La vista desde el meridiano de Greenwich, y dado que los<br />
avistamientos se concentran en USA la impresión de los avistamientos desde aquí.<br />
En el archivo anexo “Gráficas avistamientos.rmd” hemos ido comentando paso a paso el código.<br />
En enfoque de trabajo ha sido el siguiente, teniendo en cuenta el volumen de los avistamientos<br />
codificamos nuestro data set por décadas para poder agrupar los datos por décadas comenzando<br />
en 1910.<br />
Fig34-39 –Evolución x décadas #Avistamientos (RStudio)<br />
Luego eliminamos las filas con elementos vacíos, generamos la columna de latitud y longitud<br />
para trabajar, cargamos el mapa y lo dibujamos el mapa con todos los avistamientos. Fijamos el<br />
punto de vista que queramos en cada momento, y continuación generamos archivos pngs y a<br />
partir de ellos creamos el GIF.<br />
ANÁLISIS UFOS<br />
49
Cuadro de<br />
Mando<br />
REPRESENTACIÓN VISUAL DE LA INFORMACIÓN DE LA BASE DE<br />
DATOS NUFORC MEDIANTE UN CUADRO DE MANDOS<br />
TABLEAU<br />
Entre las diferentes soluciones de BI disponibles en el mercado para dashboarding,<br />
seleccionamos Tableau como base para nuestro desarrollo del cuadro de mandos.<br />
La facilidad de acceso a una licencia completa mediante nuestro carné de estudiante, así como<br />
su sencilla conexión con SQL son las principales características para tomar esta decisión.<br />
Desarrollamos un Dashboard sencillo, onepage, que permita acercarnos a los potenciales<br />
compradores de nuestra idea de negocio de una forma cercana, pero demostrando que<br />
dominamos las herramientas necesarias para ayudarles a desarrollar el producto final.<br />
50 ANÁLISIS UFOS
Fig40 – Captura Dashboard Tableau Análisis Final<br />
ANÁLISIS UFOS<br />
51
Conclusiones<br />
EFECTUADOS LOS ANÁLISIS ANTERIORES SOBRE NUESTRAS BASE<br />
DE DATOS, RESUMIMOS LAS CONCLUSIONES EXTRAÍDAS.<br />
NOS DECLARAMOS<br />
DATA BELIEVERS<br />
52 ANÁLISIS UFOS
LOS AMANTES DE LOS<br />
<strong>OVNIS</strong> SI EXISTEN<br />
El volumen de<br />
avistamientos ha sido<br />
constante en los últimos<br />
años e independiente de<br />
otras referencias culturales<br />
NO HAY PRUEBAS<br />
CONCLUYENTES DE<br />
FRAUDE<br />
Al igual que en el Proyecto Libro<br />
Azul, no hemos podido verificar la<br />
autenticidad o no de las<br />
declaraciones de avistamientos<br />
EL CINE NO FOMENTA<br />
LOS AVISTAMIENTOS<br />
Se ha diluido el fenómeno ovni<br />
entre películas de zombies,<br />
super heroes,etc., a pesar de<br />
ello continúa produciéndose<br />
trabajos audiovisuales de<br />
temática OVNI.<br />
FACTORES FAVORABLES PARA LOS<br />
AVISTAMIENTOS<br />
Observamos estacionalidad en los meses de verano, especialmente en<br />
climas despejados por lo que deducimos que o a los extraterrestres les gusta<br />
el buen tiempo o la visibilidad es un factor clave para los avistamientos.<br />
POSIBILIDADES DE MONETIZACIÓN<br />
EL SECTOR TURÍSTICO ES ADECUADO PARA APROVECHAR LAS<br />
POSIBILIDADES DE NEGOCIO DEL FENOMENO OVNI<br />
CONSIDERANDO LAS ESTACIONALIDAD DE LOS AVISTAMIENTOS<br />
Y EL INCREMENTO SIGNIFICATIVO DE AVISTAMIENTOS EN LAS<br />
ULTIMAS DOS DÉCADAS<br />
ANÁLISIS UFOS<br />
53
Próximos<br />
Pasos<br />
<br />
¿CUÁLES SERÍAN LOS PRÓXIMOS PASOS SI DECIDIÉRAMOS LLEVAR A LA<br />
REALIDAD EL OBJETO DE ESTE <strong>TFM</strong>?<br />
BUSINESS CANVAS >><br />
PLAN DE MARKETING >><br />
Partiremos del modelo de negocio de negocio<br />
descrito al comienzo de esta memoria, trabajando<br />
con la segmentación de clientes mencionada y el<br />
modelo canvas.<br />
VIABILIDAD >><br />
Es imprescindible profundizar en el análisis de<br />
viabilidad del negocio contrastando los costes e<br />
ingresos a corto, medio y largo plazo en los<br />
diferentes escenarios que se puedan plantear.<br />
Teniendo en cuenta lo sui generis de nuestro<br />
negocio siempre nos plantearíamos un escenario<br />
pesimista en los cálculos.<br />
BUSINESS ROADMAP. >><br />
Definiremos los principales milestones y el tiempo<br />
necesario para crear la infraestructura del negocio<br />
(RRHH, local físico o trabajo en remoto…). El<br />
enfoque siempre será intentar mantener los<br />
costes bajo un estricto control partiendo del MVP<br />
(Minimum Viable Product).<br />
Nos apoyaremos en foros<br />
especializados, es posible que<br />
decidamos lanzar alguna acción paralela<br />
de crowdfunding en foros especializados<br />
y evaluando a nuestro target<br />
desarrollemos una app con un predictivo<br />
de los avistamientos, aprovechando la<br />
data de TRAPPIST para fomentar el<br />
acercamiento a los más escépticos<br />
desde el humor.<br />
AGILE >><br />
Apostaremos por la mejora continua. No<br />
sólo nos mantendríamos focalizados en<br />
mantener una estructura ágil, sino que<br />
extrapolando algunas lessons learnt de<br />
las metodologías Lean y Agile de manera<br />
frecuente haremos un “sprint review”<br />
corrigiendo de la manera más rápida<br />
posible los errores que se hayan<br />
detectado.<br />
54 ANÁLISIS UFOS
Bibliografía<br />
MATERIAL DEL MASTER<br />
Campus EAE<br />
Egighian, G. (2014). “A transatlantic buzz”: flying saucers, extraterrestrials and<br />
America in the postwar Germany. Journal of Transatlantic Studies<br />
Eghigian, G. (2015). Making UFOs make sense: Ufology, science, and the history of<br />
their mutual mistrust. Public Understanding of Science<br />
Programación y estadística con R: Fundamentos de programación y técnicas para<br />
el análisis exploratorio, contraste de hipótesis y aprendizaje automático, Juan José<br />
de Haro<br />
Learning R, Richard Colton<br />
R for everyone, Jared Lander<br />
Python 3 para no programadores, Patricia González R<br />
Python Crash Course, Eric Mattes<br />
Learning Python, Mark Lutz, David Ascher<br />
SQL: QuickStart Guide – The Simplified Beginner’s Guide To SQL” By<br />
ClydeBank Technology<br />
“SQL Queries for Mere Mortals” By John L. Viescas and Michael J.<br />
Hernandez<br />
ANÁLISIS UFOS<br />
55
ANEXOS<br />
CODIGOS R<br />
Código 1. SERIE TEMPORAL<br />
<strong>TFM</strong>_<strong>OVNIS</strong>_SerieTemporal.Rmd<br />
Código 2. COMPARATIVA DE AVISTAMIENTOS VS. PELICULAS<br />
<strong>TFM</strong>_<strong>OVNIS</strong>_ComparativaAvistamientosVSPeliculas.Rmd<br />
Código 3. GRÁFICAS AVISTAMIENTOS<br />
<strong>TFM</strong>_<strong>OVNIS</strong>_GráficasAvistamientos.Rmd<br />
MAPAS<br />
MUNDIAL<br />
56 ANÁLISIS UFOS
EUROASIA<br />
EEUU<br />
ANÁLISIS UFOS<br />
57
CODIGOS PYTHON<br />
Código Scraping NUFORC<br />
scrappingNUFORC_UFO_ddbb_ok2.py<br />
Código conéxión API Youtube<br />
ConectarAPIYoutube_ok4.py<br />
DASHBOARD TABLEAU<br />
Análisis_Avistamientos_UFO.twb<br />
ENLACE A “ENCUESTA ONLINE”<br />
https://www.onlineencuesta.com/s/d3b8559<br />
INFOGRAFÍA COMPLETA RESULTADOS ENCUESTA “HABITOS DE VIAJE”<br />
Infografía_Hábitos<br />
deViaje.pdf<br />
ANÁLISIS UFOS<br />
57
09/2018<br />
<strong>TFM</strong><br />
BI & Innovación<br />
Tecnológica<br />
KAMILA LIS | CINTA SIMON | JUAN ROJO | CARMEN VALDÉS