FACULTAD DE ADMINISTRACION HOTELERA TURISMO Y GASTRONOMIA Carrera de Administración Hotelera USO DE GOOGLE Y TWITTER EN EL NOWCASTING DEL FLUJO DE LLEGADAS A HOSPEDAJES EN MÁNCORA Tesis para optar el Título Profesional de Licenciado en Administración Hotelera WENDY FIORELLA CASTILLO VALENCIA Asesor: Giannina Crespo Del Busto Lima –Perú 2017
44
Embed
FACULTAD DE ADMINISTRACION HOTELERA TURISMO Y …repositorio.usil.edu.pe/bitstream/USIL/3222/3/2017_Castillo-Valencia.… · 1.1. Planteamiento del problema El porcentaje de hogares
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
FACULTAD DE ADMINISTRACION HOTELERA
TURISMO Y GASTRONOMIA
Carrera de Administración Hotelera
USO DE GOOGLE Y TWITTER EN EL NOWCASTING DEL FLUJO DE LLEGADAS A
HOSPEDAJES EN MÁNCORA
Tesis para optar el Título Profesional de Licenciado en
Administración Hotelera
WENDY FIORELLA CASTILLO VALENCIA
Asesor:
Giannina Crespo Del Busto
Lima –Perú
2017
Índice
I. Introducción..................................................................................................................1
1.1. Planteamiento del problema………………………………......................................1
1.2. Formulación del problema.....................................................................................3
1.3. Justificación de la investigación............................................................................3
II. Marco Referencial........................................................................................................5
Al igual que lo señalado por Choi & Varian (2011), los resultados estadísticos evidencian
que existe correlación entre el número de arribos a hospedajes de Máncora y las
búsquedas relacionadas al distrito en cuanto a hospedajes . La relación es del tipo
directamente proporcional. El R-cuadrado alcanza un valor más alto cuando se incluye a
los datos del motor de búsqueda.
No ha resultado posible realizar la investigación de flujos diarios realizada por Zahkary,
et.al. (2009); tampoco se ha podido incluir variables como cancelación de reservas y
presencia de espectáculos, ya que no se ha podido acceder a dicha información . Sin
embargo, se coincide con el investigador en que la inclusión de variables adicionales
mejora el nivel de precisión de aquellos modelos que únicamente emplean datos históricos
sobre el número de arribos.
25
Resulta verdadero lo mencionado por Camacho & Pacce (2016): los datos del motor de
búsqueda se actualizan en tiempo real. Estos indicadores, además, contribuyen a
pronosticar la demanda hotelera, aunque el pronóstico funciona para un escenario de
tiempo inmediato o nowcasting.
No se cuenta con los datos del flujo de arribos turísticos al distrito de Máncora, pero resulta
verdadero lo señalado por Pan, et.al (2012): el modelamiento que pronostique llegadas a
hoteles en combinación con datos de un motor de búsqueda resulta viable cuando se usan
indicadores de arribos a hoteles. Por otro lado, al existir relación entre los flujos y
búsquedas mensuales, no se puede descartar la relación que puede existir entre ambas
variables si son evaluadas en forma semanal como lo hicieron los investigadores.
Yang, et.al. (2013) usaron datos relacionados a la cantidad de visitas a una página web y
la relacionaron con los arribos a hoteles. No resulta aplicable el uso de esa variable en esta
investigación porque no se ha podido encontrar una web especializada en hoteles de
Máncora. Por otro lado, las pocas webs de negocios locales no generan el tráfico web
mínimo necesario para ser medidos.
En cuanto a lo mencionado por Bigne, et.al. (2017) y Linares, et.al. (2015), la red social
Twitter sí resulta útil para estimar arribos. Si bien es cierto no se ha podido utilizar la
inteligencia artificial o métodos computacionales más sofisiticados, sí se ha podido
emplear el análisis de sentimiento en los comentarios de Twitter y posteriormente recurrir
al modelo de regresión lineal múltiple, el cual es enseñado en los cursos de Estadística
General.
Los objetivos de la investigación se han cumplido. Resulta cierto el hecho de que los datos
de un motor de búsqueda y la red social Twitter pueden ser empleados en el modelamiento
nowcasting de arribos mensuales a hospedajes de Máncora. Lo mismo ocurre con las
llegadas mensuales anteriores y con las llegadas del mes anterior. Los datos electrónicos
contribuyen a mejorar el nivel de ajuste e incrementan la precisión del modelo que solo
emplea datos históricos.
El aporte académico se centra en la relación entre los datos del motor de búsqueda y la
red social Twitter vs. Número de arribos a hospedajes. Es, además, el primer modelo de
demanda hotelera realizado por una universidad peruana.
26
4.3. Conclusiones
Podemos concluir que los datos de un motor de búsqueda y la red social Twitter resultan
utilizables en el modelamiento nowcasting del flujo de arribos mensuales a Máncora.
El empleo de las regresiones múltiples determinó que los datos del motor de búsqueda y
la red social Twitter son significativos en el modelamiento del tipo nowcasting. El
incremento del coeficiente de determinación de un modelo a otro implica que la variabilidad
del indicador llegadas mensuales a hoteles de Máncora en un mes determinado queda
mejor explicada por las variables del motor de búsqueda y sentimiento mensual presente
en los comentarios en Twitter.
La hipótesis de la investigación no era del tipo causal sino correlacional. No es posible
afirmar que más búsquedas de hoteles en Máncora generen que más gente se hospede
en los hoteles de dicho distrito. Eso es tentativo, pero no existe evidencia de ello. Lo que
sí resulta claro es que hay una relación directamente proporcional entre las búsquedas y
las llegadas, aunque es relativamente pequeña en valor absoluto. También existe relación
entre el sentimiento de los comentarios de la red social Twitter y los arribos a hospedajes
del destino trabajado.
Por otro lado, el hecho de que los niveles de sentimiento mensual presente en los
comentarios de la red social Twitter sean todos positivos significa que en cada mes
predominan los mensajes con un contenido favorables al destino. Esta tendencia evidencia
de que el destino resulta valorado en forma positiva, al menos según los comentarios en la
red social Twitter.
Indirectamente se ha demostrado que puede establecerse una relación matemática entre
comentarios y el número de arribos a hospedajes. Este tipo de relación no es muy frecuente
en las investigaciones en hotelería peruanas, donde los comentarios tradicionalmente son
tratados como datos cualitativos.
La Big Data proporciona datos que son de calidad para la estimación de la demanda
hotelera. Es información que se actualiza en tiempo real y que está a libre disponibilidad
de los investigadores que deseen usarla. Los datos de Twitter y Google no requieren de
gastos en efectivo. Este tipo de información es valiosa para los investigadores en hotelería.
Si bien es cierto que en ocasiones la Big Data puede requerir de métodos complejos como
la inteligencia artificial, no resulta verdad que este tipo de investigaciones no pueda ser
abarcada por profesionales hoteleros. El documento ha proporcionado evidencia suficiente
de que es posible realizar investigaciones que involucren Big Data sin necesidad de recurrir
27
a técnicas propias de ingenieros o científicos. La investigación se basa en conocimientos
estadísticos que son adquiridos durante el pregrado de la formación del administrador
hotelero.
La demanda hotelera para un área geográfica específica puede ser estimada empleando
datos históricos. No obstante, un nivel de precisión mayor puede ser alcanzado si se
emplean datos electrónicos, como la información brindada por Google y Twitter.
El empleo de Google y Twitter ha sido posible gracias a que ambas cuentan con
componentes que permiten estudiar un tópico en particular (Máncora). Pero ha resultado
también clave el empleo de indicadores como la geolocalización y la obtención de datos en
un lapso determinado de tiempo.
Por otro lado, el proceso de depuración de información ha hecho posible que los resultados
sean coherentes. Así, por ejemplo se ha evitado que solo se incluya al término clave
Máncora como destino y no la película que comparte el mismo nombre. Lo mismo ocurre
con Twitter, aunque esta última red social requiere una limpieza semiautomática, ya que
carece del algoritmo para diferencias entre los diferentes significados de Máncora.
Era necesario utilizar una variable que pueda complementar a los datos de Google. El
interés hacia un servicio o destino puede incrementarse de forma exponencial si es que,
por ejemplo, ocurriera un hecho negativo notable. Las búsquedas te dicen que se
incrementa el interés; sin embargo, no pueden identificar si ese interés es positivo o
negativo como sí lo puede hacer el análisis de sentimiento a partir de los comentarios.
Dado que se ha modelado empleando flujos mensuales y no diarios, resulta posible estimar
las llegadas a los hospedajes de Máncora para un mes vigente empleando datos históricos,
búsquedas en Google y comentarios en Twitter. Este modelo puede aplicarse cada vez
que esté a punto de terminarse un mes y así estimar cuántas personas han llegado desde
el inicio de dicho período mensual, es decir, la demanda actual que comienza y termina en
un mes que todavía está en vigencia y muy próximo a concluir. Lo anterior resulta de
utilidad para la industria hotelera, ya que permite obtener un indicador antes de que salga
un reporte oficial por parte del Estado. Por otro lado, es posible estimar llegadas en fechas
clave como son los fines de cada mes.
La elección de la red social Twitter ha demostrado ser útil para estimar las llegadas a
hospedajes en Máncora. No obstante, la elección de una red social en particular depende
de la representatividad en el uso con respecto al objeto de estudio (Máncora en este caso)
y la facilidad de acceder y posteriormente extraer información. En Máncora, por otro lado,
28
un 8% de los arribos a hospedajes durante el período 2012-2016 tuvo origen chileno
(MINCETUR, 2017). Si se desea realizar un modelamiento de arribos de chilenos en
Máncora, deberá emplearse una red social que sea representativa en Chile y tenga una
importante proporción de datos de acceso público. Twitter ha sido representativa para los
arribos a hospedajes en Máncora, ya que estos son en su mayoría nacionales. Además, el
hecho de que dicha red social tenga una importante proporción de información que es de
acceso público ha determinado su elegibilidad sobre otras redes de mayor uso como
Facebook, en donde el contenido está más restringido y solo es visible para los contactos
que estén agregados. Por otro lado, el proceso de extracción masiva y automática que
puede llevarse a cabo en Twitter, ha viabilizado la información. El uso de otras redes
sociales está condicionado al dominio de mecanismos que puedan extraer datos en forma
rápida y así evitar los procesos manuales. Si se deseara estudiar solamente el flujo de
americanos que llegan a Máncora, es posible optar por redes que sean más
representativas para Estados Unidos como lo son Yelp.com o Instagram. Pero debe
tomarse en consideración que ambas requieren plazos más amplios en la investigación, ya
que la extracción de data es un proceso más largo: en Instagram sería necesario descargar
las imágenes una a la vez, mientras que en Yelp.com se debería proceder a copiar y pegar
cada comentario en una base de datos. Esto se sugiere para investigaciones que
dispongan de un mayor tiempo disponible. Twitter, en cambio, proporciona datos de más
fácil acceso al permitir extraer y analizar información en forma semiautomática.
Por último, los datos del modelamiento nowcast son complementarios a los del forecast.
Esta complementariedad es del tipo matemática: el nowcast se orienta a la inmediatez y el
forecast, hacia horizontes de tiempo más largos; una variable que puede ser empleada
para el nowcast, también es candidata a ser empleada al forecast (Giannone, et.al. 2008).
Google y Twitter puede emplearse para el modelamiento nowcast, entonces el buscador y
la red social también son candidatos a ser empleados en estimaciones de largo plazo, pero
eso ya es parte de otro estudio.
29
4.4. Recomendaciones
Dado que existe evidencia entre los flujos de arribos y las llegadas mensuales, resulta
recomendable estudiar si existe una relación entre ambas variables medidas semana a
semana. Los datos de ambas variables existen y puede realizarse la prueba de correlación.
Google no es el único motor de búsqueda que permite usar sus datos. Si bien es cierto que
se ha estudiado el caso de los hoteles de Máncora, el modelo se puede extender a todo el
territorio peruano. El flujo de arribos de ciudadanos chinos puede estudiarse usando los
datos del buscador Baidu, el más popular en la República Popular China, país donde
Google está restringido por motivos políticos. Es por ello que no se puede utilizar los datos
del motor de búsqueda norteamericano para el caso de los viajeros chinos. Hoy el
segmento chino representa 38 millones de dólares en ingresos para el Perú y es uno de
los de mayor crecimiento (PROMPERU, 2016b)
El motor de búsqueda Google también proporciona información por ciudad. De esta forma
es posible plantear, por ejemplo, la relación entre las búsquedas de hoteles en Máncora
realizadas por limeños y las llegadas de limeños a los hoteles del mencionado distrito.
En cuanto al marketing digital, resulta tentativo estudiar la influencia de las campañas
digitales que tengan por objetivo incrementar las búsquedas relacionadas a Máncora.
Resulta posible aproximarse a la construcción de un indicador del tipo ratio de respuesta
que surja de un cociente entre las búsquedas y llegadas.
Google y Twitter proporcionan información con características de geolocalización. Es
posible encontrar información de cada ciudad y distritos (en el caso de Lima Metropolitana).
Los administradores hoteleros, entonces, podrán segmentar la información en formación
de forma geográfica para distintos tipos de estudios.
Es recomendable el uso de Twitter para evaluar los comentarios y así conocer si la imagen
de otras zonas turísticas (con una importante presencia de hoteles) es positiva o negativa
según las perspectivas de los viajeros. En cuanto al uso de Twitter y los hoteles, es posible
que estos últimos usen dicha red social para evaluar si la imagen de un destino es positiva
o negativa. En el caso de que los viajeros valoren negativamente un lugar, esto
seguramente estará relacionado a un descenso en la demanda hotelera.
30
Por otro lado, cabe mencionar que el modelo resulta útil para los estudiantes y
profesionales de la hotelería. Esto debido a que las llegadas a un hotel en particular resulta
ser información sensible a la que no se puede acceder con facilitad. En esta investigación
ha resultado posible aproximarse a la estimación de llegadas en Máncora, indicador que
los vinculados a la industria hotelera encontrarán útil para la descripción de un entorno.
31
Referencia
1. Abbasi, A., Hossein, T., Magherbi, M., & Waller, S. (2015). Utilising Location Based Social Media in Travel Survey Methods: bringing Twitter data into the play. Proceedings of the 8th ACM SIGSPATIAL International Workshop on Location-Based Social Networks. New York. Obtenido de http://faculty.ce.berkeley.edu/pozdnukhov/lbsn15/files/a1-abbasi.pdf
2. Askitas, N., & Zimmermann, K. (2009). Google Econometrics and Unemployment Forecasting. Applied Economics Quarterly,, 55(2), 107-120.
3. Athanasopoulos, G., Hyndman, R., Song, H., & Wu, D. (2011). The tourism forecasting competition. International Journal of Forecasting, 822-844.
4. Banco Mundial. (2016). Usuarios de Internet (por cada 100 personas). Recuperado el 20 de Febrero de 2017, de http://datos.bancomundial.org/indicador/IT.NET.USER.P2?view=map
5. Barón, F., & Téllez, F. (2010). Regresión múltiple. Apuntes de Bioestadística. Obtenido de https://www.bioestadistica.uma.es/baron/apuntes/ficheros/cap06.pdf
6. BCRP. (2012). Piura: principales atractivos turísticos. Recuperado el 2 de Marzo de 2017, de http://www.bcrp.gob.pe/docs/Sucursales/Piura/Piura-Atractivos.pdf
7. BCRP. (2017). Informe Económico y Social de la Región Piura. Recuperado el 30 de Mayo de 2017, de http://www.bcrp.gob.pe/publicaciones2/glosario/42-transparencia/comunicaciones3/361-informe-economico-y-social-region-piura.html
8. Bigne, E., Andreau, L., & Oltra, E. (2017). TOURISM DESTINATION TWEETS PREDICT HOTEL OCCUPANCY: AN ARTIFICIAL NEURAL NETWORK STUDY. University of Valencia. Recuperado el 30 de Mayo de 2017, de www.marketing-trends-congress.com/archives/2016/pages/PDF/BIGNE_ANDREU_OLTRA.pdf
9. Camacho, M., & Pacce, M. (2016). Forecasting travelers in Spain with Google queries. BBVA. Recuperado el 5 de Marzo de 2017, de https://www.bbvaresearch.com/wp-content/uploads/2016/12/WP_16-211.pdf
10. Carriere-Swallow, Y., & Labbe, F. (2013). Nowcasting with Google Trends in an Emerging Markets. Journal of Forecasting, 32(4), 289-298. doi:10.1002/for.1252
11. Chang, J., & Del Río, A. (2013). Google Trends: Predicción del nivel de empleo agregado en Perú usando datos en tiempo real, 2005-2011. Recuperado el 21 de Febrero de 2017, de http://www.bcrp.gob.pe/docs/Publicaciones/Documentos-de-Trabajo/2013/documento-de-trabajo-15-2013.pdf
12. Choi, H., & Varian, H. (2011). Predicting the Present with Google Trends. Recuperado el 22 de Febrero de 2017, de http://people.ischool.berkeley.edu/~hal/Papers/2011/ptp.pdf
13. Cuxart, A. (2000). Modelos Estadísticos y Evaluación. Revista de Educación(323), 369-394.
14. Davenport, T. (2013). At the Big Data Crossroads: turning towards a smarter travel experience. Recuperado el 5 de Marzo de 2017, de http://www.bigdata.amadeus.com/assets/pdf/Amadeus_Big_Data.pdf
32
15. De la Oz, M. (2014). Predicting Tourist Inflows to Punta Cana, Dominican Republic, Using Google Trends. Recuperado el 23 de Febrero de 2017, de http://digitalcommons.usu.edu/cgi/viewcontent.cgi?article=1362&context=gradreports
16. Dinis, G., Costa, C., & Pacheco, O. (2015). Google it! Using the Google Trends tool to understand the Algarve Tourist. dosalgarves A multidisciplinary e-journal, 21, 64-84.
17. Garth, A. (2008). Analysing data using SPSS. Recuperado el 22 de Febrero de 2017, de Sheffield Hallam University: http://teaching.shu.ac.uk/hwb/ag/resources/material/analysingdatausingspss.pdf
18. Giannone, D., Reichlin, L., & Small, D. (2008). Nowcasting: The real-time informational content of macroeconomic data. Journal of Monetary Economics, 55, 665-676. Recuperado el 8 de Marzo de 2017, de http://dept.ku.edu/~empirics/Courses/Econ844/papers/Nowcasting%20GDP.pdf
19. Google Trends. (2017). Resultados de la búsqueda para el término Máncora (Hoteles). Recuperado el 15 de Marzo de 2017, de https://trends.google.com/trends/explore?cat=179&q=%2Fm%2F090cdh
20. Hernández, R., Fernández, C., & Baptista, P. (2014). Metodología de la Investigación (Quinta ed.). México: McGraw Hill.
21. Hofmann, M., & Chisholm, A. (2015). Text Mining and Visualization: Case Studies Using Open-Source Tools. Chapman and Hall/CRC .
22. Ipsos Perú. (2016). Perfil del Internauta 2016.
23. Jeong, H., Mankad, S., Gavirneni, N., & Verma, R. (2016). What Guests Really Think of Your Hotel: Text Analytics of Online Customer Reviews. Cornell Hospitality Repor, 16(2), 3-17. Recuperado el 4 de Marzo de 2017
24. Kahn, M., & Liu, P. (2016). Utilizing “Big Data” to Improve the Hotel Sector Energy Efficiency: Lessons from Recent Economics Research. Cornell Hospitality Quarterly, 57(2), 202-210.
25. Korte, D., Ariyachandra, T., & Frolick, M. (2013). Business Intelligence in the Hospitality Industry. International Journal of Innovation, Management and Technology, 4(4), 429-434.
26. Kumar, S., Morstatter, F., & Liu, H. (2014). Twitter Data Analytics. Springer.
27. Laney, D. (2001). 3D Data Management: Controlling Data Volume, Velocity and Variety. Recuperado el 5 de Marzo de 2017, de http://blogs.gartner.com/doug-laney/files/2012/01/ad949-3D-Data-Management-Controlling-Data-Volume-Velocity-and-Variety.pdf
28. Lee, S., Jo, J., Kim, Y., & Hwang, E. (2016). Big Data Analysis with Hadoop on Personalized Incentive Model with Statistical Hotel Customer Data. International Journal of Software Innovation, 4 (3), 1-21.
29. Linares, R., Herrera, J., Cuadros, A., & Alfaro, L. (2015). Prediction of Tourist Traffic to Peru by using Sentiment Analysis in Twitter Social Network. Computing Conference (CLEI). Arequipa. doi:10.1109/CLEI.2015.7360051
33
30. Microsoft. (2016). Excel 2016. Obtenido de https://www.microsoft.com/en-gb/smb/articles/top-5-benefits-of-microsoft-excel
31. MINCETUR. (2015). Reglamento de Establecimientos de Hospedaje. Recuperado el 8 de Marzo de 2017, de http://www.elperuano.com.pe/normaselperuano/2015/06/09/1248181-2.html
32. MINCETUR. (2016). Atractivos Turístico - Playa Máncora. Recuperado el 2 de Marzo de 2017, de http://ficha.sigmincetur.mincetur.gob.pe/index.aspx?cod_Ficha=407
33. MINCETUR. (2017). Resultados de la Encuesta Mensual a Establecimientos de Hospedaje Temporal. Recuperado el 8 de Marzo de 2017, de http://consultasenlinea.mincetur.gob.pe/estaTurismo/Index.aspx?po=hospedajeTemporal/consulta/frmActividades.aspx?id=1572
34. Minitab. (s.f.). Soporte de MiniTab17. Recuperado el 8 de Marzo de 2017, de http://support.minitab.com/es-mx/minitab/17/topic-library/modeling-statistics/regression-and-correlation/goodness-of-fit-statistics/r-squared/
35. Monje, C. (2011). Metodología de la Investigación Cualitativa y Cuantitativa. Recuperado el 8 de Marzo de 2017, de https://carmonje.wikispaces.com/file/view/Monje+Carlos+Arturo+-+Gu%C3%ADa+did%C3%A1ctica+Metodolog%C3%ADa+de+la+investigaci%C3%B3n.pdf
36. Onder, I., & Gunter, U. (2016). Forecasting Tourism Demand with Google Trends: The Case of Vienna. Conference: The 8th International Conference on Computational and Financial Econometrics. Recuperado el 23 de Febrero de 2017, de https://www.researchgate.net/publication/274009577_Forecasting_Tourism_Demand_with_Google_Trends_The_Case_of_Vienna
37. Pallant, J. (2007). SPSS survival manual: a step by step guide to data analysis using SPSS for Windows. Open University Press.
38. Pan, B., Chenguand, D., & Song, H. (2012). Forecasting hotel room demand using search engine data. Journal of Hospitality and Tourism Technology, 3(3), 196 - 210. doi:10.1108/17579881211264486
39. Park, S., Lee, J., & Song, W. (2015). Short-term forecasting of Japanese tourist inflow to South Korea using Google trends data. Journal of Travel & Tourism Marketing, 34(3). doi:10.1080/10548408.2016.1170651
40. PROMPERU. (2016a). Perfil del Vacacionista Nacional 2015 - Vacacionistas que visitaron Piura. Recuperado el 5 de Marzo de 2017, de http://www.promperu.gob.pe/TurismoIN/Sitio/Descargar?url=~/Uploads/perfiles_vacac_nac/1035/tips/2115/PVN15_Vacacionistas%20que%20visitaron%20Piura.pdf
41. PROMPERU. (2016b). Perfil del turista extranjero - Turista que visitó Piura 2015. Recuperado el 5 de Marzo de 2017, de http://www.promperu.gob.pe/TurismoIN/Sitio/Descargar?url=~/Uploads/perfiles_extranjeros/38/tips/2325/PTE%202015%20-%20Turista%20que%20visita%20Piura.pdf
42. Song, H., & Li, G. (2008). Tourism demand modelling and forecasting-A eview of recent research. Tourism Manage, 29, 203-220.
34
43. TripAdvisor. (Mayo de 2017). Mancora Hotels. Obtenido de https://www.tripadvisor.com/Hotels-g635976-Mancora_Piura_Region-Hotels.html
44. Vázquez, V., Cruz, H., Reyes, H., Juárez, B., & Solano, F. (2014). Modelado y predicción de la tasa de interés interbancaria de equilibrio en México vía un proceso auto-recursivo de orden uno. Revista de Análisis Cuantitativo y Estadístico, 1(1), 1-9.
45. Yang, Y., Pan, B., & Song, H. (2013). Predicting Hotel Demand Using Destination Marketing Organization’s Web Traffic Data. Journal of Travel Research, 53(4), 433-447. doi: 10.1177/0047287513500391
46. Zahkary, A., Atiya, A., El-Shishiny, H., & El-Gayar, N. (2009). Forecasting Hotel Arrivals and Occupancy Using Monte Carlo Simulation. Journal of Revenue & Pricing Management. Recuperado el 6 de Marzo de 2017, de https://www.researchgate.net/publication/228621779_Forecasting_hotel_arrivals_and_occupancy_using_Monte_Carlo_simulation
47. Zhang, Y., Shu, S., Ji, Z., & Wang, Y. (2015). A Study of the Commercial Application of Big Data of the International Hotel Group in China: Based on the Case Study of Marriott International. 2015 IEEE First International Conference on Big Data Computing Service and Applications. Recuperado el 3 de Marzo de 2015, de http://ieeexplore.ieee.org/document/7184910/
35
Anexos
Anexo 1
Figura 1. Módulo de consulta para obtener datos del motor de Búsqueda acerca de Máncora.
Fuente: Google Trends
Anexo 2
Figura 2. Módulo de Consulta que limita los resultados solo a aquellas búsquedas relacionadas a hoteles y
similares
Fuente: Google Trends
Anexo 3
Figura 3. Vista previa de los resultados registrados por el motor de búsqueda a lo largo del tiempo para el
término Máncora (Hoteles)
Fuente: Google Trends
36
Anexo 4
Figura 4. Módulo de descarga de datos de búsqueda en archivo CSV
Fuente: Google Trends
Anexo 5
Figura 5. Módulo de descarga de datos de búsqueda en archivo CSV
Fuente: Google Trends
Anexo 6
37
Figura 6. Transformación de comentario en dato numérico usando el análisis sentimental con el instrumento
Lexalytics. En este caso la expresión: “Bye bye Mancora. You were the perfect holiday from out vacation”
alcanzó un puntaje de 0.750.
Anexo 7
Tabla A1: Análisis de Varianza del primer modelo
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
Modelo 0.391902 2 0.195951 15.1 0
Residuo 0.739491 57 0.0129735 Total (Corr.) 1.13139 59
El objetivo del análisis de varianza es comparar las dos fuentes de variación (regresión y
residuos) para saber cuál explica mejor la variación en la variable respuesta LogH(t). Para
hacer esto, es necesario recurrir a un a prueba que compara la variación en regresión y la
variación residual, conocida como la prueba F. La salida es proporcionada por el software
estadístico. El indicador más importante de esta tabla es el Valor-P, el cual indica que
algunas variables del modelo son explicativas.
Por otro lado, este modelo que no incluye datos electrónicos puede ser presentado en
forma gráfica.
Figura 7. Gráfico de Resultados Observados vs. Predichos para el caso del primer modelo.
Gráfico de LogH(t)
3.6 3.8 4 4.2 4.4predicho
3.6
3.8
4
4.2
4.4
ob
serv
ado
38
Anexo 8
Tabla A2: Análisis de Varianza del segundo modelo
Fuente Suma de Cuadrados Gl Cuadrado Medio Razón-F Valor-P
Modelo 0.891804 4 0.222951 51.18 0
Residuo 0.239589 55 0.00435616 Total (Corr.) 1.13139 59
El objetivo del análisis de varianza es comparar las dos fuentes de variación (regresión y
residuos) para saber cuál explica mejor la variación en la variable respuesta LogH(t). Para
hacer esto, es necesario recurrir a un a prueba que compara la variación en regresión y la
variación residual, conocida como la prueba F. El indicador más importante de esta tabla
es el Valor-P, el cual indica que algunas variables del modelo son explicativas.
Además el modelo que ha incorporado las variables electrónicas
Figura 8. Gráfico de Resultados Observados vs. Predichos para el caso del segundo modelo.
En el segundo modelo, los puntos están más próximos a la línea. Entonces la incorporación
de las variables de Google y Twitter si ayudan a mejorar el pronóstico de las llegadas a
hospedajes de Máncora.
Gráfico de LogH(t)
3.6 3.8 4 4.2 4.4predicho
3.6
3.8
4
4.2
4.4
ob
serv
ado
39
Anexo 9
Matriz de Consistencia
PROBLEMA OBJETIVOS HIPOTESIS (si se requiere) VARIABLES DIMENSIÓN INDICADORES
Sub Indicador
es
Problema Principal
Objetivo principal
Hipótesis principal Variable
independiente Dimensión de la VI
Material con el que se
corroborará información
Se desea saber si los datos provistos por el motor de búsqueda y Twitter son utilizables para el modelo nowcasting del flujo mensual de arribos a hospedajes en Máncora.
Determinar si la ecuación que incluye los datos del motor de búsqueda Google y la red social Twitter alcanza un mejor nivel de ajuste que el modelo que no emplea dichas variables en el caso de los arribos mensuales a hospedajes en Máncora.
La ecuación que incluye los datos del motor de búsqueda Google y la red social Twitter alcanza un mejor nivel de ajuste que el modelo que no emplea dichas variables en el caso de los arribos mensuales a hospedajes en Máncora.
Datos mensuales del motor de búsqueda referidos a hospedajes en Máncora Nivel se sentimiento mensual en los comentarios de Twitter acerca de Máncora.
Número de arribos a hospedajes en Máncora Índice de búsqueda mensual acerca de hospedajes en Máncora. Nivel de Sentimiento en los comentarios de Twitter.
Datos de Google Trends. Datos de Nivel de Sentimiento de Twitter.
40
Problemas específicos
Objetivos específicos
Hipótesis específica Variable dependiente
Dimensión de la VD
Se desea saber si las llegadas mensuales registradas hace un año a hospedajes en Máncora son utilizables para modelar el nowcasting del flujo de arribos
Determinar si las llegadas mensuales registradas hace un año a hospedajes en Máncora son utilizables para modelar el nowcasting del flujo mensual de arribos.
Las llegadas mensuales registradas hace un año a hospedajes en Máncora no son utilizables para modelar el nowcasting del flujo mensual de arribos.
Flujo mensual de arribos a hospedajes de Máncora
Cantidad de arribos mensuales a hospedajes en Máncora.
Datos proporcionados por el MINCETUR.
Se desea determinar si las llegadas mensuales registradas hace un mes a hospedajes en Máncora son utilizables para modelar el nowcasting del flujo de arribos.
Determinar si las llegadas mensuales registradas hace un año a hospedajes en Máncora son utilizables para modelar el nowcasting del flujo mensual de arribos.
Las llegadas mensuales registradas hace un año a hospedajes en Máncora no son utilizables para modelar el nowcasting del flujo mensual de arribos.
41
Se desea saber si los volúmenes de búsquedas registrado por Google relacionados a hospedajes en Máncora son utilizables para modelar el nowcasting del flujo mensual de arribos. Se desea Determinar si los niveles de sentimiento mensuales de los comentarios en Twitter relacionados a Máncora son utilizables para modelar el nowcasting del flujo mensual de arribos.
Determinar si los volúmenes de búsquedas registrado por Google relacionados a hospedajes en Máncora son utilizables para modelar el nowcasting del flujo mensual de arribos. Determinar si los niveles de sentimiento mensuales de los comentarios en Twitter relacionados a Máncora son utilizables para modelar el nowcasting del flujo mensual de arribos.
Los volúmenes de búsquedas registrado por Google relacionados a hospedajes en Máncora son utilizables para modelar el nowcasting del flujo mensual de arribos. Los niveles de sentimiento mensuales de los comentarios en Twitter relacionados a Máncora no son utilizables para modelar el nowcasting del flujo mensual de arribos.
volúmenes de búsquedas referidos a hoteles en Máncora Sentimiento mensual presente en los comentarios de Twitter.
Índices de Búsqueda Nivel de Sentimiento
Datos obtenidos a partir de Google Trends Datos obtenidos de Twitter con Nvivo y procesados con Lexalytics