Servicio de asesoría y resolución de ejercicios [email protected]www.maestronline.com Pide una cotización a nuestros correos. Maestros Online Análisis multivariante Apoyo en ejercicios Servicio de asesorías y solución de ejercicios [email protected]
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Problema 1. Una encuesta de muestreo entre propietarios de piscinas residenciales en el sudeste de Pensilvania arrojó los siguientes datos con respecto al costo de piscinas y su ingreso anual:
Informante Costo piscina
Miles de dólares Ingreso anual
Miles de dólares Tamaño del lote
Miles de pies cuadrados
1 2 3 4 5 6
3.6 4.8 2.4 7.2 6.9 8.4
9.3 10.2 9.7
11.5 12.0 14.2
30.2 40.1 35.5 45.1 38.0 50.1
7 8 9 10 11 12
10.7 11.2 6.1 7.9 9.5 5.4
18.6 28.4 13.2 10.8 22.7 12.3
60.2 100.4 25.1 40.7 68.4 60.3
a. Encuentra el índice de correlación entre las variables costo-ingreso y determina si existe una relación lineal.
b. Si existe relación lineal encuentra el modelo lineal que la determina. c. Si una persona tiene un ingreso de 25mil dólares anuales ¿qué costo de piscina le
podemos ofrecer? d. ¿Qué ingreso debe tener una persona que pretende gastar 5 mil dólares en una
piscina? e. Encuentra la matriz de correlación entre las variables y determina si existe relación
entre algún par de ellas. f. Por medio de análisis de regresión múltiple encuentra el modelo lineal que la
determina. g. Si el propietario de una piscina tiene un ingreso anual de 12.5 mil dólares y un lote
de 40mil pies cuadrados, ¿qué costo de piscina se puede predecir? h. Encontrar el coeficiente de determinación múltiple R2. Interpreta el resultado así
como los datos que se obtienen en el análisis de varianza.
Problema 2. Se realizó una encuesta acerca de derechos de los animales a un grupo de 20 personas en escala de Likert de 9 puntos (1: en total desacuerdo, 9: totalmente de acuerdo).
Preguntas:
X1: Los humanos no tienen derecho a desplazar animales salvajes de su lugar de origen para siembra, ciudades, carreteras, etc. X2: Es moralmente incorrecto beber leche y comer huevo. X3. La mayoría de la investigación en animales es innecesaria y no válida.
X4. Las personas dueñas de mascotas son responsables del daño que causen las mismas a otros animales como es gatos que matan conejos/ratas, serpientes que comen ratas vivas. X5. Las plagas (moscas, mosquitos, cucarachas, etc.) deben ser removidos de casa más que asesinados.
Encuestado X1 X2 X3 X4 X5
1 5 3 4 4 1
2 1 6 6 5 5
3 6 4 2 5 7
4 9 2 3 1 6
5 5 9 4 6 3
6 1 2 9 3 5
7 4 6 5 9 2
8 3 4 3 2 3
9 4 6 5 7 9
10 5 7 7 3 6
11 6 5 7 3 3
12 6 7 5 3 4
13 5 6 4 3 4
14 7 7 6 3 2
15 4 3 4 6 4
16 2 3 4 5 5
17 1 3 2 3 6
18 2 4 3 6 4
19 3 3 4 6 7
20 1 1 4 5 5
Aplica el análisis factorial y presenta:
Matriz de correlación y aplica análisis de componentes Realiza todas las pruebas para determinar el número de factores necesarios:
o Valores propios o Porcentaje de varianza o Diagrama de sedimentación
¿Es clara la selección del número de factores? Explica. ¿Cuál es la cantidad adecuada de factores?
o Interpreta los factores extraídos. o Si tuvieras variables sustitutas, ¿cuáles escogerías? o Examina el ajuste del modelo y determina si el análisis factorial es la mejor
Problema 1. Una empresa distribuidora de vinos tiene interés en encontrar clasificación de distintos productos a fin de poder diversificar y especializar su mercado. Hace un estudio de composición de los vinos a fin de determinar de acuerdo a sus características qué ofrecer y a qué tipo de público. Los valores que midió son los siguientes:
Tipo de vino: A, B, o C (según la región) Alcohol Ácido Málico (ácido orgánico de la uva) Cenizas Flavonoides: antioxidantes Fenoles no flavonoides: antioxidantes Intensidad de color
Utiliza como variable de agrupación el lugar de procedencia del vino, es decir, el tipo de vino.
1. ¿Qué variable, de acuerdo a la agrupación realizada, tiene más peso en la composición del vino?
2. Analizando la tabla del resumen de datos, ¿cómo puedes identificar si hay diferencia entre los distintos grupos con respecto a los parámetros?
3. Identifica, mediante el examen de medias, si las medias son estadísticamente iguales para ambos grupos.
4. Analiza los valores de la λ de Wilks para los datos solos y posteriormente para los datos agrupados junto con su transformación en chi cuadrada. A partir de los resultados, indica el nivel de significancia del análisis.
5. De acuerdo a la matriz de correlaciones agrupadas, identifica si hay alguna que presente correlación con alguna otra variable.
6. Ahora realiza la interpretación de datos. Puedes utilizar las cargas canónicas, los coeficientes estandarizados o los no estandarizados, o los signos de los centroides, para hacerlo.
7. Finalmente, comenta la validez del análisis discriminante y menciona el % de validez que hay en los datos agrupados originales.
8. Arma la función discriminante para el modelo en particular. 9. Elabora tus conclusiones respecto a lo que podría hacer el distribuidor de vinos
con esta información.
Problema 2. Para determinar aspectos significativos de selección de vino, se realizó una encuesta en la que se consideraron los siguientes parámetros a calificar:
Tipo: blanco (1), rosado (2), tinto (3). Tamaño: 250ml (1), 750 ml (2), 1500 ml (3). Cantidad de azúcares: seco (1), semiseco (2), dulce (3). Edad: sin crianza (1), crianza (2), reserva (3), gran reserva (4).
Aun cuando las combinaciones que resultan son más, se tomaron solamente 9, las cuales se determinó que eran las más significativas para la tarjeta de encuesta, presentada a continuación:
Se presenta la tarjeta con las 9 combinaciones a diferentes personas que pretenden consumir vino, a fin de que ordenen sus preferencias. Las respuestas se presentan en la siguiente tabla:
ENCUESTA PREF
1 PREF
2 PREF
3 PREF
4 PREF
5 PREF
6 PREF
7 PREF
8 PREF
9
1 7 8 5 9 6 4 2 1 3
2 2 1 1 4 7 9 6 2 2
3 8 9 4 4 6 1 4 5 6
4 5 2 3 7 4 4 3 4 4
5 1 7 9 8 7 4 7 8 3
6 7 7 8 2 6 9 2 9 4
7 3 2 3 7 2 8 3 2 5
8 7 9 4 8 1 2 4 9 8
9 2 9 4 9 3 1 1 1 6
10 5 5 7 4 3 4 8 7 9
11 5 8 9 8 6 9 6 1 8
12 7 3 6 3 9 1 7 3 4
13 2 4 7 5 3 7 5 1 6
14 5 4 5 5 5 2 3 3 5
15 2 1 5 6 4 2 8 5 6
16 2 5 6 8 4 2 5 2 3
17 9 4 6 2 1 2 7 9 3
18 3 8 4 2 3 5 3 5 9
19 3 9 8 9 3 6 7 1 5
20 6 5 8 4 6 4 8 1 5
a. Utiliza SPSS y elabora un archivo PLAN con los datos de la primera tabla (tarjeta de encuesta) y un archivo de preferencias con la segunda tabla (respuestas de la encuesta aplicada).
b. Utiliza el código que se explica en el tema 7: “Análisis conjunto I”, a fin de determinar los parámetros que describen el análisis conjunto.
En un laboratorio de estudio de la conducta animal se busca determinar qué respuesta se tiene al estimular cierta área del cerebro (0, 1 ó 2) que se mide con tiempo de respuesta y el efecto de la descarga. Los datos encontrados se presentan a continuación:
a. Determina si existe alguna correlación entre el área estimulada y el tiempo de retraso.
b. Divide el archivo y determina si existe alguna diferencia entre las medias de las dos porciones de la muestra.
c. Encuentra el modelo lineal que determina el comportamiento del animal (efecto shock) al estimular determinada área del cerebro con un tiempo de retraso determinado.
Actividad integradora 4
Instrucciones:
En la revista Anthrozoös el Dr. Wuensch y su equipo hicieron un estudio para medir actitudes acerca de los derechos de los animales y la experimentación en animales mediante un cuestionario de 28 preguntas con cinco opciones cada una (1 = totalmente en desacuerdo, 5 = totalmente de acuerdo). Para este trabajo utilizaremos solo las primeras 15 preguntas a fin de no hacer un estudio demasiado complicado y los segundos 30 encuestados.
Se presentan las 15 primeras preguntas del cuestionario:
1. Los humanos no tienen derecho a desplazar animales salvajes para convertir los espacios en granjas, sitios de pastoreo, ciudades, carreteras, etc.
2. La investigación en animales no tiene justificación y debe detenerse. 3. Es moralmente incorrecto beber leche y comer huevo. 4. Un humano no tiene derecho a utilizar un caballo como medio de transporte
ni entretenimiento. 5. Es incorrecto utilizar atuendos hechos con piel. 6. La mayoría de la investigación médica hecha en animales es innecesaria y
no válida. 7. He pensado seriamente convertirme en vegetariano a fin de salvar vidas
animales. 8. Los propietarios de mascotas son responsables de prevenir que sus
mascotas maten otras especies (gatos que matan ratones, serpientes que comen ratones vivos).
9. Necesitamos más regulaciones por parte del gobierno en el uso de investigación en animales.
10. Es moralmente incorrecto comer res y otras carnes ‘rojas’. 11. Las plagas (mosquitos, moscas, cucarachas, etc.) deben ser retiradas del
hogar más que exterminadas. 12. Los animales deben tener los mismos derechos que los humanos. 13. Es incorrecto utilizar cinturones de piel y zapatos de piel. 14. Prefiero que mueran o sufran de enfermedades los humanos a que se
investigue en animales la cura y tratamiento de dichas enfermedades. 15. Ya que se han extendido los derechos humanos hacia las mujeres y las
minorías, se deben extender también hacia los animales.
Además en la columna sexo se tiene (1 = mujer, 2 = hombre)
Revisado en: http://core.ecu.edu/psyc/wuenschk/Animals/Anim-Rights-Q.htm el 7 de diciembre de 2010 y publicado en: Wuensch, K. L., Jenkins, K. W., & Poteat, G. M. (Misanthropy, idealism, and attitudes towards animals. Anthrozoös, 2002, 15, 139-149)
P 1 P 2 P 3 P 4 P 5 P 6 P 7 P 8 P 9 P 10 P 11 P 12 P 13 P 14 P 15 sexo
Para cada uno de los problemas que se te presentan a continuación, se debe aplicar alguna técnica multivariante. Indica qué técnica es más adecuada, por qué y realiza el análisis conveniente.
1. McDonald’s es un restaurante de comida rápida que ha incursionado en el mercado de ensaladas. Las ensaladas que ofrece son las siguientes: César, Ranch, Diosa Verde y Rusa. Se probó en 14 restaurantes durante 14 días a fin de ver la respuesta de los clientes y los datos encontrados se presentan a continuación:
Día César Ranch Diosa Verde
Rusa
1 2 3 4 5 6 7
155 157 151 146 181 160 168
143 146 141 136 180 152 157
149 152 146 141 173 170 174
135 136 131 126 115 150 147
8 9
10 11 12 13 14
157 139 144 158 184 161 165
167 159 154 169 195 177 178
141 129 167 145 178 201 185
130 119 134 144 177 151 160
a. Determina si existe alguna diferencia significativa entre las preferencias de los consumidores hacia alguna ensalada.
2. Los siguientes datos corresponden a personas que pertenecen a una comunidad, en donde se realizaron distintas medidas físicas, a fin de determinar si existe diferencia entre las medidas de hombres y mujeres. Responde lo siguiente:
a. ¿Qué análisis multivariante aplicarías? ¿Por qué? b. Aplica el análisis que mencionaste en el inciso ‘a’ a los datos e interpreta
3. Los datos presentados a continuación representan 21 observaciones de 8 variables que corresponden a publicaciones científicas recogidas durante 1982 – 1984. Las variables se organizaron por área:
a. Identifica si existe redundancia entre los datos, es decir, si podemos reducir el número de variables para explicar el comportamiento de los datos.
b. Identifica si existe correlación entre las distintas disciplinas y si puedes generar un modelo lineal para el conjunto de datos.
4. La empresa Kimberly-Clark es líder en el mercado de la industria de los pañales desde 1960 que inició en este campo. A la fecha vende más de 3,500 millones de dólares, únicamente en Estados Unidos. Los atributos principales en la fabricación de pañales son los siguientes:
b. Diseña los 16 perfiles completos en términos de preferencia. Calcula las funciones de valor parcial y la importancia de cada atributo.
5. Se realiza un estudio de mercado para sacar una nueva botana saludable en el cual se analizan distintas características del producto que será vendido en la nueva bolsa biodegradable ecológica:
b. Diseña una encuesta que permita calificar las combinaciones. No es necesario hacer todas las combinaciones. Genera al menos 12 combinaciones que resulten representativas para realizar el análisis.
c. Aplica la encuesta diseñada al menos a 10 personas y realiza el análisis conjunto.
d. Incluye tarjetas de encuesta, datos de resultados e interpretación. e. ¿Crees que esos resultados son estadísticamente significativos? Explica.
6. La siguiente tabla pertenece a un grupo de datos constituido por 26 observaciones y 9 variables que corresponden a porcentaje de empleo, en los distintos sectores, en países europeos. Los sectores son:
a. Analiza la tabla de datos anterior por el método de conglomerados de acuerdo con las siguientes técnicas:
i. Jerárquico enlace único (vecino más cercano) ii. Jerárquico procedimiento de centroide iii. Técnica de Ward
b. Analiza por el método de dos pasos para tratar de encontrar entre 3 y 5 grupos conglomerados bien identificados.
c. Interpreta y analiza cada grupo de resultados a fin de identificar qué cantidad de conglomerados es óptima y cuál es el parámetro que conglomera los datos. Utiliza dendograma o los gráficos que requieras a fin de aclarar tus respuestas.
7. La tabla siguiente proporciona información tomada en una cadena de tiendas de conveniencia para 20 de sus sucursales en la que se tiene la siguiente información:
TIENDA: Número de sucursal VENTAS ANUALES: Ventas anuales en miles de dólares TRÁFICO PROMEDIO: Promedio de autos que pasan por la tienda cada día. Tráfico POBLACIÓN: Población total que vive en un perímetro de 2 millas a la redonda, de acuerdo al censo de 1990 INGRESO PROMEDIO: Ingreso medio de las familias que viven a 2 millas a la redonda, de acuerdo al censo de 1990
a. ¿Cuál de las 3 variables predice mejor las ventas? b. Elabora la regresión de ventas como función del tráfico. c. Elabora la regresión de ventas como función de la población. d. Elabora una matriz de correlaciones a fin de determinar posibles relaciones
entre variables. e. Realiza el análisis de regresión múltiple y determina si existe alguna
relación lineal entre las ventas y las variables en cuestión.