Portafolio

UNIVERSIDAD POLITÉCNICA

ESTATAL DEL CARCHI

FACULTAD DE COMERCIO INTERNACIONAL,

INTEGRACIÓN, ADMINISTRACIÓN Y ECONOMIA

EMPRESARIAL

Carrera: Escuela de Comercio Exterior y Negociación

Internacional

“ESTADÍSTICA INFERENCIAL”

ING. Jorge pozo

ESTUDIANTE: Karol Arciniegas

CURSO: “6” “B”

PERIODO ACADÉMICO

TULCÁN, MARZO - AGOSTO 2012

COMPETENCIA

CAPACIDAD PARA

UTILIZAR LAS CIENCIAS

EXACTAS Y DAR

SOLUCIÒN A PROBLEMAS

DEL CONTEXTO

APLICANDO LA

ESTADÌSTICA CON RIGOR

CIENTÌFICO Y

RESPONSABILIDAD

INTRODUCCION

La estadística inferencial es necesaria cuando queremos hacer alguna afirmación

sobre más elementos de los que vamos a medir. La estadística inferencial hace

que ese salto de la parte al todo se haga de una manera ―controlada‖. Aunque

nunca nos ofrecerá seguridad absoluta, sí nos ofrecerá una respuesta

probabilística. Esto es importante: la estadística no decide; sólo ofrece elementos

para que el investigador o el lector decidan. En muchos casos, distintas personas

perciben diferentes conclusiones de los mismos datos.

El proceso será siempre similar. La estadística dispone de multitud de modelos

que están a nuestra disposición. Para poder usarlos hemos de formular, en primer

lugar, una pregunta en términos estadísticos. Luego hemos de comprobar que

nuestra situación se ajusta a algún modelo (si no se ajusta no tendría sentido

usarlo). Pero si se ajusta, el modelo nos ofrecerá una respuesta estadística a

nuestra pregunta estadística. Es tarea nuestra devolver a la psicología esa

respuesta, llenándola de contenido psicológico.

La estadística descriptiva, como indica su nombre, tiene por finalidad describir.

Así, si queremos estudiar diferentes aspectos de, por ejemplo, un grupo de

personas, la estadística descriptiva nos puede ayudar. Lo primero será tomar

medidas, en todos los miembros del grupo, de esos aspectos o variables para,

posteriormente, indagar en lo que nos interese. Sólo con esos indicadores ya

podemos hacernos una idea, podemos describir a ese conjunto de personas.

OBJETIVO DE LA ESTADÍSTICA

La estadística es el conjunto de técnicas que se emplean para la recolección,

organización, análisis e interpretación de datos. Los datos pueden ser

cuantitativos, con valores expresados numéricamente, o cualitativos, en cuyo caso

se tabulan las características de las observaciones. La estadística sirve en

administración y economía para tomar mejores decisiones a partir de la

comprensión de las fuentes de variación y de la detección de patrones y

relaciones en datos económicos y administrativos.

JUSTIFICACIÓN

El presente portafolio tiene como justificación recolectar todo el trabajo dado en

clases como portafolio de apoyo del estudiante y además ampliar mas el

contenido con investigaciones bibliográficas de libros ya que esto nos permitirá

analizar e indagar de los temas no entendidos para auto educarse el estudiante y

así despejar los dudas que se tiene con la investigación y el análisis de cada uno

de los capítulos ya que la estadística inferencial es amplia y abarca problemas

que estas relacionados con el entorno para poder sacar nuestras propias

decisiones ya que la estadística inferencial nos ayudara a la carrera en la que

estamos siguiendo como lo es comercio exterior ampliar mas nuestros

conocimientos y utilizar más el razonamiento y sacar conclusiones adecuadas

según el problema que se presente en el entorno ay que las matemáticas y la

estadística nos servirá a futuro para así poderlos emplear a futuro .

CAPÍTULO

I

EL SISTEMA INTERNACIONAL DE UNIDADES

Las unidades del sistema internacional de unidades se clasifican en

fundamentales y derivadas. Las unidades fundamentales no se pueden reducir. Se

citan las unidades fundamentales de interés en la asignatura de ciencias e

ingenierías de os materiales.

Las unidades derivadas se expanden en función de las unidades fundamentales

utilizando signos matemáticos de multiplicación y de división. Por ejemplo las

unidades de densidad del sí son el kilogramo por metro cubico algunas unidades

derivadas tienen nombres y símbolos especiales.

Unidad de masa El kilogramo (kg) es igual a la masa del prototipo internacional

del kilogramo (Diaz, 2008)

Unidad de tiempo El segundo (s) es la duración de 9 192 631 770 periodos de la

radiación correspondiente a la transición entre los dos niveles HIPERFINOS del

estado fundamental del átomo de cesio 133. (Diaz, 2008)

Unidad de intensidad de corriente eléctrica El ampere (A) es la intensidad de

una corriente constante que manteniéndose en dos conductores paralelos,

rectilíneos, de longitud infinita, de sección circular despreciable y situados a una

distancia de un metro uno de otro en el vacío, produciría una fuerza igual a 2·10-7

newton por metro de longitud. (Diaz, 2008)

Unidad de temperatura termodinámica El kelvin (K), unidad de temperatura

termodinámica, es la fracción 1/273,16 de la temperatura termodinámica del punto

triple del agua. (Diaz, 2008)

Unidad de cantidad de sustancia El mol (mol) es la cantidad de sustancia de un

sistema que contiene tantas entidades elementales como átomos hay en 0,012

kilogramos de carbono 12. (Diaz, 2008)

Unidad de intensidad luminosa La candela (CD) es la unidad luminosa, en una

dirección dada, de una fuente que emite una radiación monocromática de

frecuencia 540·1012 HERTZ y cuya intensidad energética en dicha dirección es

1/683 WATT por estereorradián. (Diaz, 2008)

Peso: es una magnitud derivada se considera como una unidad vectorial. (Diaz,

2008)

Escalar: aquel que indica el número y la unidad. (Diaz, 2008)

Vector: indica número unidad dirección etc. (Diaz, 2008)

Magnitud derivada: el peso de la unidad newton es una unidad de fuerza. (Diaz,

2008)

Gravedad: es la que permite a los cuerpos caer en perpendiculares según la

gravedad de la tierra (Diaz, 2008)

MULTIPLOS Y SUBMULTIPLOS

Múltiplo

Un múltiplo de un número es otro número que lo contiene un número entero de

veces. En otras palabras, un múltiplo de n es un número tal que, dividido por n, da

por resultado un número entero Los primeros múltiplos del uno al diez suelen

agruparse en las llamadas tablas de multiplicar. (Pineda, 2008)

Submúltiplo

Un número entero a es submúltiplo de otro número b si y sólo si b es múltiplo de a,

(Pineda, 2008).

COMENTARIO:

El Sistema Internacional de Unidades (SI) tiene la finalidad de: Estudiar el

establecimiento de un conjunto de reglas para las unidades de medida y como

estudiantes de comercio exterior nos ayuda muchísimo porque con el podemos

obtener los resultados al almacenar una mercancía en el contenedor sin perder el

tiempo que es valioso en la carrera, y también si perder el espacio dentro de dicho

contenedor.

El sistema internacional de unidades es estudiado para obtener datos reales y a

su vez poder dar nuestros resultados sacando conclusiones propias de la carrera

Para una comunicación científica apropiada y efectiva, es esencial que cada

unidad fundamental de magnitudes de un sistema, sea especificada y reproducible

con la mayor precisión posible.

ORGANIZADOR GRAFICO:

Sistema Internacional de Medidas y Unidades

Magnitudes fundamentales

Una magnitud fundamental

es aquella que se define

por sí misma y es

independiente de las

demás (masa, tiempo,

longitud, etc.).

Magnitudes derivadas

Para resolver el problema que suponga la utilización de unidades diferentes en distintos lugares del mundo, en la XI

Conferencia General de Pesos y Medidas (París, 1960) se estableció el Sistema Internacional de Unidades (SI). En el

cuadro siguiente puedes ver las magnitudes fundamentales del SI, la unidad de cada una de ellas y la abreviatura que se

emplea para representarla:

Son la que

dependen de las

magnitudes

fundamentales.

Múltiplos Submúltiplos

Un número es un

submúltiplo si otro lo

contiene varias veces

exactamente. Ej.: 2 es

Un múltiplo de n es

un número tal que,

dividido por n, da por

resultado un número

entero

PROYECTO Nª1

TEMA: Sistema Internacional de Unidades

PROBLEMA: El escaso conocimiento del Sistema Internacional de Unidades no

ha permitido a los estudiantes transformar y resolver problemas

OBJETIVOS

OBJETIVO GENERAL:

Aplicar los conocimientos del Sistema Internacional de Unidades para

resolver problemas de Comercio Exterior

OBJETIVO ESPECIFICO:

Investigar el Sistema Internacional de Unidades para resolver problemas

de Comercio Exterior

Conocer el Sistema Internacional de Unidades para resolver problemas de

Comercio Exterior

Analizar el Sistema Internacional de Unidades para resolver problemas de

Comercio Exterior

JUSTIFICACION

El presente trabajo se lo ha realizado con el fin de obtener información acerca del

sistema internacional de medida para de esta manera contribuir en nuestro

conocimiento y de esta forma tener claro las transformaciones de unidades de

medida que servirán para resolver los problemas que puedan existir en el

Comercio Exterior.

El Sistema Internacional de Medidas facilitará el cálculo de áreas y volúmenes, la

transformaciones de unidades de tiempo, unidades longitud, y otras las cuales

encontraremos en la logística del Comercio Exterior que le permitirán conocer al

exportador e importado que cantidad abarca en un Conteiner o bodega para su

exportación.

MARCO TEÓRICO

SISTEMA INTERNACIONAL DE UNIDADES (SI)

El Sistema Internacional de Unidades, abreviado SI, también denominado sistema

internacional de medidas, es el sistema de unidades más extensamente usado.

Junto con el antiguo sistema métrico decimal, que es su antecesor y que se ha

mejorado, el SI también es conocido como sistema métrico, especialmente en las

naciones en las que aún no se ha implantado para su uso cotidiano. Fue creado

en 1960 por la Conferencia General de Pesas y Medidas, que inicialmente definió

seis unidades físicas básicas o fundamentales. En 1971, fue añadida la séptima

unidad básica, el mol.

Una de las principales características, que constituye la gran ventaja del SI, es que

sus unidades están basadas en fenómenos físicos fundamentales. La única

excepción es la unidad de la magnitud masa, el kilogramo, que está definida como

―la masa del prototipo internacional del kilogramo‖ o aquel cilindro de platino e

iridio almacenado en una caja fuerte de la Oficina Internacional de Pesos y

Medidas.

Magnitudes Fundamentales

Magnitud física que se toma como

fundamental

Unidad básica o

fundamental

Símbolo

Longitud ( L ) metro m

Masa ( M ) kilogramo kg

Tiempo ( t ) segundo s

Intensidad de corriente eléctrica ( I ) amperio A- amp

Temperatura ( T ) kelvin K

Cantidad de sustancia ( N ) mol mol

Intensidad luminosa ( Iv ) candela cd

Longitud (Metro)

Un metro se define como la distancia que viaja la luz en el vacío en 1/299792458

segundos.

Masa (Kilogramo).

Un kilogramo se define como la masa del Kilogramo Patrón, un cilindro compuesto

de una aleación de platino-iridio, que se guarda en la Oficina Internacional de

Pesos y Medidas en Sèvres. Actualmente es la única que se define por un objeto

patrón.

Tiempo (Segundo)

Un segundo (s) es el tiempo requerido por 9 192 631 770 ciclos de la radiación

correspondiente a la transición entre los dos niveles hiperfinos del estado

fundamental del átomo de cesio 133.

Intensidad de corriente eléctrica (Amperio.)

http://es.wikipedia.org/wiki/Unidades_b%C3%A1sicas_del_Sistema_Internacional#Longitud

http://es.wikipedia.org/wiki/Metro

http://es.wikipedia.org/wiki/Unidades_b%C3%A1sicas_del_Sistema_Internacional#Masa

http://es.wikipedia.org/wiki/Kilogramo

http://es.wikipedia.org/wiki/Unidades_b%C3%A1sicas_del_Sistema_Internacional#Tiempo

http://es.wikipedia.org/wiki/Segundo

http://es.wikipedia.org/wiki/Unidades_b%C3%A1sicas_del_Sistema_Internacional#Intensidad_de_corriente_el.C3.A9ctrica

http://es.wikipedia.org/wiki/Amperio

http://es.wikipedia.org/wiki/Unidades_b%C3%A1sicas_del_Sistema_Internacional#Temperatura

http://es.wikipedia.org/wiki/Kelvin

http://es.wikipedia.org/wiki/Unidades_b%C3%A1sicas_del_Sistema_Internacional#Cantidad_de_substancia

http://es.wikipedia.org/wiki/Mol

http://es.wikipedia.org/wiki/Unidades_b%C3%A1sicas_del_Sistema_Internacional#Intensidad_luminosa

http://es.wikipedia.org/wiki/Candela


http://es.wikipedia.org/wiki/Distancia

http://es.wikipedia.org/wiki/Luz

http://es.wikipedia.org/wiki/Vac%C3%ADo



http://es.wikipedia.org/wiki/Oficina_Internacional_de_Pesos_y_Medidas

http://es.wikipedia.org/wiki/Oficina_Internacional_de_Pesos_y_Medidas


http://es.wikipedia.org/wiki/Transici%C3%B3n_hiperfina

http://es.wikipedia.org/wiki/Cesio

El amperio, también llamado ampere, (A) es la intensidad de una corriente

eléctrica constante que, mantenida en dos conductores paralelos de longitud

infinita, de sección circular despreciable y ubicados a una distancia de 1 metro en

el vacío, produce una fuerza entre ellos igual a 2×10-7 newtons por cada metro.

Temperatura (Kelvin)

El kelvin (K) se define como la fracción 1/273,16 de la temperatura termodinámica

del punto triple del agua.

Cantidad de sustancia (Mol)

Un mol (mol) es la cantidad de sustancia de un sistema que contiene tantas

entidades elementales como átomos hay en 0,012 kg de carbono 12,

aproximadamente 6,022 141 79 (30) × 1023

Cuando se usa el mol, las entidades elementales deben ser especificadas y

pueden ser átomos, moléculas, iones, electrones, otras partículas o grupos

específicos de tales partículas

Intensidad luminosa (Candela)

Una candela (cd) es la intensidad luminosa, en una dirección dada, de una fuente

que emite radiación monocromática con frecuencia de 540 × 1012 Hz de forma que

la intensidad de radiación emitida, en la dirección indicada, es de 1/683 W por

estereorradián.

Múltiplos Y Submúltiplos

Los múltiplos y submúltiplos del Sistema Internacional de Unidades, nos facilitan los

cálculos, las medidas suelen expresarse mediante lo que se conoce como notación

científica.

Múltiplos Submúltiplos

Factor Prefijo Símbolo Factor Prefijo Símbolo

http://es.wikipedia.org/wiki/Corriente_el%C3%A9ctrica

http://es.wikipedia.org/wiki/Corriente_el%C3%A9ctrica

http://es.wikipedia.org/wiki/Conductor_el%C3%A9ctrico

http://es.wikipedia.org/wiki/Paralelo

http://es.wikipedia.org/wiki/Longitud


http://es.wikipedia.org/wiki/Vac%C3%ADo_%28f%C3%ADsica%29

http://es.wikipedia.org/wiki/Fuerza

http://es.wikipedia.org/wiki/Newton_%28unidad%29

http://es.wikipedia.org/wiki/Kelvin

http://es.wikipedia.org/wiki/Temperatura_termodin%C3%A1mica

http://es.wikipedia.org/wiki/Punto_triple

http://es.wikipedia.org/wiki/Agua

http://es.wikipedia.org/wiki/%C3%81tomo


http://es.wikipedia.org/wiki/Carbono

http://es.wikipedia.org/wiki/Mol%C3%A9cula

http://es.wikipedia.org/wiki/Ion

http://es.wikipedia.org/wiki/Electr%C3%B3n

http://es.wikipedia.org/wiki/Part%C3%ADcula_subat%C3%B3mica

http://es.wikipedia.org/wiki/Candela

http://es.wikipedia.org/wiki/Hercio

http://es.wikipedia.org/wiki/Vatio

http://es.wikipedia.org/wiki/Estereorradi%C3%A1n

1018

exa E 10-18

atto a

1015

peta P 10-15

femto f

1012

tera T 10-12

pico p

109 giga G 10

-9 nano n

106 mega M 10

-6 micro μ

103 kilo k 10

-3 mili m

102 hecto h 10

-2 centi c

101 deca da 10

-1 deci d

EQUIVALENCIAS

UNIDADES DE LONGITUD (L)

1 km = 1000 m 1 pulg = 2,54 cm

1 m = 100 cm 1 pie = 30,48 cm

1 cm = 10 mm 1 año luz = 9,48 x 10ˆ15 m

1milla = 1609 m 1 m = 1000 mm

UNIDADES DE MASA (m)

1 kg = 1000 g 1 onza = 0,91428 g

1 tonelada = 20 qq = 907,2 kg 1 lb = 454g

1 kg = 2,2 lbs 1 SIUG = 14,59 kg

1 arroba = 25 lbs 1 U.T.M = 9,81 kg

1 qq = 4 arrobas 1 qq = 45,45 kg

1 lbs = 16 onzas

UNIDADES DE TIEMPO (s)

1 año = 365,25 días 1 semana = 7 días

1 año comercial = 360 días 1 día = 24 horas

1 año = 12 meses 1 h = 60 min

1 mes = 30 días 1 h = 3600 s

1 mes = 4 semanas 1 min = 60 s

UNIDADES DE AREA

(mˆ2)

EJERCICIOS DE TRANSFORMACIÓN

1. 8 m s cm

2. 8 m a pulg

= 314.96 pulg

3. 12 litros a galon

4. 300mm² a m²

( )

(1 mˆ2) = (100cm)ˆ2

1 mˆ2 = 10000 cmˆ2

1 Hectárea = 1000 mˆ2

1 ACRE = 4050 mˆ2 UNIDADES DE VOLUMEN (m/v)

1 litro = 1000 cm^3 = 1000 ml

1 galón = 4 litros (Ecuador)

1 galón = 3.758 litros (EEUU)

(1m)^3 = (1000 cm) ^3

1 m^3 = 1000000 cm^3

Cubo: VL = a^3 = l^3

Caja: VL = l x a x h

Esfera: VL = 4/3 π r^3

Cilindro: VL = π r^2 h

Pirámide = VL = A x h/ 3

5. 80 kgf / a ib/

( ) pulg

6. 8 m a pulg

= 314.96 pulg

7. 56 litros a

8. 67m/s a km/h

9. 12 km/h a m/s

10. 24 a

24 *( )

*( )

=24000000

11. 45 km/ a m/

45

*

*

( ) = 3,47 *

12. 4* a

40000 *( )

( ) *

( )

( ) =0,67

Resolver los siguientes ejercicios

Calcular cuántos gramos de arena hay en un tramo de playa de o, 5 km de largo

por 100m de ancho y una profundidad de 3 m. se sabe que el diámetro de un

grano de arena es alrededor de 1,00 mm.

DATOS

l= 0,5 km *

= 500 m V = 500 m* 100 m* 3 m =150 000

a= 100 m

h= 3m

ARENA

d= 1 mm *

*

= 0,001 m V=

=

= 5,23*

= 2,87 *

Una tienda anuncia un tapete que cuesta USD 15,5 por pies cuadrados. Calcular

cuánto cuesta el tapete en metros cuadrados.

15,5 *( )

( ) *

( )

( ) =43,89

ESCOGER LA RESPUESTA CORRECTA:

1. Las unidades básicas en el SI de medidas son:

a) Centímetro, gramos, segundo

b) Metro, kilogramo, minuto

c) Metro, gramo, segundo

d) Centímetro, gramo, minuto

2. Se observa que 400 gotas de agua ocupan un volumen de 10 cm3 en una

probeta graduado. Determinar el volumen de una gota de agua:

a) 40 cm3

b) 4 cm3

c) 0,4 cm3

d) 4,44 x 10 cm3

e) 0,04 cm3

3. Al realizar un cálculo se obtiene las unidades m/s en el numerador y en

denominador m/s2. Determinar las unidades finales.

a) m2/s3

b) 1/s

c) Ss3/m2

d) /s

e) m/s

=

= s

4. La velocidad del sonido en el aire es de 340m/s. Calcular la velocidad de un

avión supersónico que se mueve al doble de la velocidad del sonido en

kilómetros por hora y en millas por hora.

Velocidad Avión= 680 m/s

5. Un jugador de baloncesto tiene una altura de 6 pies y 9,5 pulgadas, calcular

la altura en metros y en centímetros.

6. Completar las siguientes expresiones:

a) 110 km/h= 68, 36 millas/h

b) 55 cm= 21, 65 pulg.

c) 140 yd.= 127,4 m

d) 1,34 x 105 km/h2 = 10,34 m/s2

7. En un litro hay 1,057 cuartos y 4 cuartos en un galón. Calcular cuántos

cuartos de litros hay en un galón.

8. Si un barril equivale a 42 galones. Calcular cuántos metros cúbicos hay en

un barril.

9. Calcular cuántos años se necesitará para contar 100 millones de dólares si

se puede contar $1 por segundo.

$ 100 000 000 = 100 000 000 s

REFORZANDO LO APRENDIDO:

1.- La distancia a la tierra a la estrella más cercana (Alfa Centauri) es de

m. Calcular la distancia en pies:

2.- La edad de la tierra aproximadamente es de s. Determinar la edad en

meses y en años:

3.- La rapidez de la luz es aproximadamente m/s. Convertir este valor en

millas/h:

4.- Un pintor debe recubrir las paredes de una habitación que tiene 8 pies de altura

y 12 pies de lado. Calcular la superficie que tiene que recubrir en metros

cuadrados:

Altura: 8 pies

Lado: 12 pies

Superficie:

5.- La base (B) de una pirámide cubre un área de 13 acres (1acre y

tiene una altura de 5 772 pulgadas):

Base: 13 acres (1 acre: 43 560 ) =

Altura: 5 772 pulg. = 4008, 01

( )

Volumen:

CONCLUSIONES

El sistema internacional de unidades es muy importante porque se involucra

en nuestra carrera permitiendo la relación económica con otros países

mediante comercio internacional y su negociación entre ellos. como

también la práctica de problemas del sistema internacional de unidades

nos ayudan a ver la realidad de nuestro entorno de cómo podemos

solucionar problemas al momento de exportar una mercancía, que cantidad

de materia prima, electrodomésticos, enceres que actualmente se exporta

en gran cantidad, puede alcanzar dentro de un contenedor.

El sistema internacional de unidades nos ayudan a vincularnos en los

negocios, como realizar negociaciones en el exterior porque a través de

este sistema podemos indicar el volumen, área, del tipo de trasporte el cual

se va a exportar la mercancía, que cantidad de cajas por ejemplo podemos

enviar al exterior este sistema es muy fundamental en la carrera de

comercio exterior.

Recomendaciones

Se recomienda saber todas las medidas del sistema internacional de

unidades como también las magnitudes , longitud, masa y volumen de las

figuras geométrica para que nuestro producto o mercancía pueda ser

exportada al exterior, es necesario conocer debido a que nos permitirá

realizar una buena negociación conociendo la cantidad de mercancía que

puede introducirse en el transporte.

Es de mucha importancia, que como estudiantes de la carrera de comercio

exterior conozcamos las unidades básicas más utilizadas que se

encuentran presentes en el Sistema internacional para una correcta

aplicación en los ejercicios propuestos. La utilización de las medidas del

Sistema Internacional se presenta a nivel internacional y por ende son

aplicadas en el los negocios de Comercio Internacional ya que permite una

mejor movimiento e intercambio.

BIBLIOGRAFÍA

enciclopedia. (28 de 03 de 2012). enciclopedia.us.es. Recuperado el 29 de 03 de

2012, de enciclopedia.us.es:

http://enciclopedia.us.es/index.php/Sistema_Internacional_de_Unidades

profesorenlinea. (28 de 03 de 2012). www.profesorenlinea.c. Recuperado el 29 de

03 de 2012, de www.profesorenlinea.c:

http://www.profesorenlinea.cl/geometria/cuerposgeoAreaVolum.htm

recursostic. (28 de 03 de 2013). recursostic.educacion.es. Recuperado el 29 de 03

de 2013, de recursostic.educacion.es:

http://recursostic.educacion.es/secundaria/edad/3esofisicaquimica/3quincen

a1/3q1_contenidos_3b.htm

ANEXOS:

1.- Convertir 2593 Pies a Yardas.

2.- Convertir 27,356 Metros a Millas

3.- Convertir 386 Kilogramos a Libras.

4.- Convertir 2,352 Segundos a Año.

5.- Convertir 1.1 Millas/Hora a Metros/Segundo.

6.- MIDECAR almacén temporal aduanero tiene como largo 60 m; como ancho 30

m; como altura 3 m ¿cuántos escritorios caben en esta si los escritorios tienen 60

cm de largo 30 cm de ancho y 45 cm de altura?

Área total de MIDECAR 5.400 m2

Área total del escritorio 72.000 cm3

5.400 3 0.072 m3 75.000 escritorios

7.- un tanquero tiene de longitud 17 m y un radio del tanquero de 1.5 m ¿Cuántos

GALONES de gasolina se almacenan en dicho tanque?

U= 3.1416 (2.25) (17)

U= 120.17 M3

8.- Transcomerinter tiene una longitud en bodega de 60 m de largo 30 m de ancho

y 3 metros de altura ¿Cuántos quintales de de papas se pueden almacenar en

esta bodega?

Área total de Transcomerinter 5.400 m2

5.400

9.- Un tanquero cuya longitud es equivalente a 17,34 m y su radio es equivalente a

35 pulgadas. Determinar cuántos litros de leche puede transportar este tanquero.

Datos

L= 17,34 m

r= 35 pulg

( )( ) ( )

TRANSFORMACIONES

En muchas situaciones tenemos que realizar operaciones con magnitudes que

vienen expresadas en unidades que no son homogéneas. Para que los cálculos

que realicemos sean correctos, debemos transformar las unidades de forma que

se cumpla el principio de homogeneidad, (Ledanois & Ramos, 2002).

Por ejemplo, si queremos calcular el espacio recorrido por un móvil que se mueve

a velocidad constante de 72 Km/h en un trayecto que le lleva 30 segundos,

debemos aplicar la sencilla ecuación S = v·t, pero tenemos el problema de que la

velocidad viene expresada en kilómetros/hora, mientras que el tiempo viene

en segundos. Esto nos obliga a transformar una de las dos unidades, de forma

que ambas sean la misma, para no violar el principio de homogeneidad y que el

cálculo sea acertado, (Ledanois & Ramos, 2002).

Para realizar la transformación utilizamos los factores de conversión. Llamamos

factor de conversión a la relación de equivalencia entre dos unidades de la misma

magnitud, es decir, un cociente que nos indica los valores numéricos de

equivalencia entre ambas unidades, (Ledanois & Ramos, 2002).

EJERCICIOS REALIZADOS EN CLASE

Volumen 300 transformar en pulgadas 3

( ) ( )

( ) ( )

V= 100000

V= 100000

Q= 7200000

( ) ( )

( )

Vol. Paralelepípedo L x a x h

Vol. Cubo

Vol. Esfera

Vol. Cilindro

Vol. Pirámide

Área cuadrada

Área de un rectángulo B x h

Área de un circulo

Área de un triangulo

En una bodega tiene un largo de 60 m un ancho de 30 m cuantas cadjas de

manzana puede ubicar en esta bodega en estas cajas tiene 60cm de lado y 30 de

ancho y 40 de altura.

Vol. de p bodega = l x a h = 60 x 30 x3 = 5400

Vol. De p caja = 60 x 30 x 40 = 72000

TRANSFORMACIÓN

X=

Un tanquero tiene una longitud de 17 m y un radio del tanque de 1.50 m. ¿Cuántos

litros se puede almacenar en dicho tanque?.

RESOLUCION

VOL. CILINDRO =

VOL. CILINDRO= 3.1416 X (1.50) X (17)= 0 120.17

TRANSFORMACIÓN

120.17

SISTEMA INTERNACIONAL DE UNIDADES

LONGITUD

1 Km 1000 m

1 m 100 cm

1 cm 10 mm

1 milla 1609 m

1 m 1000 mm

MASA

1qq 100 lbs.

1 Kg 2.2 lbs.

1 qq 45.45 Kg

1 qq 1 arroba

1 arroba 25 lbs.

1 lb 454 g

1 lb 16 onzas

1 utm 14.8 Kg

1 stug 9.61 Kg

1 m 10 Kg

1 tonelada 907 Kg

ÁREA

100

1 10000

1 hectárea 10000

1 acre 4050

1 pie (30.48 cm)

1 pie 900.29

1 10.76

LONGITUD

Observamos que desde los submúltiplos, en la parte inferior, hasta los múltiplos,

en la parte superior, cada unidad vale 10 veces más que la anterior, (Riley &

Sturges, 2004).

LONGITUD

1 KM 100 M

1 M 100M, 1000MM

1 MILLA 1609M

1 PIE 30,48CM, 0,3048M

1 PULGADA 2,54CM

1 AÑO LUZ 9,46X1015M

TIEMPO.

El tiempo es la magnitud física con la que medimos la duración o separación de

acontecimientos sujetos a cambio, de los sistemas sujetos a observación, esto es,

el período que transcurre entre el estado del sistema cuando éste aparentaba un

estado X y el instante en el que X registra una variación perceptible para un

observador (o aparato de medida). El tiempo ha sido frecuentemente concebido

como un flujo sucesivo de situaciones atomizadas, (López, March, García, &

Álvarez, 2004).

MEDIDAS DEL TIEMPO

1 AÑO 365 DIAS

1 MES 30 DIAS

1SEMANA 7 DIAS

1 DIA 24 HR

1 HORA 60 MIN,3600SEG

1 MINUTO 60 SEG.

MASA Y PESO.

La masa es la única unidad que tiene este patrón, además de estar en Sevres, hay

copias en otros países que cada cierto tiempo se reúnen para ser regladas y ver si

han perdido masa con respecto a la original. El kilogramo (unidad de masa) tiene

su patrón en: la masa de un cilindro fabricado en 1880, compuesto de una

aleación de platino-iridio (90 % platino - 10 % iridio), creado y guardado en unas

condiciones exactas, y que se guarda en la Oficina Internacional de Pesos y

Medidas en Seres, cerca de París, (Hewitt, 2004).

PESO

De nuevo, atención a lo siguiente: la masa (la cantidad de materia) de cada cuerpo

es atraída por la fuerza de gravedad de la Tierra. Esa fuerza de atracción hace

que el cuerpo (la masa) tenga un peso, que se cuantifica con una unidad diferente:

el Newton (N), (Torre, 2007).

SISTEMA DE CONVERSION DE MASA

1 TONELADA

1000 KG

1 QQ 4 ARROBAS, 100 L

1 ARROBA 25 L

1 KG 2,2 L

1 SLUG 14,58 KG

1 UTM 9,8 KG

1 KG 1000 GR

1 L 454 GR, 16 ONZAS

COMENTARIO EN GRUPO:

Como comentario en grupo podemos decir que las transformaciones nos servirá

en la carrera del comercio exterior y además poder resolver problemas que se

presenten ya que al realizar ejercicios de cilindros y tanque etc., y otras formas

geométricas nos servirá para determinar cuántas cajas o bultos, etc. que pueden

alcanzar en una almacenera o en cada uno de los contenedores esto nos servirá

al realizar prácticas o al momento de emprender nuestro conocimientos a futuro.


PROYECTO Nª2

CONCLUSIÓN:

La conversión de unidades es la transformación de una cantidad, expresada en

una cierta unidad de medida, en otra equivalente. Este proceso suele realizarse

con el uso de los factores de conversión y las tablas de conversión del Sistema

Internacional de Unidades.

Frecuentemente basta multiplicar por un factor de conversión y el resultado es otra

medida equivalente, en la que han cambiado las unidades.

Cuando el cambio de unidades implica la transformación de varias unidades se

pueden utilizar varios factores de conversión uno tras otro, de forma que el

resultado final será la medida equivalente en las unidades que buscamos.

Cuando se trabaja en la resolución de problemas, frecuentemente surge la

necesidad de convertir valores numéricos de un sistema de unidades a otro, por lo

cual es indispensable tener conocimientos sobre las equivalencias de los

diferentes sistemas de unidades que nos facilitan la conversión de una unidad a

otra, tomando en cuenta el país y la medida que se emplee en los diferentes

lugares.

RECOMENDACIÓN:

En toda actividad realizada por el ser humano, hay la necesidad de medir "algo";

ya sea el tiempo, distancia, velocidad, temperatura, volumen, ángulos, potencia,

etc. Todo lo que sea medible, requiere de alguna unidad con qué medirlo, ya que

las personas necesitan saber qué tan lejos, qué tan rápido, qué cantidad, cuánto

pesa, en términos que se entiendan, que sean reconocibles, y que se esté de

acuerdo con ellos; debido a esto es necesario tener conocimientos claros sobre el

Sistema De Conversión De Unidades pues mediante el entendimiento de este

sistema o patrón de referencia podremos entender y comprender con facilidad las

unidades de medida las cuales las podremos aplicar en la solución de problemas

de nuestro contexto.

CRONOGRAMA DE ACTIVIDADES:

MES DE MARZO-ABRIL

ACTIVIDADES M J V S D L M

Investigar sobre el Sistema Internacional de Unidades y la Áreas y volúmenes de diferentes figuras geométricas

X X

Ejecución del Formato del Trabajo X

Resumen de los textos investigados X X

Finalización del Proyecto X

Presentación del Proyecto X

BIBLIOGRAFIA

Enríquez, H. (2002). Fundamentos de Electricidad. México: LIMUSA S.A.

Física, E. d. (1997). Brian Mckittrick. Madrid: Reverté S.A.

García, M. A. (2000). Estadística Avanzada con el Paquete Systat. Murcia: I.S.B.N.

Hewitt, P. G. (2004). Física Conceptual. México: Pearson Educación S.A.

J.R, W. D. (20007). Ciencias e Ingenieria de las Materias .

Ledanois, J. M., & Ramos, A. L. (2002). Magnitudes, Dimensiones y Conversiones

de Unidades. Caracas: EQUINOCCIO.

López, J. C., March, S. C., García, F. C., & Álvarez, J. M. (2004). Curso de

Ingeniería Química. Barcelona: REVERTÉ S.A.

Pineda, L. (2008). matematicas.

Riley, W. F., & Sturges, L. F. (2004). ESTÁTICA. Barcelona: REVERTÉ.

LINKOGRAFIA:

http://es.wikipedia.org/wiki/Magnitud_fundamental#Unidades_en_el_Sistema_I

nternacional_de_Unidades_.28SI.29

http://es.wikipedia.org/wiki/Superficie_%28matem%C3%A1tica%29

http://www.quimicaweb.net/ciencia/paginas/magnitudes.html

http://www.profesorenlinea.cl/geometria/VolumenCilindro.htm

http://mimosa.pntic.mec.es/clobo/geoweb/volum1.htm

http://www.sc.ehu.es/sbweb/fisica/unidades/unidades/unidades.htm

ANEXOS:

1.- Investigar las medidas de un tráiler, de una mula y de un camión sencillo,

además las medidas de las cajas de plátano, manzanas, quintales de papa y

arroz. Con esa información calcular el número de cajas y quintales que alcanzan

en cada uno de los vehículos.

TRAILER MULA CAMION SENCILLO

Largo 14.30m Largo 8.27m Largo 10.80m

Ancho 2.45m Ancho 2.50m Ancho 2.60m

http://es.wikipedia.org/wiki/Magnitud_fundamental#Unidades_en_el_Sistema_Internacional_de_Unidades_.28SI.29

http://es.wikipedia.org/wiki/Magnitud_fundamental#Unidades_en_el_Sistema_Internacional_de_Unidades_.28SI.29

http://es.wikipedia.org/wiki/Superficie_%28matem%C3%A1tica%29

http://www.quimicaweb.net/ciencia/paginas/magnitudes.html

http://www.profesorenlinea.cl/geometria/VolumenCilindro.htm

http://mimosa.pntic.mec.es/clobo/geoweb/volum1.htm

http://www.sc.ehu.es/sbweb/fisica/unidades/unidades/unidades.htm

Alto 2.6m Alto 1.44m. Alto 4.40m

Medidas de las cajas:

Medidas de las cajas de plátano

LARGO ANCHO ALTO

20cm 51cm 34cm

Medidas de las cajas de manzana

7.5cm 9.5cm 7.5cm

Desarrollo:

( )

( )

( )

( )

a.

1 caja de plátano-----------------911*10-05m3

X 91.09m3

b.

1 caja de manzana-----------------5.3*108m3

X 9.11*10-05m3

c.

(

) (

)(

)(

) (

)

1 qq de papa-----------------0.05m3

X 9.11*10-05m3

d.

(

) (

) (

)(

) (

)

1 qq de arroz-----------------0.05m3

X 9.11*10-05m3

e.

1 caja de plátano-----------------911*10-05m3

X 29.77m3

f.

1 caja de manzana-----------------5.3*108m3

X 29.77m3

g.

1 qq de papa-----------------0.05m3

X 29.77m3

.

h.

1 qq de arroz-----------------0.05m3

X 9.11*10-05m3

i.

1 caja de plátano-----------------911*10-05m3

X 123.55m3

j.

1 caja de manzana-----------------5.3*108m3

X 123.55m3

k.

1 qq de papa-----------------0.05m3

X 123.55m3

.

l.

1 qq de arroz-----------------0.05m3

X 123.55m3

CRONOGRAMA DE ACTIVIDADES DEL PRIMER CAPÍTULO:

Tiempo Actividades

MARZO ABRIL MAYO

SEMANAS SEMANAS SEMANAS

1 2 3 4 1 2 3 4 1 2 3 4

PRIMERA CLASE

Competencia especifica (27-Marzo-2012)

X

Introducción de la Materia (27-Marzo-2012)

x

SEGUNDA CLASE

Sistema Internacional de Unidades (03-Abril-2012)

X

Tarea Sistema Internacional de Unidades. Entregar el 10 de abril del

2012

X

TERCERA CLASE

Aplicación de transformaciones (17 de abril del 2012)

X

Tarea Ejercicios de aplicación acerca del Sistema Internacional de unidades según las transformaciones (24 de abril del 2012)

X

CUARTA CLASE

Evaluación primer capitulo (03 de Mayo del 2012)

x

APRENDIZAJE MEDIADO

NIVEL TEÓRICO PRÁCTICO

Lectura comprensiva de los conceptos básicos del sistema internacional de

unidades

Subrayar ideas principales del documento.

NIVEL TEÓRICO AVANZADO

Pasar las ideas principales a un organizador gráfico.

Realizar nuestros propios conceptos para mayor entendimiento.

NIVEL TEÓRICO BÁSICO PRÁCTICO

Resolver ejercicios relacionados del sistema internacional de unidades

Establecer problemas para la aplicación del del sistema internacional de

unidades

NIVEL TEÓRICO BÁSICO PRÁCTICO AVANZADO

Con datos de comercio exterior del sistema internacional de unidades

Resolver ejercicios aplicando del sistema internacional de unidades

APRENDIZAJE AUTÓNOMO


Investigar otros conceptos del sistema internacional de unidades

Hacer un resumen de la investigación realizada.


Elaboración de mapas conceptuales del sistema internacional de unidades

Elaboración de proyectos para una mayor comprensión de los conceptos

del sistema internacional de unidades.


Realizar ejercicios relacionados a la carrera de comercio exterior

Resolver problemas relacionados con comercio exterior


Investigar los datos sobre comercio exterior para la aplicación del del

sistema internacional de unidades

CAPÍTULO

II

COEFICIENTE DE CORRELACIÓN Y REGRESIÓN LINEAL

La correlación estadística determina la relación o dependencia que existe entre las

dos variables que intervienen en una distribución bidimensional. Es decir,

determinar si los cambios en una de las variables influyen en los cambios de la

otra. En caso de que suceda, diremos que las variables están correlacionadas o

que hay correlación entre ellas.

Una medida estadística ampliamente utilizada que mide el grado de

relación lineal entre dos variables aleatorias. El coeficiente de correlación

debe situarse en la banda de -1 a +1. El coeficiente de correlación se

calcula dividiendo la covarianza de las dos variables aleatorias por el

producto de las desviaciones típicas individuales de las dos variables

aleatorias. Las correlaciones desempeñan un papel vital en la creación de

carteras y la gestión de riesgos, (Weiers, 2006).

Comentario:

A una correlación se la puede apreciar con un grupo de técnicas

estadísticas empleadas para medir la intensidad de dicha relación entre dos

variables, en donde se deben identificar la variable dependiente y la

independiente.

DIAGRAMA DE DISPERSIÓN

Representación gráfica del grado de relación entre dos variables cuantitativas.

Características principales

A continuación se comentan una serie de características que ayudan a

comprender la naturaleza de la herramienta.

Impacto visual

http://www.economia48.com/spa/d/estadistica/estadistica.htm

http://www.economia48.com/spa/d/relacion/relacion.htm

http://www.economia48.com/spa/d/lineal/lineal.htm

http://www.economia48.com/spa/d/variable/variable.htm

http://www.economia48.com/spa/d/coeficiente/coeficiente.htm

http://www.economia48.com/spa/d/correlacion/correlacion.htm

http://www.economia48.com/spa/d/debe/debe.htm

http://www.economia48.com/spa/d/banda/banda.htm

http://www.economia48.com/spa/d/coeficiente/coeficiente.htm

http://www.economia48.com/spa/d/correlacion/correlacion.htm

http://www.economia48.com/spa/d/covarianza/covarianza.htm


http://www.economia48.com/spa/d/producto/producto.htm


http://www.economia48.com/spa/d/papel/papel.htm

http://www.economia48.com/spa/d/cartera/cartera.htm

http://www.economia48.com/spa/d/gestion-de-riesgos/gestion-de-riesgos.htm

Un Diagrama de Dispersión muestra la posibilidad de la existencia de correlación

entre dos variables de un vistazo.

Comunicación

Simplifica el análisis de situaciones numéricas complejas.

Guía en la investigación

El análisis de datos mediante esta herramienta proporciona mayor información que

el simple análisis matemático de correlación, sugiriendo posibilidades y

alternativas de estudio, basadas en la necesidad de conjugar datos y procesos en

su utilización, (García, 2000).

Comentario:

El diagrama de dispersión sirve para una representación gráfica más fácil y

útil cuando se quiere describir el comportamiento de un conjunto de dos

variables, en donde aparece representado como un punto en el plano

cartesiano.

COEFICIENTE DE CORRELACIÓN RECTILINEA DE PEARSON

En estadística, el coeficiente de correlación de Pearson es un índice que mide la

relación lineal entre dos variables aleatorias cuantitativas. A diferencia de la

covarianza, la correlación de Pearson es independiente de la escala de medida de

las variables.

De manera menos formal, podemos definir el coeficiente de correlación de

Pearson como un índice que puede utilizarse para medir el grado de relación de

dos variables siempre y cuando ambas sean cuantitativas.

El coeficiente de correlación es una medida de asociación entre dos

variables y se simboliza con la literal r; los valores de la correlación van de

+ 1 a - 1, pasando por el cero, el cual corresponde a ausencia de

correlación. Los primeros dan a entender que existe una correlación

directamente proporcional e inversamente proporcional, respectivamente,

(Willliams, 2008).

Comentario:

El coeficiente de correlación de Pearson nos da una idea de que tan

relacionadas están dos variables, este número varía entre 0 y 1; si el

coeficiente es > 0.9, entonces es una buena correlación y cuando un

coeficiente es < 0.3 indica que las variables no están correlacionadas entre

ellas y por lo que el 1 representa una correlación perfecta.

INTERPRETACIÓN DE UN COEFICIENTE DE CORRELACIÓN

El coeficiente de correlación como previamente se indicó oscila entre –1 y +1

encontrándose en medio el valor 0 que indica que no existe asociación lineal entre

las dos variables a estudio. Un coeficiente de valor reducido no indica

necesariamente que no exista correlación ya que las variables pueden presentar

una relación no lineal como puede ser el peso del recién nacido y el tiempo de

gestación. En este caso el r infraestima la asociación al medirse linealmente. Los

métodos no paramétrico estarían mejor utilizados en este caso para mostrar si las

variables tienden a elevarse conjuntamente o a moverse en direcciones diferentes.

Como ya se ha planteado el grado de correlación mide la intensidad de

relación lineal, ya sea directa, inversa o inexistente entre dos variables, se

dice que es directa si tiene signo positivo, inversa de signo negativo y nula

cuando el valor sea aproximadamente igual a cero, (Anderson, 2005).

Comentario:

El coeficiente de correlación mide solo la relación con una línea recta, dos

variables pueden tener una relación curvilínea fuerte, a pesar de que su

correlación sea pequeña; por lo tanto cuando analicemos las relaciones

entre dos variables debemos representarlas gráficamente y posteriormente

calcular el coeficiente de correlación para un mejor entendimiento.

FORMULA

( ∑ ) (∑ ) (∑ )

√ (∑ ) (∑ ) [ (∑ ) (∑ ) ]

REGRESIÓN LINEAL SIMPLE

Elegida una de las variables independientes y representadas los valores de la

variable bidimensional, si observamos que la función que mejor se adapta a la

forma de la nube de puntos es una recta, tendremos un problema de regresión

lineal. Si hemos elegido el carácter X como variable independiente, tendremos a la

recta de regresión de Y sobre X. Si elegimos Y como variable independiente, se

obtendrá la recta de regresión de X sobre Y.

Regresión Lineal Simple.- suponga que tenemos una única variable respuesta

cuantitativa Y, y una única variable predictora cuantitativa X. Para estudiar la

relación entre estas dos variables examinaremos la distribución condicionales de Y

dado X=x para ver si varían cuando varia x. (MORER, 2004)

COMENTARIO:

Podemos concluir diciendo que una de las variables independientes y

representadas los valores que mejor se adapta a la forma de la nube de

puntos es una recta, tendremos un problema de regresión lineal. A demás

el hecho de entender de que se trata una regresión lineal y saberla aplicar

relacionando dos variables nos será de mucha ayuda en nuestro futuro ya

que nos permitirá aplicar lo aprendido en problemas reales que se nos

presenten en nuestra vida profesional como por ejemplo el saber que tan

buena resulta una relación entre exportaciones e importaciones que el

Ecuador ha realizado y así con esto poder tomar decisiones.

CORRELACIÓN POR RANGOS

Cuando se obtienen datos en parejas, tales como observaciones de dos variables

para un mismo individuo, deseamos conocer si las dos variables están

relacionadas o no y de estarlo, el grado de asociación entre ellas.

Correlación Por Rangos.- Este coeficiente de Sperman, es muy utilizado en

investigaciones de mercado, especialmente cuando no se deben aplicar medidas

cuantitativas para ciertas características cualitativas, en aquellos casos , en donde

se pueden aplicar ambos coeficientes de correlación, encontraremos que sus

resultados son bastante aproximados. (BENCARDINO, 2006)

COMENTARIO:

Son datos en pareja para poder conocer la relación que existe entre ellas

para un solo individuo en común, y medir el grado de asociación entre ellas.

Esto es muy interesante ya que en un futuro nos ayudara en lo que nos

vamos a desarrollar que es un ambiente de negocios, ya que podemos

aplicar esta técnica estadística aprendida, y así poder solucionar problemas

que se nos presenten comúnmente y saber que tan buena es la relación

entre las dos variables propuestas es decir nos ayudara mucho ya que nos

dará una idea de que tan relacionadas linealmente están dos variables y si

su relación es positiva o negativa.

RANGO

La diferencia entre el menor y el mayor valor. En {4, 6, 9, 3, 7} el menor valor es 3,

y el mayor es 9, entonces el rango es 9-3 igual a 6. Rango puede significar

también todos los valores de resultado de una función.

Rango.- es una categoría que puede aplicarse a una persona en función de su

situación profesional o de su status social. Por ejemplo: ―Tenemos que respetar el

rango del superior a la hora de realizar algún pedido‖, ―Diríjase a mi sin olvidar su

rango o será sancionado. (MORER, 2004)

COMENTARIO:

Rango es el valor que se diferencia entre el menor y el mayor valor. Rango

puede significar también todos los valores de resultado de una función, y se

puede así relacionar y correlacionar a dos variables para obtener resultados

que nos ayudan a la toma de decisiones. A demás un rango es importante

ya que nos permite la obtención de datos más exactos y pues con esto

nuestro trabajo se entonara de forma más real y sobre todo de forma más

precisa, y por ende tomaremos decisiones más acertadas.

COMENTARIO GENERAL:

La correlación y regresión lineal están estrechamente relacionadas entre si las

cuales nos ayudan a comprender el análisis de los datos muéstrales para saber

qué es y cómo se relacionan entre sí dos o más variables en una población que

deseemos estudiar para así poder determinar posibles resultados que nos darán

en un estudio de mercado por ejemplo ya que nuestra carrera de comercio exterior

está muy relacionada con ese ámbito.

La regresión lineal por otro lado nos permitirá graficar las dos variables a estudiar

determinando su situación y si es conveniente o no desarrollar lo propuesto o

investigado. La finalidad de una ecuación de regresión seria estimar los valores de

una variable con base en los valores conocidos de la otra.

Es decir en resumen que nos permitirá tomar decisiones acertadas dentro de un

estudio ya sea en una población que determinara el éxito o fracaso entre dos

variables a estudiar, y facilitara la recolección de información.

CORRELACIÓN Y REGRESIÓN LINEAL

La correlación y la regresión están muy relacionadas entre sí. Ambas implican la

relación entre dos o más variables. La correlación se ocupa principalmente. De

establecer si existe una relación, así como de determinar su magnitud y dirección,

mientras que la regresión se encarga principalmente de utilizar a la relación. En

este capítulo analizaremos la correlación y más adelante la regresión lineal

Relaciones;

La correlación se ocupa de establecer la magnitud y la dirección de las relaciones.

Analizaremos algunas características importantes generales de estas con las que

comprenderemos mejor este tema.

Relaciones lineales:

Veamos una relación lineal entre dos variable. La siguiente tabla nos muestra el

salario mensual que percibieron cinco agentes de ventas y el valor en dólares de

las mercancías vendidas por cada uno de ellos en ese mes.

Agente variable X mercancía vendida ($) Y variable salario ($)

1 0 500

2 1000 900

3 2000 1300

4 3000 1700

5 4000 2100

Podemos analizar mejor la relación entre estas variables. Si trazamos una grafica

trazamos los valores XyY, para cada agente de ventas, como los puntos de dicha

gráfica. Sería una gráfica de dispersión o de dispersigrama.

La grafica de dispersión para los datos de los agentes de ventas aparece en el

cuadro.

Una relación lineal.- entre dos variables, es aquella que puede representarse con

la mejor exactitud mediante una línea recta.

Problema de que ambos tienen escalas muy diferentes. Como mencionamos

anteriormente podemos resolver esta dificultad al convertir cada calificación en su

valor Z transformado, lo cual colocaría a ambas variables en la misma escala, en

la escala Z.

Para apreciar la utilidad de los puntajes Z en la determinación de la correlación,

consideremos el siguiente ejemplo. Supongamos que el supermercado de su

barrio está vendiendo naranjas, las cuales ya están empacadas; cada bolsa tiene

marcado el precio total. Ud. quiere saber si existe una relación entre el peso de las

naranjas de cada bolsa y su costo. Como Ud. Es investigador nato, elige al azar

seis bolsas y la pesa, de hecho están relacionadas estas variables. Existe una

correlación positiva perfecta entre el costo y el peso de las naranjas. Asi el

coeficiente de correlación debe ser igual a + 1.

Para utilizar esta ecuación primero hay que convertir cada puntaje en bruto en su

valor transformado. Esto puede tardar mucho tiempo y crear errores de redondeo

con alguna algebra, esta ecuación se puede transformar en una ecuación de

cálculo que utilice datos en bruto:

Ecuación para el cálculo de la r de pearson

r (∑ ) (

(∑ )(∑ )

)

√,∑ ((∑ ) ( ))-,∑ ((∑ ) ( ))-

Donde ∑ es la suma de los productos de cada pareja XyY ∑

también se llama la suma de los productos cruzados.

Datos hipotéticos a partir de cinco sujetos:

r (∑ ) (

(∑ )(∑ )

)

√,∑ ((∑ ) ( ))-,∑ ((∑ ) ( ))-

r ( ) (

( )( )

)

√, (( ) ( ))-, (( ) ( ))-

SUBJETIVO X Y X2 Y2 XY

A 1 2 1 4 2

B 3 5 9 25 15

C 4 3 16 9 12

D 6 7 36 49 42

E 7 5 49 25 35

TOTAL 21 22 111 112 106

PROBLEMA DE PRÁCTICA:

Tenemos una relación lineal imperfecta y estamos interesados en calcular la

magnitud y dirección de la magnitud y dirección de la relación mediante la r

Pearson.

# de

estudiantes

IQ

(promedio de

calificaciones)

Promedio

de datos

Y

X2 Y2 XY

1 2 3 4 5 6 7 8 9

10 11 12

TOTAL

110 112 118 119 122 125 127 130 132 134 136 138

1503

1.0 1.6 1.2 2.1 2.6 1.8 2.6 2.0 3.2 2.6 3.0 3.6

27.3

12.100 12.544 13.924 14.161 14.884 15.625 16.129 16.900 17.424 17.956 18.496 19.044

189.187

1.00 2.56 1.44 4.41 6.76 3.24 6.76 4.00

10.24 6.76 9.00

12.96 69.13

110.0 179.2 141.6 249.9 317.2 225.0 330.2 260.0 422.4 384.4 408.0 496.8

3488.0

r (∑ ) (

(∑ )(∑ )

)

√,∑ ((∑ ) ( ))-,∑ ((∑ ) ( ))-

r ( ) (

( )( )

)

√, (( ) ( ))-, (( ) ( ))-

Una segunda interpretación de la r de pearson es que también se puede

interpretar en términos de la variabilidad de Y explicada por medio de X. este

punto de vista produce más información importante acerca de r y la relación entre

X y Y en este ejemplo la variable X representa una competencia de ortografía y la

variable Y la habilidad de la escritura de seis estudiantes de tercer grado. Suponga

que queremos que queremos predecir la calificación de la escritura de Esteban, el

estudiante cuya calificación en ortografía es de 88.

Para calcular la r de Pearson para cada conjunto. Observe que en el conjunto B,

donde la correlación es menor, a algunos de los valores

r= ∑ ( )

Son positivos y otros son negativos. Estos tienden a cancelarse entre si, lo

cual hace que r tenga una menor magnitud. Sin embargo, en los conjuntos A y C

todos los productos tienen el mismo signo, haciendo que la magnitud de r

aumente. Cuando las parejas de datos ocupan las mismas u opuestas posiciones

dentro de sus propias distribuciones, los productos tienen el mismo signo, la

cual produce una mayor magnitud de r

Calculando r utilizando para el conjunto B, utilizando la ecuación para los datos en bruto

¿Qué quiere utilizar la ecuación de los datos en bruto o la los puntajes z?

Sume la constante 5 de los datos X en el conjunto A y calcule r de nuevo, mediante la

ecuación de datos en bruto ¿ha cambiado el valor?

Construya una gráfica de dispersión para las parejas de datos.

Sería justo decir que este es un examen confiable

Un grupo de investigadores ha diseñado un cuestionario sobre la tensión, consistente en

quince sucesos. Ellos están interesados en determinar si existe una coincidencia entre

dos culturas acerca de la cantidad relativa de ajustes que acarrea cada suceso. El

cuestionario se aplica a 300 estadounidenses y 300 italianos. Cada individuo debe utilizar

el evento ―matrimonio‖ como estándar y juzgar los demás eventos en relación con el

ajuste necesario para el matrimonio recibe un valor arbitrario de 50 puntos. Si se

considera un evento requiere de más ajustes que el matrimonio, el evento debe recibir

más de 50 puntos. el número de puntos excedentes depende de la cantidad de ajustes

requeridos. Después de cada sujeto de cada cultura ha asignado de puntos a todos los

eventos, se promedian los puntos de cada evento. Los resultados aparecen en la

siguiente tabla.

EVENTOS

ESTADOUNIDENSES

ITALIANOS

Muerte de la esposa 100 80

Divorcio 73 95

Separación de la pareja 65 85

Temporada en prisión 63 52

Lesiones personales 53 72

Matrimonio 50 50

Despedido del trabajo 47 40

Jubilación 45 30

Embarazo 40 28

Dificultades sexuales 39 42

Reajustes económicos 39 36

Problemas con la

familia política

29 41

Problemas con el jefe 23 35

Vacaciones 13 16

Navidad 12 10

a. Suponga que los datos tienen al menos una escala de intervalo y calcule la

correlación entre los datos de los estadounidenses y la de los italianos

b. Suponga que los datos solo tienen una escala ordinal y calcule la correlación entre

los datos de ambas culturas

INDIVIDUO EXAMEN CON

LÁPIZ Y PAPEL

PSIQUIATRA

A

PSIQUIATRA

B

1 48 12 9

2 37 11 12

3 30 4 5

4 45 7 8

5 31 10 11

6 24 8 7

7 28 3 4

8 18 1 1

9 35 9 6

10 15 2 2

11 42 6 10

12 22 5 3

un Psicólogo ha construido un examen lápiz-papel, a fin de medir la depresión. Para

comparar los datos de los exámenes con los datos de los expertos, 12 individuos ―con

perturbaciones emocionales‖ realizan el examen lápiz-papel. Los individuos son

calificados de manera independiente por los dos psiquiatras, de acuerdo con el grado de

depresión determinado para cada uno como resultado de las entrevistas detalladas. Los

datos aparecen a continuación.

Los datos mayores corresponden a una mayor depresión.

a. ¿Cuál es la correlación de los datos de los dos psiquiatras?

b. ¿Cuál es la correlación sobre las calificaciones del examen de lápiz y papel de

cada psiquiatra?

Para este problema, suponga que Ud. Es un psicólogo que labora en el departamento de

recursos humanos de una gran corporación. El presidente de la compañía acaba de

hablar con Ud. Acerca de la importancia de contratar personal productivo en la sección de

manufactura de la empresa y le ha pedido que ayude a mejorar la capacidad de la

institución para hacer esto. Existen 300 empleados en esta sección y cada obrero fabrica

el mismo artículo. Hasta ahora la corporación solo ha recurrido a entrevistas para elegir a

estos empleados. Ud. Busca bibliografía y descubre dos pruebas de desempeño lápiz y

papel, bien estandarizadas y piensa que podrían estar relacionadas con los requisitos de

desempeño de esta sección. Para determinar si alguna de ellas se puede usar como

dispositivo de selección elige a 10 empleados representativos de la sección de la

manufactura, garantizando que una amplio rango de desempeño quede representado en

la muestra y realiza las dos pruebas con cada empleado por semana, promediando

durante los últimos seis meses.

Desempeño

en el trabajo

Examen 1

Examen 2

1

50

10

25

2

74

19

35

3

62

20

40

4

90

20

49

5

98

21

50

6

52

14

29

7

68

10

32

8

80

24

44

9

88

16

46

10

76

14

35

CORRELACIÓN

4.1.1. TÉCNICAS DE CORRELACIÓN

En los capítulos anteriores, ustedes estudiaron las distribuciones de una sola

variable. A continuación abordaremos el estudio de dos variables y no solamente

de una. Particularmente estudiaremos qué sentido tiene afirmar que dos variables

están relacionadas linealmente entre si y cómo podemos medir esta relación

lineal.

4.1.2. RELACIONES LINEALES ENTRE VARIABLES

Supongamos que disponemos de dos pruebas siendo una de ellas una prueba de

habilidad mental y otra una prueba de ingreso a la Universidad. Seleccionemos

cinco estudiantes y presentemos en la tabla Nº 4.1.1 los puntajes obtenidos en

estas dos pruebas.

Tabla Nº 4.1.1

Estudiantes X

Prueba de habilidad

mental

Y

Examen de Admisión

María 18 82

Olga 15 68

Susana 12 60

Aldo 9 32

Juan 3 18

La tabla nos dice que si podemos hacer tal suposición ya que los estudiantes con

puntajes altos en la prueba de habilidad mental tienen también un puntaje alto en

el examen de admisión y los estudiantes con puntaje bajo en la prueba de

habilidad mental. Tienen también bajo puntajes en el examen de admisión. En

circunstancia como la presente (cuando los puntajes altos de una variable están

relacionados con los puntajes altos de la otra variable y los puntajes) afirmaríamos

que hay una relación lineal positiva entre las variables, entonces podemos definir

una relación lineal positiva entre ese conjunto de pares valores X y Y, tal la

muestra la tabla N º 4.1.1

Supongamos que en lugar de los resultados de la tabla Nº 4.1.1, hubiéramos

obtenido los puntajes que se muestran en la tabla Nº 4.1.2 ¿podríamos afirmar

que en esta situación los puntajes de la prueba de habilidad mental pueden usarse

para pronosticar los puntajes del examen de admisión? También, aunque en este

caso mostramos una relación contraria a la que ocurre en la realidad ya que los

sujetos con puntajes altos en el test de habilidad mental aparecen con puntajes

bajos en el examen de admisión y los sujetos con puntajes bajos en el test de

habilidad mental presentan los puntajes altos en el examen de admisión, entonces

podemos definir una relación lineal negativa entre un conjunto de pares valores X

y Y (tal como en la tabla Nº 4.1.2) es decir, los puntajes altos de X están

apareados con los puntajes bajos de Y y los puntajes bajos de X están apareados

con los puntajes de Y.

Tabla Nº 4.1.2

Estudiantes X Prueba de habilidad

mental

Y Examen de Admisión

María 18 18

Olga 15 32

Susana 12 60

Aldo 9 68

Juan 3 82

Tabla Nº 4.1.3

Estudiantes X Prueba de habilidad

mental

Y Examen de Admisión

María 18 18

Olga 15 82

Susana 12 68

Aldo 9 60

Juan 3 32

Examinemos ahora la tabla Nº 4.1.3. En este casi ya no podemos afirmar que los

puntajes de la prueba de habilidad mental sirvan para pronosticar los puntajes del

examen de admisión, ya que unos puntajes bajos del examen de admisión y

algunos puntajes bajos del test de habilidad mental están apareados con otros

puntajes altos del examen de admisión, entonces en este caso, decimos que no

existe una relación lineal entre las variables X y Y.

4.1.3. DIAGRAMA DE DISPERSIÓN

En las situaciones que se presentan en la vida real no tenemos solamente cinco

parejas de valores para ambas variables, sino muchísimas parejas. Otra forma

alternativa de ver si existe o no relación lineal entre dos variables seria hacer una

gráfica de los valores X y Y en un sistema de coordenadas rectangulares, este tipo

de gráfica es conocido con el nombre de diagrama de dispersión, gráfico de

dispersión o nube de puntos. Dibujemos el diagrama que corresponde a la Tabla N

º 4.1.1. Lo haremos haciendo corresponder a cada valor de la variable

independiente X, un valor de la variable dependiente Y, es decir, para la alumna

Susana haremos corresponder du puntaje en la prueba de habilidad mental (12)

con su puntaje de la prueba de admisión (60); al alumno Juan le hacemos

corresponder su puntaje del test de habilidad mental (3) con su puntaje del

examen de admisión (18). Luego ubicaremos los cinco pares de puntajes en el

sistema de ejes rectangulares y obtendremos los gráficos Nº 4.1.1 y Nº 4.1.2

Observemos en el gráfico Nª 4.1.1 que la tabla Nª 4.1.1. Es descrita por el

diagrama de dispersión. Vemos en este gráfico que los cinco puntos dan la

sensación de ascender en línea recta de izquierda a derecha. Esto es

característico en datos en los que existe una relación lineal positiva. Aunque estos

cinco datos no configuren una línea recta en forma perfecta. Se puede trazar una

línea recta que describa que estos puntos en forma bastante aproximada

conforme se ve en el gráfico Nª 4.1.2 y por esto decimos que la relación es lineal.

Si ocurre que todos los puntos de la gráfica de dispersión están incluidos en una

sola línea en forma exacta afirmamos que la relación lineal es perfecta. El grado

en que se separan los puntos de una sola línea recta nos da el grado en que la

relación lineal no es perfecta. Así cuando menos puntos se encuentran en una

sola línea decimos que la relación lineal no es perfecta. Así cuando menos puntos

se encuentran en una sola línea decimos que la relación lineal entre las dos

variables es menos fuerte y cuando más puntos queden incluidos en una línea

recta afirmamos que la relación lineal es más fuerte.

GRÁFICO Nª 4.1.1.

Usando los datos de una tabla Nº 4.1.2 y utilizando la misma forma de razonar

empleada hasta ahora podemos construir el correspondiente gráfico de dispersión,

tal como se muestra en el gráfico Nº 4.1.3.

Podemos observar en el gráfico Nº 4.1.4. que la nube de puntos de la gráfica

pueden delinearse bien por una línea recta, lo que nos indica que hay una relación

lineal entre las dos variables X y Y Vemos también que la línea desciende de

izquierda a derecha (tienen pendiente negativa) por lo que decimos que la relación

lineal entre las dos variables es negativa.

Si tenemos en cuenta la tabla Nº 4.1.3 podemos obtener una figura como se

muestra en la gráfica Nº 4.1.5 Notamos, en esta situación, que resultará inútil

cualquier línea recta que trate describir adecuadamente este diagrama de

dispersión.

Y

80

70

60

50

40

30

Diagrama de Dispersión

GRÁFICO Nº 4.1.4.

Diagrama de Dispersión aproximado por una línea recta

4.1.4 COEFICIENTE DE CORRELACIONE RECTILINEA DE PEARSON

Con ayuda de las gráficas nos podemos formar una idea si la nube de puntos, o

diagrama de dispersión, representa una reacción lineal y si esta relación lineal es

80

70

60

50

40

30

20

10

2 4 6 8 10 12 14 16 18 20 X

positiva o negativa, pero con la sola observación de la gráfica no podemos

cuantificar la fuerza de la relación, lo que si conseguiremos haciendo uso del

coeficiente r de Pearson.

El coeficiente de correlación r de Pearson, toma valores comprendidos entre 1 y +

pasando por 0. El número -1 corresponde a una correlación negativa perfecta (los

puntos del diagrama de dispersión deben encontrarse formando perfectamente

una línea recta). El numero +1 corresponde a una correlación positiva perfecta.

(los puntos del diagrama de dispersión deben encontrarse formando

perfectamente una línea recta). El coeficiente de correlación r=0 se obtiene

cuando no existe ninguna correlación entre las variables. Los valores negativos

mayores que -1 indican una correlación negativa y los valores positivos menores

que 1 indican una correlación positiva.

Referente a la magnitud de r podemos decir que independientemente del signo,

cuando el valor absoluto de r esté más cercana de 1, mayor es la fuerza de la

correlación, es así que -0,20 y +0.20 son iguales en fuerza (ambos son dos

valores débiles) los valores -0.93 y +0.93 también son iguales en fuerza (ambos

son dos valores fuertes).

Cálculo del Coeficiente r de Pearson utilizando una máquina calculadora

cuando los datos no son muy numerosos.

Dadas dos variables X y Y con sus respectivos valores. En la Tabla podemos

calcular el coeficiente de Pearson con una máquina calculadora mediante la

siguiente fórmula.

(∑ ) (∑ )(∑ )

√, (∑ ) (∑ ) -[ (∑ ) (∑ ) ]

Tabla Auxiliar 4.1.4.

(1) x

(2) Y

(3) X^2

(4) Y^2

(5) XY

18 82 324 6724 1476

15 68 225 4624 1020

12 60 144 3600 720

9 32 81 1024 288

3 18 9 324 54

∑X = 57 ∑Y = 260 ∑X2 =783 ∑Y

2 =16296 ∑XY =3558

En las columnas (1) y (2) se han escrito los valores de X y Y. En la columna (3) se

han elevado al cuadrado los valores de X. En la columna (4) se han elevado al

cuadrado los valores de Y. En la columna (5) se ha efectuado el producto de cada

pareja de valores X y Y. Aplicando los datos en la fórmula 4.1.1., se tiene:

( )( ) ( )( )

√, ( ) ( ) -, ( ) ( ) -

√( )( )

√( )( )

√

INTERPRETACIONES DE UN COEFICIENTE DE CORRELACIÓN

¿Qué tan elevado es un coeficiente de correlación dado? Tofo coeficiente de

correlación que no sea cero indica cierto grado de relación entre dos variables.

Pero es necesario examinar más esta materia, porque el grado de intensidad de

relación se puede considerar desde varios puntos de vista. No se puede decir que

un r de 0,50 indique una relación dos veces más fuerte que la indicada por un r de

0, 25. Ni se puede decir tampoco que un aumento en la correlación de r = 0,40 a r

= 0,60 equivalga a un aumento de r = 0,70 a r = 0,90. Es de observar que una

correlación de 0,60 indica una relación tan estrecha como una correlación de +

0,60. La relación difiere solamente en la dirección.

Siempre que éste establecido fuera de toda duda razonable una relación entre dos

variables, el que el coeficiente de correlación sea pequeño puede significar

únicamente que la situación medida está contaminada por algún factor o factores

no controlados. Es fácil concebir una situación experimental en la cual, si se han

mantenido constantes todos los factores que o sean pertinentes, el r podría haber

sido 1 en lugar de 0,20. Por ejemplos: generalmente la correlación entre la

puntuación de aptitud y el aprovechamiento académico es 0,50 puesto que ambos

se miden en una población cuyo aprovechamiento académico también es

influenciable por el esfuerzo, las actitudes, las peculiaridades de calificación de los

profesores, etc. Si se mantuvieran constantes todos os demás factores

determinantes del aprovechamiento y se midieran exactamente la aptitud y las

notas, el r seria 1 en vez de 0,50.

Una conclusión práctica respecto a la correlación es que ésta es siempre relativa a

la situación dentro de la cual se obtiene y su magnitud no representa ningún

hecho natural absoluto. El coeficiente de correlación es siempre algo puramente

relativo a las circunstancias en que se ha obtenido y se ha de interpretar a la luz

de esas circunstancias y sólo muy rara vez en algún sentido absoluto.

Además podemos agregar que la interpretación de un coeficiente de correlación

como de medida del grado de relación lineal entre dos variables es una

interpretación matemática pura y está completamente desprovista de

implicaciones de causa y efecto. El hecho de que dos variables tiendan a

aumentar o disminuir al mismo tiempo no implica que obligadamente una tenga

algún efecto directo o indirecto sobre la otra.

A continuación calcularemos con la fórmula antes indicada el coeficiente de

PEARSON de la relación presentada en la tabla.

Cuadro Auxiliar 4.1.5.

(1) x

(2) Y

(3) X^2

(4) Y^2

(5) XY

18 18 324 324 324

15 32 225 1024 480

12 60 144 3600 720

9 68 81 4624 612

3 82 9 6724 246

∑X = 57 ∑Y = 260 ∑X2 =783 ∑Y

2 =16296 ∑XY =2382

( )( ) ( )( )

√, ( ) ( ) -, ( ) ( ) -

√( )( )

√( )( )

√

Vemos que la correlación es fuerte y negativa.

Ahora calculemos con la misma fórmula de Pearson Nº 4.1.1. El Coeficiente de

Correlación lineal con los datos de la tabla nº 4.1.3.

Cuadro Auxiliar Nº 4.1.6

(1) x

(2) Y

(3) X^2

(4) Y^2

(5) XY

18 18 324 324 324

15 82 225 6724 1230

12 68 144 4624 816

9 60 81 3600 540

3 32 9 1024 96

∑X=57 ∑Y=260 ∑X2=783 ∑Y2=16296 ∑XY=3006

( )( ) ( )( )

√, ( ) ( ) -, ( ) ( ) -

√( )( )

√( )( )

√

La correlación es muy débil y positiva.

CORRELACIÓN ENTRE DOS CONJUNTOS DE DATOS AGRUPADOS EN

CLASES

El presente tema nos conduce a calcular el coeficiente de correlación r, que nos

proporciona información de la fuerza de la relación que existe entre dos

conjuntos.

Ejemplo: calcular el grado de correlación entre las puntuaciones obtenidas en

inventario de hábitos de estudio y los puntajes obtenidos de un examen

matemático, aplicados a un total de 134 alumnos de un colegio de la localidad.

^-^X Hábitos de Y ^\esiudio

Matemáticas^

20 - 30 30 - 40 40 - 50 50 - 60 Total fy

70 -* 80 3 2 2 7

60 -> 70 1 0 4 5 10

50 ~» 60 2 6 16 3 27

40 50 4 14 19 10 47

30 >-'■» 40 7 15 6 0 28

20 M 30 8 2 0 1 t 1

10 20 1 1 2 4

Total f. 23 40 48 23 134

Podemos notar que el problema no es tan simple, como el casa anterior, dado,

que ahora los datos se han clasificado en una tabla de doble entrada N" 4.1.7.

Este): cuadro muestra, en la primera columna del lado izquierdo los intervalos de

clase 0» la variable Y, los que cubren todos los posibles datos acerca de las

puntuaciones! alcanzadas por los estudiantes en la prueba de Matemática.

Nótese que los in te rva los los crecen de abajo hacia arriba. En la fila superior

se presentan les intervalos <%

Dentro del cuadro en los casilleros interiores o celdas de la tabla, se encuentran

las frecuencias de celda que correspondan a puntajes que pertenecen tanto a un

intervalo de la variable Y como un intervalo de la variable X.

La fórmula que utilizaremos es la siguiente

Para obtener los datos que deben aplicarse en la formula vamos a construir el

cuadro auxiliar al mismo tiempo que se explica el significado de los símbolos de

esa formula

Lo primero que hacemos es reemplazar los intervalos horizontales y verticales por

sus respectivas marcas de clase a continuación adicionalmente al cuadro N4.1.7

cinco columnas por el lado derecho, cuyos encabezamientos son : f para la

primera.

1) Para determinar las frecuencias marginales que se deben colocar en la

columna f sumamos las frecuencias de las celdas que están en la misma

fila de la marca de clase 75, obtenemos 3+2+2=7, número que se escribe

en el primer casillero o celda de la columna f. en la fila de la marca de

clase 65 sumamos 1+4+5=10 número que se escribe debajo del 7.

2) Ahora vamos a determinar las frecuencias marginales de la variable x: en

la columna encabezada con la marca de clase 25 sumemos verticalmente

las frecuencias 1+2+4+7+8+1=23

3) Centremos nuestra atención en la columna encabezada u, este signo

significa desviación estándar y procedemos a la misma forma en las tablas.

Recuerden que las desviaciones unitarias positivas: +1+2 y negativas : -1-2

y -3 corresponden a los intervalos menores.

4) Luego vamos a determinar las desviaciones unitarias horizontales de la

variable X. el origen de trabajo es la marca de clase 45 que se halla en la

fila superior del cuadro , por esa razón , escribimos cero debajo de la

frecuencia marginal 48.

5) A continuación vamos a determinar los valores que deben colocarse en la

columna encabezada. Para obtener los valores de la cuarta columna

encabezada debemos tomar en cuenta que por lo tanto basta multiplicar

cada valor de la segunda columna por su correspondiente valor de la

tercera columna así se obtiene el respectivo valor de la cuarta columna. En

efecto:

(3)(21)=63 (20)(20)=40(+1)(27)=27; 00*00=0; (-1)(-28)=28; (-2)(-22)=44 y (-

3)(-12)=36

La suma 63+40+27+28+44+36=238

Ahora nos fijamos horizontalmente en la tercera fila. Tenemos que (f)(u)=fu

por consiguiente basta multiplicar verticalmente un valor de la primera fila por

su correspondiente valor de la primera fila por su correspondiente valor de la

segunda fila para obtener el respectivo valor de la tercera fila.

(23)(-2)=-46; (40)(-1)=-40; (48)(0)=0 y (23)(+1)=23

Sumando horizontalmente:

(-46)+ (-40)+ (23)=-86+23=-63

Vamos por la cuarta fila vemos que u (fu)= Fu2 luego basta multiplicar cada

elemento de la segunda fila por su correspondiente elemento de la tercera fila

por su correspondiente elemento de la tercera fila para obtener el respectivo

elemento de la cuarta fila así:

(-2)(-46)=9; (-1)(-40)=40; 0*0=0y (+1)(23)=23

Para obtener valores de la quinta columna observamos que hay tres factores

el 1 es la frecuencia f de la celda o casillero que se está considerando el

segundo factor es la desviación unitaria u, el tercer factor es la desviación

unitaria, por lo tanto el procedimiento será el siguiente: tomemos el número 3

que es la frecuencia de la celda determinada por el cruce de los intervalos que

tienen la marcha de la clase 75 horizontalmente y 35 verticalmente.

Para ubicar el tercer factor corremos la vista del número 3 hacia su derecha

hasta llegar a la columna de las desviaciones unitarias u y ubicamos el

numero +3 formemos el producto de estos tres números: (3)(--1)(+3)=-9

encerrado de un semicírculo lo escribimos en la celda elegida

En la misma fila tomamos la celda siguiente: (2) (0)(+)

Continuando hacia la derecha (2) (+1)(+3)=6

X hábitos estudio Y matemática 25 35 45 55 Fy Uy FyUy FyU^2y

suma de los # en semicírculos

75 2 3 2 2 7 3 21 63 -3

65 1 0 4 5 10 2 20 40 6

55 2 6 16 3 27 1 27 27 -7

45 4 14 19 10 47 0 0 0 0

35 7 15 6 0 28 -1 -28 23 29

25 8 2 0 1 11 -2 -22 44 34

15 1 0 1 2 4 -3 -12 36 0

∑FxUx = 6

∑FxUx^2= 238

∑FxyUxUy= 59

Fx 23 40 48 23 134 Ux -2 -1 0 1 FxUx -46 -40 0 23 ∑FxUx=-63 FxUx^2 92 40 0 23 ∑FxUx^2=155

La fórmula del paso (9) lleva el signo ∑para indicar que se deben sumar

horizontalmente los números que están encerrados en los semicírculos de esa

primera fila elegida así: -9+0+6. Este número se escribe en la quita columna.

Trabajemos con la segunda fila: (1) (-2)(+2)= -4 se encierra en un semicírculo.

(0)(-1)(+2)= 0

(4)(0)(+2)= 0

(5)(+1)(+2)= 10

Sumando 0 + 0 + 10 = 10

Ahora con la tercera fila:

(2)(-2)(+1)= -4

(6)(-1)(+1)= -6

(16)(0)(+1)= 0

(0)(+1)(+1)= 3

Sumando: (-4) + (-6) + 0 + 3 = -7

Cuarta fila

(-4) + (-2) + 0 = 0 todos los productos vales cero, luego la suma = 0

Quinta fila

(7)(-2)(-1)= 14

(15)(-1)(-1)= 15

(6)(0)(-1)= 0

(0)(+1)(-1)= 0

La suma es: 14+15= 29

(8)(-2)(-2)= 32

(2)(-1)(-2)= 4

(0)(0)(-2)= 0

(1)(+1)(-2)= -2

La suma es: 32 + 4 -2 = 34

Séptima fila:

(1)(-2)(-3)= 6

(1)(0)(-3)= 0

(2)(1)(-3)= -6

Sumando: 6 + 0 – 6 = 0

Sumando los valores de la columna quinta.

Reuniendo los resultados anteriores, se tienen los datos para aplicar en la formula

n= 134

∑ = 59

∑ = -63

∑ = 6

∑ = 155

∑ = 238

r= ( )( ) ( )( )

√*( )( ) ( ) +*( )( ) ( )

r=

√( )( )

r= 0,358

Ejercicio Resuelto N° 2 de Cálculo de Coeficiente de Correlación Entre

Conjuntos de Datos Agrupados

Calcular el coeficiente de correlación lineal de las puntuaciones en matemáticas y

físicas de 100 estudiantes de la Facultad de Ciencias de la Universidad MN

X Puntuación matemáticas Y Puntuación fisica 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100 TOTAL

90 - 100 0 0 0 2 5 5 12

80 - 90 0 0 1 3 6 5 15

70 - 80 0 1 2 11 9 2 25

60 - 70 2 3 10 3 1 0 19

50 - 60 4 7 6 1 0 0 18

40 - 50 4 4 4 0 0 0 11

TOTAL 10 15 22 20 21 12 100

PUNTACIÓN EN MATEMÁTICA

SUMA DE LOS NÚMEROS

ENCERRADOS EN SEMICÍRCULOS EN

CADA FILA

45 55 65 75 85 95 Fy Uy Fy Uy Fy U2y

PU

NT

UA

CIO

N E

NF

ISIS

CA

Y

95 2 5 5 12 2 24 48 54

85 1 3 6 5 15 1 15 15 30

75 1 2 11 9 2 25 0 0 0 0

65 2 3 10 3 1 19 -1 -19 19 2

55 4 7 6 1 18 -2 -36 72 28

45 4 4 3 11 -3 -33 99 36

fx 10 15 22 20 21 12 100 -3 -49 253 150

Ux -2 -1 0 1 2 3 3 Σfy Uy Σfy U2y Σ fxy Ux Uy

FxUx -20 -15 0 20 42 36 63 Σfx Ux

Fx U2

x 40 15 0 20 84 10

8

267 Σfx U2x

En este problema tenemos que calcular el confidente de correlación lineal r para

dos conjuntos de datos constituidos por los calificativos en una escala de 0 a 100,

en matemáticas y en física para 100 estudiantes de la facultad de Ciencias de

cierta universidad

Los datos se muestran en el cuadro N° 4.1.9 Notemos que a lo largo de la línea

horizontal superior se encuentran los intervalos que contienen los calificativos de

matemáticas desde 40 hasta 100.

Igualmente en la primera columna vertical izquierda, se encuentran los calificativos

para física de los mismos estudiantes, desde el calificativo 40 hasta 100. Notese

que en la columna de los calificativos de física los datos crecen de abajo hacia

arriba y para la fila horizontal superior vemos que los calificativos en matemáticas

crecen izquierda a derecha.

A continuación procederemos a calcular el confidente de correlación r para estos

datos aplicando el mismo método que utilizaremos en el problema anterior.

1) Traslademos los datos del cuadro N° 4.1.9. Llamaremos xy a cualquiera de

las frecuencias de los casilleros interiores del cuadro N° 4.1.9. En el cuadro

N° 4.1.10. podemos observar que se han agregado cinco columnas por el

lado derecho y cuatro filas por la parte interior

Observemos en el cuadro N° 4.1.10 que los intervalos para la puntuación en

matemáticas y para la puntación en física se han remplazado por las marcas de

clase correspondientes. Así en la fila horizontal superior se han remplazado el

primer intervalo 40 50 por su marca de clase45, el segundo intervalo 50 60

por su marca de clase 55 y de esta manera se han remplazado los demás

intervalos por sus marcas de clases en el cuadro N° 4.1.10.

De igual forma para la columna primera de la izquierda vemos que los intervalos

se han remplazado por sus respectivas marcas de clase así para la puntuación en

física el primer intervalo superior 90 100 se han remplazado por su marca de

clase 95, el segundo intervalo superior 80 90 se ha remplazado por su marca

de clase 85 y así sucesivamente hasta llegar al intervalo inferior 40 50 que se

ha remplazado por su marca de clase 45.

Ahora vamos a realizar los pasos siguientes

1) Para las frecuencia marginales fy sumemos todos los valores fxy de la

primera fila que tiene la marca de clase 95. De esta forma tenemos: 2+5+5=

12 Para la segunda fila que corresponde a la marca de clase 85

obtenemos: 1+3+6+5= 15 que escribimos en el segundo casillero de fy.

2) Dediquemos nuestra atención a las frecuencias marginales fx. el primer

resultado de fx lo obtenemos sumando las frecuencias fxy para la colunia que

tiene la marca de clase 45, de esta forma tenemos: 2+4= 10 que se escribe

en el primer casillero de fx para el segundo casillero tenemos el número 15

que se obtiene verticalmente de las frecuencias fxy de la columna que tiene

de marca de clase 55. Continuando con las sumas de las f de las demás

columnas llenamos las frecuencias marginales fx.

3) Atendamos la columna Uy la columna Uy tiene en total 6 casilleros

arbitrariamente escogemos uno de estos casilleros como origen de trabajo

y le asignamos el numero 0. Aquí hemos escogido el tercer casillero

contando de arriba hacia abajo. Observamos ahora la primera columna de

la izquierda en donde están las marcas de clase de los puntajes de física.

Aquí observamos que las marcas de clase crecen de abajo hacia arriba

entonces las desviaciones unitarias en la columna Uy crecerán de abajo

hacia arriba entonces del 0 hacia abajo, las desviaciones unitarias son

números negativos que van decreciendo hacia abajo.

Desde el 0 hacia arriba las desviaciones serán positivas y crecientes.

De manera que podemos observar que la columna Uy está conformada por

los siguientes números que crecen del 0 hacia arriba: 1,2 y desde el 0 hacia

abajo decrece: -1,-2,-3.

4) Veamos la fila Ux

Notamos que el fila horizontal superior las marcas de clase crecen de

izquierda a derecha de igual forma las desviaciones unitarias crecerán de

izquierda a derecha. Elegiremos como origen de trabajo arbitrariamente uno

del casillero Ux el tercero contando de izquierda a derecha, y vamos

asignando números positivos crecientes hacia la derecha del 0, así

tenemos 1, 2,3 ya hacia la izquierda, a partir del cero, tendremos:-1y-2.

5) Expliquemos la columna fy Uy. Multipliquemos cada valor de fy por su

correspondiente valor de Uy y se obtiene un valor Fy Uy. Por ejemplo el

número 24 se obtiene multiplicando la frecuencia marginal fy = 12 por su

correspondiente desviación unitaria Uy = 2esto es, 12*2= 24. Para el

segundo casillero multiplicamos 15*1=15; para el tercero 25*0=, así hasta

terminar con 11*(-3)= -33.

6) Observemos la columna Fy U2y. L primera celda de esta columna tiene el

número 48 que se obtiene de multiplicando el valor Uy =2 de la segunda

columna por su correspondiente valor Fy Uy = 24 de la tercera columna, es

decir, 2*24= 48. Para el segundo casillero de la columna fy U2y , tenemos 15

que es igual a 1 por 15. De esta forma continuamos llenando los demás

valores de la columna Fy U2y.

7) Veamos ahora la fila fx ux. El número -20 del primer casillero de esta fila se

obtiene multiplicando la frecuencia marginal fx = 10 por su correspondiente

desviación unitaria Ux = -2 es decir: 10 (-2)= -20.

Para el segundo casillero de FX UX, multiplicamos (-1)*(-15)= 15 y así

sucesivamente 12*3= 36.

8) Veamos Fx U2

x. El primer casillero de esta fila es 40 y es el resultado de

multiplicar -2 del primer casillero de la fila Fx Ux por menos 20 de su

correspondiente primer casillero de la fila Ux esto es, (-2)* (-20)= 40. Para

el segundo casillero de fx U2

x multiplicamos -1 del segundo casillero de Ux

por -15 de su correspondiente segundo casillero de FX UX, luego obtenemos

(-1) *(-15)=15 .Así continuamos multiplicando los valores de los casilleros

Ux por sus correspondientes valores de la fila Fx Ux hasta llegar a (3) (36)=

108.

9) Interesa ahora obtener los números encerrados en semicírculo, por ejemplo

ahora, el número 4, que corresponde a la marca de clase 75 para la

puntuación en matemáticas y a la marca de clase 95 de la puntuación en

física.

10) Para saber cómo se obtiene este número 4, corramos nuestra vista hacia

la derecha dirigiéndonos hacia la columna UY y obtenemos el número 2.

Del número 4, encerrado en semicírculo, bajemos la vista con dirección a la

fila Ux y obtenemos 1. La frecuencia del casillero donde está el 4, encerrado

en semicírculo, es fxy = 2. Multiplicando estos 3 factores tendremos fxy Ux Uy

= (2) (1) (2) = 4.

Podemos anunciar la siguiente regla:

Para obtener los valores encerrados en semicírculos en los casilleros interiores del

cuadro N°4..1.10 multiplicamos el valor de la frecuencia fxy del casillero para el

cual estamos haciendo el cálculo, por los valores de las desviaciones unitarias Uy y

Ux , obtenidas corriendo la vista hacia la derecha hasta columna Uy y también

hacia abajo hasta legar a la fila Ux.

Así por ejemplo, para el casillero que corresponde a las marcas de clase 75 en

matemática y 85 en física, tenemos la frecuencia de la celda Fxy = 3, los otros dos

factores son: Uy =1 y Ux = 1.

Luego (3) x (1) x (1) = 3 que es el valor encerrado en semicírculo.

Para el casillero correspondiente a la marca de clase 55 en matemáticas marca de

clase 45 en física, tenemos:

fxy = 4, Uy = -3, Ux = -1

fxy Ux Uy = (4) (-3) (-1) = 12 que es el valor encerrado en semicírculo. Así podemos

proceder para obtener todos los demás valores encerrados en semicírculos.

Sumando las frecuencias marginales de la columna fy, se tiene ∑ fy =100.

Sumando los valores de la tercera columna se obtiene ∑fy Uy = - 49. Sumando los

valores de la cuarta columna, tenemos ∑fy U^2y = 253. La suma de los valores de

la quinta columna:

∑fxy Ux Uy = 150

Para todas las filas, en el último casillero de la derecha se tiene la suma de los

valores de la fila. Así, por ejemplo, ∑fx = 100; ∑fy = 100.

Para la tercera fila: ∑fx Ux = 63

Para la cuarta fila: ∑fx U^2x = 267

Estos totales de filas y columnas reemplazaremos en la fórmula.

( )( ) ( )( )

√, ( ) ( ) -, ( ) ( ) -

√( )( )

√( )( )

Vemos que el coeficiente de correlación en este caso es 0.79.

Ejercicio Propuesto Nº 1 del Cálculo del Coeficiente de Correlación entre dos

Conjuntos Agrupados de Datos.

Supongamos que tenemos 30 sujetos a los que hemos aplicado una prueba de

conocimientos de Psicología General (variable x) y un test de inteligencia (variable

y).

Aplicando los datos tomados del Cuadro Auxiliar en la fórmula tenemos:

Resultado:

( )( ) ( )( )

√, ( ) ( ) -, ( ) ( ) -

√( )( )

√( )( )

Ejemplo propuesto N°2 del cálculo del coeficiente de correlación entre dos

conjunto de datos agrupados. Supongamos que se tienen 50 vendedores de cierta

compañía. Estos vendedores durante un año 1985 han realizado ventas tal como

lo muestra el cuadro N°4.1.13, el que también muestra el número de años de

experiencia que tiene como vendedores.

Para dicho cuándo, se pide calcular el coeficiente de correlación lineal r.

0 2

2 4

4 6

6 8

8 10

TOTAL

15 18 1 1

12 15 2 3 4 9

9 12 7 3 2 12

6 9 6 9 4 19

3 6 5 2 7

1 3 2 2

TOTAL 2 11 18 12 7 50

Tomando los datos obtenidos n el cuadro Auxiliar N°4.1.14 apliquemos en la

formula N° 4.1.12, se tiene.

( ) ( )( )

√, ( ) ( ) -, ( ) ( ) -

√( )( )

√( )( )

Años de

experienc

ia X

Monto

de

Progresiones lineales simples

4.2.1. Regresión lineal simple

Al comenzar a estudiar las técnicas de correlación afirmamos que

estudiaríamos dos variables y no solamente una. Llamamos a esa ocasión X a

una de las variables Y a la otra. En el tema que nos ocuparemos ahora,

estudiaremos la forma de predecir v valores de Y conociendo primero los

valores de X. Es así que viendo la tabla N 4.2.1, similar a la que utilizamos

cuando estudiamos correlación, conociendo el puntaje en la prueba de

habilidad mental (variable X) para un alumno determinado, podemos anticipar

el puntaje del examen de admisión (variable Y) del mismo alumno.

Consideraremos la relación lineal expresada por el cuadro N4.2.1 si dibujamos

esa relación, obtenemos el grafico N4.2.1. Como podemos observar todos los

puntos se alinean exactamente. En una sola línea recta, la que recibe el

nombre de línea de regresión. Teniendo en cuenta esta línea, podemos

predecir cualquiera d los valores de Y conociendo el valor de X; para X=25,

según la recta, correspondiente de Y=35, para X=20 corresponde Y=30. Etc.

En este caso se trata de una correlación positiva perfecta cuyo coeficiente de

correlación es +1.

Prueba de habilidad

mental X

Examen de Admisión

Y

SUSANA 5 15

IVAN 10 20

LOURDES 15 25

ALDO 20 30

JUAN 25 35

MARIA 30 40

CESAR 35 45

OLGA 40 50

Recordemos ahora el grafico N 4.1.2 que dibujamos cuando estudiamos

correlación, en este grafico observamos el diagrama de dispersión aproximado

por una línea recta, la recta que mejor se ajuste a los puntos del diagrama de

dispersión, es decir, en la mejor medida procure dejar igual número de puntos

del diagrama de dispersión por encima de ella que igual número de puntos

debajo, se llama línea de regresión.

ECUACION DE LA REGRESION RECTILINEA

La ecuación que describe la línea de regresión es:

(

) (

)

GRÁFICO

Serie 1

f(x)=1*x+10; R²=1

-5 5 10 15 20 25 30 35 40 45

-5

5

10

15

20

25

30

35

40

45

x

y

= media de la variable X en la muestra.

X = un valor de la variable X

r = coeficiente de Pearson, de la correlación lineal entre las variables X y Y.

SY = desviación estándar de Y en la muestra.

SX = desviación estándar de X en la muestra.

r = 1,00

Yr = Valor Y resultado del cálculo de la fórmula.

Veamos cómo podemos predecir los valore de Y a partir de los valores de X.

como el gráfico de este cuadro es una línea recta ascendente sabemos que su

coeficiente de correlación de Pearson r = +1. Además tenemos los siguientes

resultados:

X = 22,5 SX = 11,46 Y= 32,5 SY = 11,46

Estos resultados se pueden calcular a partir de los datos del cuadro.

Apliquemos estos datos a la fórmula, obtenemos la siguiente expresión:

( ).

/ ( ).

/ ( )

Simplificando términos obtenemos:

( )

Escojamos cualquier valor de X, por ejemplo para María x = 30, reemplazando

este valor en (b).

( )

Vemos en le cuadro el valor que corresponde a María efectivamente es 40, es

decir podemos usar la ecuación para predecir los valores de Y conociendo los

valores de X.

Esta fórmula de regresión se puede aplicar par dos variables X y Y, entre las

cuales no es obligatorio que exista una correlación lineal perfecta, es decir, no

es obligatorio que el r para la correlación entre X y Y sea siempre igual a 1.

Este valor de r para otras aplicaciones de la regresión, puede tomar cualquier

valor distinto de 1.

Ejercicios Resueltos de Regresión Lineal Simple

Al aplicar un test de inteligencia a una muestra representativa constituida por

800 alumnos, se obtuvo la puntuación media de 30,4 puntos, con la desviación

estándar de 12,6 puntos.

La edad media de la muestra fue de 14,5 años, con la desviación estándar de

3,2 años.

El coeficiente de correlación lineal de Pearson entre la variable Y, edad de los

sujetos estudiados y la variable X, rendimiento mental de los mismos sujetos,

fue r = 0,89.

Con estos datos se pide determinar la ecuación de regresión rectilínea de edad

en base del puntaje del rendimiento mental.

¿Qué edad corresponde a los sujetos que alcanzan puntuaciones de:

X1 = 18 Puntos X4 = 50 Puntos



Datos:

= 14,5 SY = 3,2 r = 0, 89

= 30,4 SX = 12,6

Aplicando estos datos en la fórmula se tiene:

( ).

/ ( ).

/

Es la ecuación de regresión buscada.

Respuesta de la 1ra. Pregunta

X1 = 18

YR = 7,63 + 0,226 (18) = 7,63 + 4,07

YR = 11,7 años

Segunda pregunta

X2 = 25

YR = 7,63 + 0,226 (25) = 7,63 + 5,65

YR = 13,28 años

Tercera pregunta

X3 = 45

YR = 7,63 + 0,226 (45) = 7,63 + 10,17

YR = 17,8 años

Cuarta pregunta

X4 = 50

YR = 7,63 + 0,226 (50) = 7,63 + 11,3

YR = 18,93 años

Quinta pregunta

X5 = 60

YR = 7,63 + 0,226 (60) = 7,63 + 13,56

YR = 21,19 años

Sexta pregunta

X6 = 80

YR = 7,63 + 0,226 (80) = 7,63 + 18,08

YR = 25,71 años

Este cuadro contiene la primera columna los nombres de los alumnos, en la

segunda están los rangos de esos alumnos en la variable, en la tercera se

hallan los rangos de los alumnos en la variable Y. En la cuarta columna están

las diferencias de los rangos correspondientes de las variables X y Y. en la

quinta columna se colocan las cuadros de las diferencias, ya calculadas.

CUADRO AUXILIAR Nº 4.3.4

ALUMNOS RENGO DE

X

RANGO DE

Y

D=

DIFERENCIA

Rodríguez 3 3 0 0

Fernández 4 5 -1 1

Córdova 2 1 1 1

Flores 1 2 -1 1

Lema 5 4 1 1

APLICANDO LOS DATOS EN LA FORMULA Nº 4.3.1, SE TIENE

[ ( )

( ) ]

P= 0.08

Es una correlación positiva. Su valor es muy alto y poco común puesto que la

práctica enseña que en la correlación de la inteligencia con el rendimiento

escolar en las asignaturas, casi siempre se alcanza un valor próximo a 0.5.

EJEMPLO 2

Supongamos el siguiente cuadro nº 4.3.5. Queremos calcular el coeficiente de

correlación por rangos.

CUADRO Nº 4.3.5

EXAMINADOS PRUEBA DE

HABILIDAD MENTAL

X

APTITUD ACADÉMICA

Y

Susana 49 55

Iván 46 50

Lourdes 45 53

Aldo 42 35

Juan 39 48

maría 37 46

cesar 20 29

Olga 15 32

Observamos que los examinados están ordenados con respecto a la prueba de

habilidad mental de mayor a menor; podemos afirmar que la posición o rango

que se podría asignar a Susana es el primero, a Iván le correspondería el

segundo, para Lourdes el tercero tal como se muestra en el cuadro Nº4.3.6.

De igual forma podríamos ordenar la posición o rango de los postulantes según

los resultados de la prueba de aptitud académica Y del examen de admisión, lo

que se muestra en el cuadro Nº4.3.6 es así como Susana también ocupa el

número de orden o rango primero y Lourdes ocupa el segundo lugar o rango

dos en esa prueba, así podemos continuar ordenando los alumnos según su

rango en la pruebe de aptitud académica y terminaremos con cesar que ocupa

el rango 8 en tal prueba.

CORRELACIÓN POR RANGOS

Es el orden que posee o se asignan a cada miembro de un conjunto de de

elementos de acuerdo a una escala ordinal dada. El rango ubica el elemento en

un punto de esa escala.

Por ejemplo: podemos establecer un ordenamiento de los alumnos de acuerdo

a los puntajes alcanzados en un examen. Así tenemos en el cuadro Nº 4.3.1

que sigue:

CUADRO Nº 4.3.1

ALUMNOS García león Pérez Ruíz Lazo Lora

PUNTAJES 40 65 52 70 76 56

Ordenándolos de acuerdo a la magnitud del puntaje, establecemos los rangos

siguientes en el cuadro Nº 4.3.1.

CUADRO Nº 4.3.2

ALUMNOS García león Pérez Ruíz Lazo Lora

RANGOS 6 3 5 2 1 4

4.3.2 COEFICIENTE DE CORRELACIÓN POR RANGOS

La correlación por rangos se refiere a la correspondencia en el ordenamiento

de los elementos de dos conjuntos dados. La fuerza de la correlación se mide

por medio del coeficiente por rangos de spearman, cuya fórmula es:

* ∑

( )+

En dónde.

P= letra griega rho, designa el coeficiente de correlación por rangos.

D= diferencias de rangos correspondientes entre si pertenecientes a dos

variables X y Y. Por ejemplo d=

n= número de pares correspondientes.

EJEMPLOS Nº 1

En la primera columna de la izquierda del cuadro Nº 4.3.3 se presenta un grupo

de 5 estudiantes; en la segunda columna están sus niveles mentales que se

consideran como categorías de la variable X, en la tercera columna se indican

los resultados de una prueba de matemáticas aplicadas al grupo, cuyas

puntuaciones son valores de la variable Y.

CUADRO Nº 4.3.3

ALUMNOS NIVEL MENTAL

X

MATEMÁTICAS

Y

Rodríguez medio 35

Fernández interior al promedio 17

Córdova superior al promedio 48

flores muy superior al

promedio

42

lema muy inferior al promedio 20

Calcular el coeficiente de correlación por rangos.

ESTUDIANTES CLASIFICACION

DE LOS RANGOS

CLASIFICACION DE

LOS RANGOS

D= DIF D2

RANGO X RANGO Y

SUSANA 1 1 0 0

ESTEBAN 2 3 -1 1

LOURDES 3 2 1 1

ALDO 4 6 -2 4

JUAN 5 4 1 1

MARIA 6 5 1 1

CESAR 7 8 -1 1

OLGA 8 7 1 1

∑D2 = 10

En la descripción de este cuadro la columna X corresponde a los rangos en las

pruebas de habilidad mental, la columna Y corresponde a los rangos de las

pruebas de los estudiantes de actitud académica. La columna D corresponde a

la diferencia del rango de un elemento de la columna X menos el rango de su

correspondiente elemento en la columna Y. en la columna D2 se halla el

cuadrado de la diferencia anotada en la columna D.

Ahora para medir la correlación entre los resultados de la prueba de habilidad

mental y del examen de admisión, tomamos los datos del cuadro anterior en el

que los datos están transformados en rangos.

Conforme ya mencionamos en el ejemplo 1 la fuerza de la correlación en este

tipo de problemas, se determina por el coeficiente p (rho) de correlación de

rangos de spearman. Aplicamos la formula N° 4,3,1 en donde

N= 8 pares

∑D2 = 10, este número es el resultado de la suma de los números D elevados

al cuadrado que figuran la columna D2.

Vemos que existe una correlación positiva fuerte entre las puntuaciones de la

prueba de la habilidad mental y los puntajes de la actitud académica del

examen de admisión.

Caso de rangos empatados o repetidos

Examinemos el caso N° 4.3.7 y supongamos que en el examen de admisión de

Susana y Esteban obtuvieron el mismo puntaje 55 y por lo tanto a cualquiera

de los dos le corresponde los rangos primero o segundo para romper esta

indeterminación, convenimos en asignar a cada uno de ellos el promedio de

ambos

Rangos, o sea

= 1.5 entonces tanto Susana como esteban tendrán el

rango

Tratemos ahora los rangos del VI Ciclo vemos que los profesores L Y P están

empleados o igualados en puntaje por lo que a cualquiera de los dos le

corresponde el rango 5 o el rango 6.el rango que le asignemos serán el

resultado de promedio 5 y 6 que son los dos rangos empatados, luego (5+6) / 2

=5.5 será el número que le asignamos como rango.

Los profesores Fy Z tienen en el VI ciclo los rangos 3 y 4 a cualquiera de estos

dos les corresponde el tercer o cuarto lugar. El número que les asignaremos

será (3+4) /2 = 3.5.

Luego elaboramos una columna para los nuevos rangos Y en donde a los

profesores L y P les asignaremos el rango 5.5 y a los profesores F Y Z les

asignaremos el rango 3 Y 5. los profesores J Y K seguirán con los rangos 1 y 2

respectivamente.

En La Columna D se colocan las diferencias X – Y

Nos ocuparemos ahora de la columna D2. En esta columna se encuentran

valores de la columna D elevados al cuadrado, luego sumamos los valores de

la columna D2 y obtenemos ∑ = 17.

Ahora aplicaremos la formula número 4.3.1.

Aquí ∑ = 17.

N= 6

P= 1- = 0.5

Luego la correlación entre los puntajes asignados a los 6 pro0fesores por el V

ciclo y los puntajes asignados por el VI ciclo es positiva, pero su magnitud no

es ni muy fuerte ni muy débil.

2º EJERCICIO

Cinco niños se someten a una pruebe de habilidad mental y los resultados de

estas se ordenan por rangos en la columna X. también se muestran en la

columna Y los rangos de estos mismos 5 niños respecto al tiempo que gastan

al mirar la tv.? (Ver cuadro Nº 4.3.1)

¿Existe correlación entre el rendimiento mental de los niños y el tiempo que

gastan mirando tv.?

6 (17) 6 (36 -1)

Calculando los nuevos rangos para la columna Y teniendo en cuenta rangos

igualados obtenemos:

ALUMNOS x Y

A 1 4 o 5

B 2 4 o 5

C 3 2 o 3

D 4 1

E 5 2 o 3

¿Existe correlación entre el rendimiento mental de los niños y el tiempo que

gastan mirando tv.?

Calculando los nuevos rangos para la columna Y. teniendo en cuenta los

rangos iguales obtenemos:

X Y D X - Y

D2

A 1 4.5 -3.5 12.25

B 2 4.5 -2.5 6.25

C 3 2.5 0.5 0.25

D 4 1 3 9

E 5 2.5 2.5 6.25

2 = 34.00

Para Obtener Los Rangos Correspondientes A Los Niños A Y B Hemos

Sumado Los Lugares Que Podrían Ocupar Cualquiera De Los Dos Y Que Son

5 Y 4 Y Luego Esta Suma La Dividimos Entre El Numero De Rango Igualados

Que Son Dos, Esto Es: (4+5)/ 2= 4.5 Luego Rango Que Les Corresponda A A

Y B Es 4.5

DE IGUAL FORMA PROCEDEMOS PARA LOS RANGO C Y E obteniendo

para ellos como nuevo rango 2.5.

Ahora añadiremos una nueva columna D, en esta columna escribiremos

diferencia entre uno de los rangos de x menos el correspondiente rango de Y.

Elevamos al cuadrado cada valor de y y escribimos cada resultado en la

columna del cuadrado. Luego sumamos los valores de la columna de D2 y

obtenemos 2 =34.00

( )

( )

P= 1 – 1.7=+0.7

Luego obtenemos una correlación negativa cuya magnitud es 0.7 que es un

valor fuerte para este tipo de situación.

EJERCICIO PROPUESTO DE CÁLCULO DE COEFICIENTE DE SPEARMAN

La tabla muestra siete estudiantes que ordenados alfabéticamente obtuvieron

su número de orden según sus calificaciones en teoría y práctica académica en

un curso de lenguaje. Calcular el coeficiente de correlación de SPEARMAN.

ALUMNOS PRACTICA X TEORIA Y

A 7 6

B 4 7

C 6 5

D 3 2

E 5 1

F 2 4

G 1 3

2º EJERCICIO

El cuadro muestra las correspondientes alturas en centímetros de grupo de

padres y de sus hijos primogénitos.

1) calcular el coeficiente de correlación de espermas

2) calcular también el coeficiente de Pearson

3) son parecidos?

ALTURA PADRE X ALTURA HIJOS Y

172 178

164 154

180 180

190 184

164 166

164 166

165 166

180 175

RESPUESTA 1 p= 0.89

3º EJERCICIO

En la tabla los cinco siguientes individuos se han colocado por rangos de 1 a 5

sobre X e Y. calcular el coeficiente de correlación.

X Y

A 2 3

B 1 2

C 3 1

D 5 5

E 4 4

RESPUESTA 1 p= 0.7

EJERCICIO

El gerente del personal una empresa agroindustrial estudia la relación entre la

variable dependiente Y y la variable independiente X de su personal obrero.

Recoge una muestra aleatoria de 10 trabajadores y se obtuvieron los datos en

dólares por semana.

a) Determinar el diagrama de dispersión

b) De su comentario sobre el valor de la pendiente

La relación es positiva e imperfecta porque al pasar la recta no cruza por

todos los puntos, sin embargo el valor de la pendiente se aproxima a

uno.

c) Estime el gasto que correspondería a un salario semanal de 90USD.

Salario (x)

Gasto (y)

X2 Y

2 XY (xi -Ẋ) (xi - Ẋ)^2 (Yi -Ῡ) (Yi -Ῡ)^2

28 25 784 625 700 -17,8 316,84 -13,4 179,56

25 20 625 400 500 25 625 20 400

35 32 1225 1024 1120 35 1225 32 1024

40 37 1600 1369 1480 40 1600 37 1369

45 40 2025 1600 1800 45 2025 40 1600

50 40 2500 1600 2000 50 2500 40 1600

50 45 2500 2025 2250 50 2500 45 2025

35 30 1225 900 1050 35 1225 30 900

70 55 4900 3025 3850 70 4900 55 3025

80 60 6400 3600 4800 80 6400 60 3600

ƩX=458 ƩY=384 ƩX2=23784 ƩY

2=16168 ƩXY=19550 Ʃ(xi -Ẋ)

=412,2 Ʃ(xi - Ẋ)^2=

23316,84

Ʃ(Yi -Ῡ) =345,6

Ʃ(Yi-Ῡ)^2= 15722,56

(∑ ) (∑ )(∑ )

√, (∑ ) (∑ ) -[ (∑ ) (∑ ) ]

( ) ( )( )

√, ( ) ( ) -, ( ) ( ) -

√, -, -

√, -, -

√

Desviación Estándar (X)

Sx = √∑( )

Sx = √

√ = 48,28

Ẋ =

Sy = √

√ = 39, 65

Ῡ =

+ .

/ (

)

+ .

/ .

/

+ ( )

+

+ ( ) = 73, 54 gasto de un salario semanal

(∑ ) (∑ )(∑ )

√[ (∑ )(∑ ) ], (∑ ) (∑ ) -

( ) ( )( )

√[ (∑ )(∑ ) ], (∑ ) (∑ ) -

√( ) ( ) )

√

r = -0.005

COMENTARIO.- Vemos que los vehículos de 20 toneladas no tienen relación

con los de 40 toneladas, ya que a los de 20 se los utiliza más para las

importaciones que los de 40 debido a que son más ligeros al transportar las

mercancías.


CORRELACION Y REGRESION

LINEAL

ayuda a la toma de decisiones

segun lo resultante en la aplicacion de

estos

grupodetécnicasestadísticasusadasparamedirlafuerzadelaasociaciónentredosvariabl

es

se ocupa de establecer si existe una relación así como de determinar su

magnitud y dirección mientras que la regresión se encarga principalmente de utilizar a la relación para efectuar una

predicción.

determinar posibles resultados como por ejemplo

del exito en un estudi de mercado

permite evaluar decisiones que se

tomen en una poblacion

herramienta basica para

estudios y analisis que pueden

determinar el exito o fracaso entre dos

opciones

PROYECTO Nª3

TEMA: La Correlación y Regresión Lineal

PROBLEMA: El escaso conocimiento de la Correlación y Regresión Lineal no

ha permitido a los estudiantes resolver problemas

OBJETIVOS

OBJETIVO GENERAL:

Aplicar los conocimientos la Correlación y Regresión Lineal para



Investigar la Correlación y Regresión Lineal para resolver problemas de

Comercio Exterior

Conocer la Correlación y Regresión Lineal para resolver problemas de

Comercio Exterior

Analizar la Correlación y Regresión Lineal para resolver problemas de

Comercio Exterior

JUSTIFICACION

El presente trabajo se lo ha realizado con el fin de obtener información acerca

de la Correlación y Regresión Lineal para de esta manera contribuir en nuestro

conocimiento y de esta forma tener claro los ámbitos de aplicación para

resolver problemas que puedan existir en el Comercio Exterior.

La Correlación y Regresión Lineal nos permite hacer cálculos y determinar dee

esta manera la factibilidad de un proyecto a través de un resultado expresado

en porcentajes para de esta manera lograr determinar los puntos clave del

proyecto o tema de investigación y así lograr obtener un buen resultado.

El tema de la Correlación y Regresión Lineal nos permite aplicarlo en el

Comercio exterior al momento que se quiera determinar la factibilidad de

negociación con una u otra empresa internacional y de esta manera obtener el

mejor resultados. Además es importante conocer acerca de este tema porque

nos ayuda a verificar si podemos hacer una importación de determinado

producto o una exportación y si sería favorable realizarlo.

MARCO TEÓRICO

LA CORELACION Y REGRESIÓN LINEAL

En una distribución que puede ocurrir que las dos variables guarden algún tipo

de relación entre ellos es decir si se analiza la estatura y el peso de los

alumnos o alumnas de una clase es muy posible que exista relación entre

ambas variables: mientras más alto sea el estudiante, cabe pensar que mayor

será su peso. (E, 2007)

El coeficiente de correlación lineal mide el grado de intensidad de esta posible

relación entre las variables. Este coeficiente se aplica cuando la relación que

puede existir entre las variables es lineal es decir, si representáramos en un

gráfico los pares de valores de las dos variables la nube de puntos se

aproximaría a una recta. (Raymond, 2005)

No obstante, puede que exista una relación que no sea lineal, sino exponencial,

parabólica, etc. En estos casos, el coeficiente de correlación lineal mediría mal

la intensidad de la relación las variables, por lo que convendría utilizar otro tipo

de coeficiente más apropiado. (Raymond, 2005)

Para ver, por tanto, si se puede utilizar el coeficiente de correlación lineal, lo

mejor es representar los pares de valores en un gráfico y ver qué forma

describe. (E, 2007)

El coeficiente de correlación lineal se calcula aplicando la siguiente fórmula:

Es decir:

Numerador: se denomina covarianza y se calcula de la siguiente manera: en

cada par de valores (x,y) se multiplica la "x" menos su media, por la "y" menos

su media. Se suma el resultado obtenido de todos los pares de valores y este

resultado se divide por el tamaño de la muestra. (E, 2007)

Denominador se calcula el producto de las varianzas de "x" y de "y", y a este

producto se le calcula la raíz cuadrada. (E, 2007)

Los valores que puede tomar el coeficiente de correlación "r" son: -1 < r < 1

Si "r" > 0, la correlación lineal es positiva además si sube el valor de una

variable sube el de la otra. La correlación es tanto más fuerte cuanto más se

aproxime a 1.

Si "r" < 0, la correlación lineal es negativa es decir si sube el valor de una

variable disminuye el de la otra. La correlación negativa es tanto más fuerte

cuanto más se aproxime a -1.

Si "r" = 0, no existe correlación lineal entre las variables. Aunque podría existir

otro tipo de correlación.

De todos modos, aunque el valor de "r" fuera próximo a 1 o -1, tampoco esto

quiere decir obligatoriamente que existe una relación de causa-efecto entre las

dos variables, ya que este resultado podría haberse debido al puro azar. (E,

2007)

EJERCICIOS PRÁCTICOS

Dados los siguientes conjuntos de parejas de datos muéstrales:

A B C

X X2 Y Y2 XY X X2 Y Y2 XY X X2 Y Y2 XY

1 4 5 10 13

1 16 25 100 169

1 2 3 4 5

1 4 9 16 25

1 8 15 40 65

4 5 8 9 10

16 25 64 81 100

2 4 5 1 4

4 16 25 1 16

8 20 40 9 40

1 4 7 10 13

1 16 49 100 169

5 4 3 2 1

25 16 9 4 1

5 16 21 20 13

33 311 15 55 129 36 286 16 62 117 35 335 15 55 75

a) Utilice la ecuación para calcular el valor de la r de Pearson para cada

conjunto. Observe que en el conjunto B, donde la correlación es menor,

algunos de los valores son positivos y otros son negativos. Estos tienden a

cancelarse entre sí, lo cual hace que r tenga una menor magnitud. Sin

embargo, en los conjuntos A y C, todos los productos tienen el mismo signo,

haciendo que la magnitud de r aumente. Cuando las parejas de datos

ocupan las mismas u opuestas posiciones dentro de sus propias

distribuciones, los productos tienen el mismo signo, lo cual produce

una mayor magnitud de r.

(∑ ) (∑ ) (∑ )

√[ (∑ ) (∑ ) ][ (∑ ) (∑ )

]

( ) ( )( )

√, ( ) ( ) -, ( ) ( ) -

√( )( )

b) Calcule r para el conjunto B, utilizando la ecuación para los datos en bruto.

¿Qué prefiere, utilizar la ecuación de los datos en bruto o la de los puntajes

z?

(∑ ) (∑ ) (∑ )

√[ (∑ ) (∑ ) ][ (∑ ) (∑ )

]

( ) ( )( )

√, ( ) ( ) -, ( ) ( ) -

√( )( )

c) Sume la constante 5 a los datos x en el conjunto A y calcule r de nuevo,

mediante la ecuación de los datos en bruto. ¿Ha cambiado el valor?

A

X X2 Y Y

2 XY

6 9 10 15 18

36 81 100 225 324

1 2 3 4 5

1 4 9 16 25

6 18 30 60 90

58 766 15 55 204

(∑ ) (∑ ) (∑ )

√[ (∑ ) (∑ ) ][ (∑ ) (∑ )

]

( ) ( )( )

√, ( ) ( ) -, ( ) ( ) -

√( )( )

d) Multiplique los datos x del conjunto A por 5 y calcule r de nuevo. ¿Ha

cambiado el valor?

A

X X2 Y Y2 XY

5 20 25 50 65

25 400 625 2500 4225

1 2 3 4 5

1 4 9 16 25

5 40 75 200 325

165 7775 15 55 645

(∑ ) (∑ ) (∑ )

√[ (∑ ) (∑ ) ][ (∑ ) (∑ )

]

( ) ( )( )

√, ( ) ( ) -, ( ) ( ) -

√( )( )

e) Generalice los resultados obtenidos en las partes c y d; restando y

dividiendo los datos entre una constante. ¿Qué le dice esto sobre r?

Que si se suma, resta, multiplica o divide el resultado no varía porque es una

constante.

En un largo curso de introducción a la sociología, un profesor hace dos

exámenes. El profesor quiere determinar si las calificaciones de los

estudiantes en el segundo examen están correlacionadas con las

calificaciones del primero. Para facilitarlos, se elige una muestra de ocho

estudiantes cuyas calificaciones aparecen en la siguiente tabla.

Estudiante Examen 1 Examen 2

1 2 3 4 5 6 7 8

60 75 70 72 54 83 80 65

60 100 80 68 73 97 85 90

a) Construya una gráfica de dispersión para datos, utilizando la calificación del

primer examen como la variable X. ¿Parece línea de correlación?

b) Suponga que existe una relación lineal calificaciones de los dos exámenes,

calcular el valor de la r de Pearson.

X X2 Y Y2 XY

60 3600 60 3600 3600

75 5625 100 10000 7500

70 4900 80 6400 5600

72 5184 68 4624 4896

54 2916 73 5329 3942

0

20

40

60

80

100

0 2 4 6 8 10

exa

me

n 1

estudiante

83 6889 97 9409 8051

80 6400 85 7225 6800

65 4225 90 8100 5850

∑559 ∑39739 ∑653 ∑54687 ∑46239

( ) ( )( )

√, ( ) ( ) -, ( ) ( ) -

√( )( )

c) ¿Qué tan bien explican la relación, las calificaciones del segundo examen?

El segundo examen nos explica una mejor relación porque en la sumatoria nos

da un resultado mayor al del primer examen.

Un investigador realiza un estudio de la relación entre el consumo de

cigarros y las enfermedades determinan la cantidad de cigarros fumados

diariamente y de días de ausencia en el trabajo de ultimo año debido a

una enfermedad para individuos en la compañía donde trabaja este

investigador. Los datos aparecen en la tabla anexa.

Sujeto Cigarros consumidos Días de ausencia

1 2 3 4 5 6 7 8 9 10 11 12

0 0 0

10 13 20 27 35 35 44 53 60

1 3 8 10 4 14 5 6 12 16 10 16

a) Construya una gráfica de dispersión para estos datos. ¿Se ve una

relación lineal?

b) Calcule el valor de la r de Pearson

X X2 Y Y2 XY

0 0 1 1 0

0 0 3 9 0

0 0 8 64 0

10 100 10 100 100

13 169 4 16 52

20 400 14 196 280

27 729 5 25 135

35 1225 6 36 210

35 1225 12 144 420

44 1936 16 256 704

53 2809 10 100 530

60 3600 16 256 960

297 12193 105 1203 3391

(∑ ) (∑ ) (∑ )

√[ (∑ ) (∑ ) ][ (∑ ) (∑ )

]

( ) ( )( )

√, ( ) ( )-, ( ) ( )-

0

2

4

6

8

10

12

14

16

18

0 10 20 30 40 50 60 70

dia

s d

e a

use

nci

ae

cigarros consumidos

c) Elimine los datos de los sujetos 1, 2, 3, 10,11 y 12. Esto disminuye el

rango de ambas variables. Vuelva a calcular r para los sujetos restantes.

¿Qué efecto tiene la disminución del rango sobre r?

X X2 Y Y2 XY

10 100 10 100 100

13 169 4 16 52

20 400 14 196 280

27 729 5 25 135

35 1225 6 36 210

35 1225 12 144 420

140 3848 51 517 1197

(∑ ) (∑ ) (∑ )

√[ (∑ ) (∑ ) ][ (∑ ) (∑ )

]

( ) ( )( )

√, ( ) ( )-, ( ) ( )-

Tiene una relación menor si disminuyen los sujetos.

Un educador ha construido un examen para las aptitudes mecánicas y

desea determinar si este es confiable mediante dos administraciones con

un lapso de límites entre ellas se realiza un estudio en el cual 10

estudiantes reciben dos administraciones del examen, donde la segunda

administración ocurre un mes después que la primera. Los datos

aparecen en tablas.

SUJETO ADMINISTRACIÓN

1 (X)

ADMINISTRACIÓN

2 (Y) X^2 Y^2 X*Y

1 10 10 100 100 100

2 12 15 144 225 180

3 20 17 400 289 340

4 25 25 625 625 625

5 27 32 729 1024 864

6 35 37 1225 1369 1295

7 43 40 1849 1600 1720

8 40 38 1600 1444 1520

9 32 30 1024 900 960

10 47 49 2209 2401 2303

291 293 9905 9977 9907

Construya una gráfica de dispersión para las parejas de datos.

Determine el valor de r.

Sería justo decir que este sería un examen confiable? Explique porque

Si es un examen confiable debido a que le permite establecer un margen de

confiabilidad de un 79%

(∑ ) (∑ )(∑ )

√, (∑ ) (∑ ) -, (∑ ) (∑ ) -

( ) ( )( )

√, ( ) ( )-, ( ) ( )-

0

10

20

30

40

50

60

0 10 20 30 40 50

Ad

min

istr

ció

n 2

Administración 1

Un grupo de investigadores ha diseñado un cuestionario sobre la tensión,

consistente en 15 sucesos.

Ellos están interesados en determinar si existe una coincidencia entre dos

culturas acerca de la cantidad relativa de ajustes que acarrea cada suceso. El

cuestionario se aplica a 300 estado anídense y 300 italianos. Cada individuo

debe utilizar el evento matrimonio‖ como estándar y juzgar los demás eventos

en relación con el ajuste necesario, para el matrimonio. El matrimonio recibe un

valor arbitrario de50 puntos. Si se considera que un evento requiere de más

ajustes que el matrimonio, el evento debe recibir más de 50 puntos. El número

de puntos accedentes depende de la cantidad de ajustes requeridos. Después

de cada sujeto de cada cultura se ha asignado puntos a todos los eventos, se

promedian los puntos de cada evento. Los resultados aparecen en la siguiente

tabla.

Eventos Estadounidenses

(X)

Italiano

(Y) x^2 y^2 x*y

Muerte de la esposa 100 80 10000 6400 8000

Divorcio 73 95 5329 9025 6935

Separación de la pareja 65 85 4225 7225 5525

Temporada en prisión 63 52 3969 2704 3276

Lesiones temporales 53 72 2809 5184 3816

Matrimonio 50 50 2500 2500 2500

Despedido del trabajo 47 40 2209 1600 1880

Jubilación 45 30 2025 900 1350

Embarazo 40 28 1600 784 1120

Dificultades sexuales 39 42 1521 1764 1638

Reajustes eco nómicos 39 36 1521 1296 1404

Problemas con la familia política 29 41 841 1681 1189

Problemas con el jefe 23 35 529 1225 805

Vacaciones 13 16 169 256 208

navidad 12 10 144 100 120

691 712 39391 42644 39766

(∑ ) (∑ )(∑ )

√, (∑ ) (∑ ) -, (∑ ) (∑ ) -

( ) ( )( )

√, ( ) ( )-, ( ) ( )-

√, -, -

a)suponga que los datos tienen al menos una escala de intervalo y calcule la

correlación entre los datos de los estadounidenses y la de los italianos

X Y X2 Y2 XY

12 9 144 81 108

11 12 121 144 132

4 5 16 25 20

7 8 49 64 56

10 11 100 121 110

8 7 64 49 56

3 4 9 16 12

1 1 1 1 1

9 6 81 36 54

2 2 4 4 4

6 10 36 100 60

5 3 25 9 15

∑78 ∑78 ∑650 ∑650 ∑628

(∑ ) (∑ )(∑ )

√, (∑ ) (∑ ) -, (∑ ) (∑ ) -

( ) ( )( )

√, ( ) ( )-, ( ) ( )-

√

b) suponga que los datos solo tienen una escala ordinal y calcule la correlación

entre los datos de ambas culturas.

X Y X2 Y2 XY

48 12 2304 144 576

37 11 1369 121 407

30 4 900 16 120

45 7 2025 49 315

31 10 961 100 310

24 8 576 64 192

28 3 784 9 84

18 1 324 1 18

35 9 1225 81 315

15 2 225 4 30

42 6 1764 36 252

22 5 484 25 110

∑375 ∑78 ∑12941 ∑650 ∑2729

(∑ ) (∑ )(∑ )

√, (∑ ) (∑ ) -, (∑ ) (∑ ) -

( ) ( )( )

√, ( ) ( )-, ( ) ( )-

√

X Y X2 Y2 XY

48 9 2304 81 432

37 12 1369 144 444

30 5 900 25 150

45 8 2025 64 360

31 11 961 121 341

24 7 576 49 168

28 4 784 16 112

18 1 324 1 18

35 6 1225 36 210

15 2 225 4 30

42 10 1764 100 420

22 3 484 9 66

∑375 ∑78 ∑12941 ∑650 ∑2751

(∑ ) (∑ )(∑ )

√, (∑ ) (∑ ) -, (∑ ) (∑ ) -

( ) ( )( )

√, ( ) ( )-, ( ) ( )-

√

Un psicólogo ha construido un examen lápiz papel, a fin de medir la

depresión. Para comparar los datos del examen con los datos del experto,

12 individuos con perturbaciones emocionales realizan el examen lápiz

papel. Los individuos también son calificados de manera independiente

por dos siquiatras, de acuerdo con el grado de depresión determinado

por cada uno como resultado de entrevistas detalladas. Los datos

aparecen a continuación. Los datos mayores corresponden a una mayor

depresión.

a) ¿Cuál es la correlación entre los datos de los dos siquiatras?

X Y X2 Y2 XY

12 9 144 81 108

11 12 121 144 132

4 5 16 25 20

7 8 49 64 56

10 11 100 121 110

8 7 64 49 56

3 4 9 16 12

1 1 1 1 1

9 6 81 36 54

2 2 4 4 4

6 10 36 100 60

5 3 25 9 15

∑78 ∑78 ∑650 ∑650 ∑628

(∑ ) (∑ )(∑ )

√, (∑ ) (∑ ) -, (∑ ) (∑ ) -

( ) ( )( )

√, ( ) ( )-, ( ) ( )-

√

b) ¿cuál es la correlación entre las calificaciones del examen con lápiz y papel

y los datos de cada siquiatra?

X Y X2 Y2 XY

48 12 2304 144 576

37 11 1369 121 407

30 4 900 16 120

45 7 2025 49 315

31 10 961 100 310

24 8 576 64 192

28 3 784 9 84

18 1 324 1 18

35 9 1225 81 315

15 2 225 4 30

42 6 1764 36 252

22 5 484 25 110

∑375 ∑78 ∑12941 ∑650 ∑2729

(∑ ) (∑ )(∑ )

√, (∑ ) (∑ ) -, (∑ ) (∑ ) -

( ) ( )( )

√, ( ) ( )-, ( ) ( )-

√

X Y X2 Y2 XY

48 9 2304 81 432

37 12 1369 144 444

30 5 900 25 150

45 8 2025 64 360

31 11 961 121 341

24 7 576 49 168

28 4 784 16 112

18 1 324 1 18

35 6 1225 36 210

15 2 225 4 30

42 10 1764 100 420

22 3 484 9 66

∑375 ∑78 ∑12941 ∑650 ∑2751

(∑ ) (∑ )(∑ )

√, (∑ ) (∑ ) -, (∑ ) (∑ ) -

( ) ( )( )

√, ( ) ( )-, ( ) ( )-

√

Para este problema, suponga que usted es un sicólogo que elabora en el

departamento de recursos humanos de una gran corporación. El presidente de

la compañía a cava de hablar con usted a cerca de la importancia de contratar

personal productivo en la sección de manufactura de la empresa y le ha pedido

que ayude a mejorar la capacidad de la institución para hacer esto. Existen 300

empleados en esta sección y cada obrero fabrica el mismo artículo. Hasta

ahora, la corporación solo ha ocurrido a entrevistas para elegirá estos

empleados. Usted busca bibliografía y descubre dos pruebas de desempeño,

de lápiz- papel bien estandarizadas, y piensa que podría estar relacionada con

los requisitos de desempeño de esta sección. Para determinar si alguna de

ellas se puede utilizar como dispositivo de selección, elige 10 empleados

representativos de la selección de manufactura garantizando un amplio rango

de desempeño quede representando en la muestra, y realiza las dos pruebas

con cada empleado. Los datos aparecen en la siguiente tabla. Mientras mayor

sea la calificación mejor será el desempeño. Las calificaciones de desempeño

en el trabajo son la calidad real de artículos fabricados por cada empleado por

semana, promediados durante los últimos 6 meses.

a) construya una gráfica de dispersión de desempeño en el trabajo, y la primera

prueba, utilizando la prueba uno como la variable x. ¿parece lineal la relación?

b) suponga que la relación anterior es lineal y calcule el valor de la r de person.

Examen

1 (X)

Desempeño

en el

trabajo (Y)

( ) ( ) ( )

10 50 100

361

400

400

441

2500

5476

3844

8100

9604

500

1406

1240

1800

2058

19 74

20 62

20 90

21 98

0

20

40

60

80

100

120

0 20 40 60

DES

EMP

EÑO

EN

EL

TRA

BA

JO

EXAMEN 1

Desempeño en eltrabajo (Y)

Lineal (Desempeño enel trabajo (Y))

14 52 196

100

576

256

196

2704

4624

6400

7744

5776

728

680

1920

1408

1064

10 68

24 80

16 88

14 76

( ) ( )( )

√, ( ) ( ) -, ( ) ( ) -

( ) ( )( )

√, ( ) ( ) -, ( ) ( ) -

c) construya una gráfica de dispersión de desempeño en el trabajo y la

segunda prueba utilizando la prueba 2 como la variable X??????? ¿Parece

lineal la relación?

d) suponga que la relación anterior es líneas, calcule el valor de la r de person.

0

20

40

60

80

100

120

0 20 40 60

DES

EMP

EÑO

EN

EL

TRA

BA

JO

EXAMEN 1

Desempeño en eltrabajo (Y)

Lineal (Desempeñoen el trabajo (Y))

Examen 2 (X)

Desempeño en el trabajo (Y)

( ) ( ) XY

25 50 625 1225 1600

2500 5476 3844

1250 2590 2480

35 74

40 62

49 90 2401 2500 841

1024 1936 2116 1225

8100 9604 2704 4624 6400 7744 5776

4410 4900 1508 2176 3520 4048 2660

50 98

29 52

32 68

44 80

46 88

35 76

( ) ( )( )

√, ( ) ( ) -, ( ) ( ) -

( ) ( )( )

√, ( ) ( ) -, ( ) ( ) -

e) si solo pudiera utilizar una de las pruebas para la selección de los

empleados ¿utilizaría alguna de ellas? En tal caso, ¿cuál de ellas’? explique.

1 2 3 4 5 6 7 8 9 10

Desempeño

en el trabajo

50 74 62 90 98 52 68 80 88 76

Examen uno

10 19 20 20 21 14 10 24 16 14

Examen dos 25 35 40 49 50 29 32 44 46 35

La segunda prueba porque tiene una mayor relación entre la prueba y el

desempeño de trabajo.

CONCLUSIONES

Aprender hacer este tipo de ejercicios nos ayudara mucho ya que a

través de un buen análisis entre dos variables nos puede conducir a una

buena toma de decisiones.

es importante analizar este tipo de variables en la operación de comercio

exterior para la buena aplicación de las prácticas comerciales, y sin lugar

a dudas tendremos éxito en la carrera y seremos de gran ayuda a la

sociedad..

RECOMENDACIONES

Es recomendable hacer un análisis minucioso de las variables como

también de sus resultados para así poder tomar adecuadamente sus

decisiones.

Es recomendable tener presente este tipo de conocimiento en la

aplicación de sistematizaciones comerciales, para que la ejecución las

operaciones de comercio exterior tengan éxito.

Bibliografía

E, T. P. (2007). CORELACION Y REGRESION LINEAL. En T. P. E, Física,

Conceptos Y Aplicaciones. españa: Mcgraw-hill.

(2005). CORRELACION Y REGRESION LINEAL. En S. Raymond, Física Para

Ciencias E Ingeniería. MEDELLIN: Thomson.

ANEXOS

La empresa FERRERO desea importar nueces desde Colombia por lo cual no

está seguro que empresa de transporte contratar para la mercancía de acuerdo

a esto esta empresa decide verificar los rendimientos que han tenido estas

empresas en el transporte por lo cual ha hecho una investigación de mercado y

a obtenido los siguientes resultados.

EMPRESAS DE

TRANSPORTE

CALIDAD DE

SERVICIO (X)

RENDIMIENTO

(Y)

XY

TRANSCOMERINTER

TRANSURGIN

TRANSBOLIVARIANA

SERVICARGAS

19

17

16

14

46

44

40

30

361

289

256

196

2116

1936

1600

900

874

748

640

420

66 160 1102 6552 2682

r (∑ ) (

(∑ )(∑ )

)

√,∑ ((∑ ) ( ))-,∑ ((∑ ) ( ))-

r= ( ) (( ) )

√. ( ) ( )/. ( ) ( )/

r= 0,038

Es una relación positiva pero se podría decir que la empresa no podrá

depender de las dos variables ya que no son muy dependientes el uno del otro.

La empresa GENERL MOTORS desea importar nueces desde Colombia por lo

autos de acuerdo a su rendimiento y comodidad para lo cual realiza una

investigación obteniendo los siguientes resultados.

AUTOS RENDIMIENTO

(X)

COMODIDAD

(Y)

XY

TOYOTA

CHEVROLET

NISAN

VITARA

99

87

65

60

19

17

16

15

9801

7569

4225

3600

361

289

256

225

1881

1479

1040

900

311 67 25195 6552 5300

r (∑ ) (

(∑ )(∑ )

)

√,∑ ((∑ ) ( ))-,∑ ((∑ ) ( ))-

r= ( ) (( ) )

√. ( ) ( )/. ( ) ( )/

r= 0,04

Se puede decir que la comodidad no depende del rendimiento y para lo cual se

debe determinar cuál es el mejor carro para importar.

Un importador ha construido una investigación para la compra de

electrodomésticos desea determinar si es que la empresa es confiable,

mediante dos administraciones con un lapso de mes entre ellas. Se realiza un

estudio en el cual 10 empresas reciben dos pedidos, donde la segunda

empresa ocurre un mes después que la primera. Los datos aparecen en la

tabla.

Sujeto Pedido 1 Pedido 2

1

2

3

4

5

6

7

8

9

10

10

12

20

25

27

35

43

40

32

47

10

15

17

25

32

37

40

38

30

49

X X2 Y Y2 XY

10 12 20 25 27 35 43 40 32 47

100 144 400 625 729 1225 1849 1600 1024 2209

10 15 17 25 32 37 40 38 30 49

100 225 289 625 1024 1369 1600 1444 900 2401

100 180 340 625 864

1295 1720 1520 960

2303

291 9905 293 9977 9907

(∑ ) (∑ ) (∑ )

√[ (∑ ) (∑ ) ][ (∑ ) (∑ )

]

( ) ( )( )

√, ( ) ( )-, ( ) ( )-

Se puede determinar que la empresa si es confiable para realizar la

negociación y la importación ya que tiene un grado de confiabilidad mayor a la

mitad.

PROYECTO Nª4

TEMA: Regresión Lineal

PROBLEMA: El escaso conocimiento de la Regresión Lineal no ha permitido a

los estudiantes resolver problemas

OBJETIVOS

OBJETIVO GENERAL:

Aplicar los conocimientos la Regresión Lineal para resolver problemas

de Comercio Exterior


Investigar la Regresión Lineal para resolver problemas de Comercio

Exterior

Conocer la Regresión Lineal para resolver problemas de Comercio

Exterior

Analizar la Regresión Lineal para resolver problemas de Comercio

Exterior

JUSTIFICACION El presente trabajo se lo ha realizado con el fin de obtener

información acerca de la Regresión Lineal para de esta manera contribuir en

nuestro conocimiento y de esta forma tener claro los ámbitos de aplicación para

resolver problemas que puedan existir en el Comercio Exterior. La Regresión

Lineal nos permite hacer cálculos y determinar de esta manera la factibilidad de

un proyecto a través de un resultado expresado en porcentajes para de esta

manera lograr determinar los puntos clave del proyecto o tema de investigación

y así lograr obtener un buen resultado. El tema de la Regresión Lineal nos

permite aplicarlo en el Comercio exterior al momento que se quiera determinar

la factibilidad de negociación con una u otra empresa internacional y de esta

manera obtener el mejor resultados. Además es importante conocer acerca de

este tema porque nos ayuda a verificar si podemos hacer una importación de

determinado producto o una exportación y si sería favorable realizarlo.

MARCO TÉORICO

REGRESIÓN LINEAL

Al comenzar a estudiar las técnicas de correlación afirmamos que

estudiaríamos dos variables y no solamente una. Llamamos en esta ocasión X

a una de las variables y Y a la otra. En el tema que nos ocuparemos ahora,

estudiaremos la forma de predecir valores de Y, conociendo primero los dos

valores de X. (JOHNSON, 1990)

En estadística la regresión lineal o ajuste lineal es un método matemático

que modeliza la relación entre una variable dependiente Y, las variables

independientes Xi y un término aleatorio ε. Este modelo puede ser expresado

como:

: variable dependiente, explicada o regresando.

http://es.wikipedia.org/wiki/Estad%C3%ADstica

http://es.wikipedia.org/wiki/M%C3%A9todo

http://es.wikipedia.org/wiki/Matem%C3%A1ticas

http://es.wikipedia.org/wiki/Modelo_matem%C3%A1tico

http://es.wikipedia.org/wiki/Variable_dependiente

http://es.wikipedia.org/wiki/Variable_independiente

http://es.wikipedia.org/wiki/Variable_independiente

http://es.wikipedia.org/wiki/Aleatoriedad

: Variables explicativas, independientes o regresores.

: Parámetros, miden la influencia que las variables

explicativas tienen sobre el regresando.

Donde es la intersección o término "constante", las son los

parámetros respectivos a cada variable independiente, y es el número de

parámetros independientes a tener en cuenta en la regresión. La regresión

lineal puede ser contrastada con la regresión no lineal. (JOHNSON, 1990)

El modelo de regresión lineal

El modelo lineal relaciona la variable dependiente Y con K variables

explicativas (k = 1,...K), o cualquier transformación de éstas, que generan

un hiperplano de parámetros desconocidos:

(2)

donde es la perturbación aleatoria que recoge todos aquellos factores de la

realidad no controlables u observables y que por tanto se asocian con el azar, y

es la que confiere al modelo su carácter estocástico. En el caso más sencillo,

con una sola variable explicativa, el hiperplano es una recta:

(3)

El problema de la regresión consiste en elegir unos valores determinados para

los parámetros desconocidos , de modo que la ecuación quede

completamente especificada. Para ello se necesita un conjunto de

observaciones. En una observación cualquiera i-ésima (i= 1,... I) se registra el

comportamiento simultáneo de la variable dependiente y las variables

explicativas (las perturbaciones aleatorias se suponen no observables).

(4)

http://es.wikipedia.org/wiki/Regresi%C3%B3n_no_lineal


http://es.wikipedia.org/wiki/Transformaci%C3%B3n

http://es.wikipedia.org/wiki/Hiperplano

http://es.wikipedia.org/wiki/Par%C3%A1metro

http://es.wikipedia.org/wiki/Regresi%C3%B3n_lineal#Eqnref_2

http://es.wikipedia.org/wiki/Perturbaci%C3%B3n


http://es.wikipedia.org/wiki/Azar

http://es.wikipedia.org/wiki/Estoc%C3%A1stico

http://es.wikipedia.org/wiki/Hiperplano

http://es.wikipedia.org/wiki/Recta


http://es.wikipedia.org/wiki/Valor_num%C3%A9rico

http://es.wikipedia.org/wiki/Ecuaci%C3%B3n




Los valores escogidos como estimadores de los parámetros, , son los

coeficientes de regresión, sin que se pueda garantizar que coinciden con

parámetros reales del proceso generador. Por tanto, en

(5)

Los valores son por su parte estimaciones de la perturbación aleatoria o

errores.

EJERCICIOS

9.- El gerente de personal de la empresa P&C quiere estudiar la relación entre

el ausentismo y la edad de sus trabajadores. Tomó una muestra aleatoria de

10 trabajadores de la empresa y encontró los siguientes datos.

Edad (años) 25 46 58 37 55 32 41 50 23 60

Ausentismo (días por año) 18 12 8 15 10 13 7 9 16 6

a) Use el método de mínimos cuadrados para hallar la ecuación muestral

que relaciona las dos variables.

b)

0

50

100

150

200

250

300

350

400

0 200 400 600 800 1000

ven

tas

ingresos

Series1

Lineal (Series1)

http://es.wikipedia.org/wiki/Estimador

http://es.wikipedia.org/wiki/Coeficiente


http://es.wikipedia.org/wiki/Estimaci%C3%B3n

Edad (años)

X

Ausentismo (días por año) Y

(3) X^2

(4) Y^2

(5) XY

(6)

(Xi- )^2

(7)

(Yi- )^2

25 18 625 324 450 313,29 43,56

46 12 2116 144 552 1197,16 144

58 8 3364 64 464 3364 64

37 15 1369 225 555 1369 225

55 10 3025 100 550 3025 100

32 13 1024 169 416 1024 169

41 7 1681 49 287 1681 49

50 9 2500 81 450 2500 81

23 16 529 256 368 529 256

60 6 3600 36 360 3600 36

∑X = 427

∑Y = 114 ∑ X^2 = 19833

∑ Y^2= 1448

∑ XY = 4452

∑(Xi-

)^2 = 18602,45

∑(Yi-

)^2 = 1167,56

= 42,7

= 11,4

c) Calcule el coeficiente de determinación. De su comentario sobre el ajuste de la

línea de regresión a los datos de la muestra.

(∑ ) (∑ )(∑ )

√, (∑ ) (∑ ) -[ (∑ ) (∑ ) ]

( ) ( )( )

√, ( ) ( ) -, ( ) ( ) -

√, -, -

√, -, -

√

PRIMER MÉTODO

(∑ ) (∑ )(∑ )

(∑ ) (∑ )

( ) ( )( )

( ) ( )

( )

( )

( )

SEGUNDO MÉTODO

+ .

/ (

)

+( ) .

/ ( ) .

/

+( ) ( )( )

-

r = - 0, 85

Sx = √∑( )

Sx = √

√ = 43, 13

Sy = √

√ = 10, 80

Ẋ = 42, 7

Ῡ =

TERCER MÉTODO

∑

( )( )

∑

( )

( )

d) Calcule el error estándar de la estimación y/x y los residuales. ¿Qué

porcentaje de residuales de la muestra son menores de y/x? ¿Qué opina

del ajuste por este método?

e) Determine si el coeficiente de regresión en la población es diferente de cero si

se sabe que el erro estándar del coeficiente de regresión muestral es 0,056.

Use el nivel de significación 0.01

10.- El Banco ―PRESTAMO‖ estudia la relación entre las variables, ingresos (X)

y ahorros (Y) mensuales de sus clientes. Una muestra aleatoria de sus clientes

reveló los siguientes datos en dólares:

X 350 400 450 500 950 850 700 900 600

Y 100 110 130 160 350 350 250 320 130

X

Y

X^2

Y^2

XY

(Xi-X)^2

(Yi-Y)^2

350 100 122500 10000 35000 48400 8100

400 110 160000 12100 44000 44100 12100

450 130 202500 16900 58500 202500 16900

500 160 250000 25600 80000 250000 25600

950 350 902500 122500 332500 902500 122500

850 350 722500 122500 297500 722500 122500

700 250 490000 62500 175000 490000 62500

900 320 810000 102400 288000 810000 102400

600 130 360000 16900 78000 360000 16900

∑X=5700 ∑Y=1900 ∑X^2= 4020000

∑ Y^2= 491400

∑XY= 1388500

∑(Xi-X)^2= 3830000

∑(Yi-Y)^2=

489500

= 570

= 190

(∑ ) (∑ )(∑ )

√, (∑ ) (∑ ) -[ (∑ ) (∑ ) ]

( ) ( )( )

√, ( ) ( ) -, ( ) ( ) -

√, -, -

√, -, -

PRIMER MÉTODO

(∑ ) (∑ )(∑ )

(∑ ) (∑ )

( ) ( )( )

( ) ( )

( )

( )

( )

SEGUNDO MÉTODO

+ .

/ (

)

+( ) .

/ ( ) .

/

+( ) ( )( )

-

r = - 0, 85

Sx = √∑( )

Sx = √

√ = 43, 13

Sy = √

√ = 10, 80

Ẋ = 42, 7

Ῡ =

TERCER MÉTODO

∑

( )( )

∑

( )

( )

Continuando con el ejercicio 10, la pendiente de la regresión muestral resulto,

b= 0,45, se quiere determinar si está pendiente es significativa en la población

utilizando el método de análisis de varianza.

∑

∑

∑

( )( )

√∑( )

√

√

( )

( )

3.- Continuamos con el ejercicio 10 determine:

a) L a cantidad de ahorro promedio, si el ingreso es X=$1200

( )

b) La cantidad de ahorro, cuando el ingreso es x=1200

4.- Un comerciante mayorista encargo un estudio para determinar la relación

entre los gastos de publicidad semanal por radio y ventas de sus productos. En

el estudio se obtuvieron los siguientes resultados.

Semana 2 3 4 5 6 7 8 9 10 11

Gasto de publicidad($)

30 20 40 30 50 70 60 80 70 80

Ventas($) 300 250 400 550 750 630 930 700 840

En la quinta semana por diversos motivos no se pudo hacer el estudio.

a.- Determinar la ecuación de regresión de ventas sobre gastos de

publicidad.

GastoPu x

Ventas Y

XY ( )

( )

30 300 9000 900 -25,56 653,31

20 250 5000 400 -35,56 1264,51

40 400 16000 1600 -15,56 242,11

50 550 27500 2500 -5,56 30,91

70 750 52500 4900 14,44 208,51

60 630 37800 3600 4,44 19,36

80 930 74400 6400 24,44 597,31

70 700 49000 4900 14,44 208,51

80 840 67200 6400 24,44 597,31

∑

∑

( )

∑ ∑ ∑

∑ (∑ )

( ) ( )( )

( ) ( )

b.- Interprete la pendiente de regresión.

c.- ¿En cuánto estimaría las ventas de la quinta semana?

Se obtuvieron los siguientes datos para determinar la relación entre cantidad de

fertilizante y producción de papa por hectárea.

Sacos de Fertilizante por hectárea

3 4 5 6 7 8 9 10 11 12

Rendimiento en Quintales 45 48 52 55 60 65 68 70 74 76

∑

∑ ∑ ∑ ∑(

)

a.-Encuentre la ecuación de regresión de la cosecha sobre el fertilizante, por el

método de mínimos cuadrados.

∑

∑

( )

∑ ∑ ∑

∑ (∑ )

( ) ( )( )

( ) ( )

Fertilizan x

Quintales Y

XY ( )

( )

3 45 135 9 -4,5 20,25

4 48 192 16 -3,5 12,25

5 52 260 25 -2,5 6,25

6 55 330 63 -1,5 2,25

7 60 420 49 -0,5 0,25

8 65 520 64 0,5 0,25

9 68 612 81 1,5 2,25

10 70 700 100 2,5 6,25

11 74 814 121 3,5 12,25

12 76 912 144 4,5 20,25

∑ ∑ ∑ ∑ ∑( )

El número de horas de estudio invertidas y las calificaciones finales en un

curso de Matemáticas de una muestra 10 alumnos ha dado los siguientes

resultados:

Alumno A1 A2 A3 A4 A5 A6 A7 A8 A9 A10

Horas de estudio

14 16 22 10 18 16 18 22 10 8

Calificación 12 13 15 15 17 11 14 16 08 05

Alumno X Y XY X2 Y2 X1- (X1- )2 Y1- (Y1- )2

A1 14 12 168 196 144 -2,4 5,8 -0,6 0,4

A2 16 13 208 256 169 -0,4 0,2 0,4 0,2

A3 22 15 330 484 225 5,6 31,4 2,4 5,8

A4 20 15 300 400 225 3,6 13,0 2,4 5,8

A5 18 17 306 324 289 1,6 2,6 4,4 19,4

A6 16 11 176 256 121 -0,4 0,2 -1,6 2,6

A7 18 14 252 324 196 1,6 2,6 1,4 2,0

A8 22 16 352 484 256 5,6 31,4 3,4 11,6

A9 10 8 80 100 64 -6,4 41,0 -4,6 21,2

A10 8 5 40 64 25 -8,4 70,6 -7,6 57,8

∑164 ∑126 ∑2212 ∑2888 ∑1714 ∑0,0 ∑198,4 ∑0,0 ∑126,4

a.-Determinar la recta de regresión de la calificación sobre el número de horas

de estudios invertidos. Interprete la ecuación de regresión.

∑

∑

Covarianza

∑

( )( )

Desviación

√∑( )

√

√∑( )

√

Varianza

∑

( )

Ordenada Al Origen

Pendiente

( )( )

Una muestra de 60 de las 350 agencias de ventas de automóviles de una

importancia registradas en un mes con X, (autos vendidos por agencia), Y

(ventas de miles de dólares), ha dado los siguientes resultados:

∑ ∑

a) Determine la ecuación de regresión:

∑

∑

( )

( )

( )( )

ECUACIÓN

b) Calcule el coeficiente de terminación ¿Qué porcentaje de la variación total

es explicada por la regresión?

∑

∑

∑

∑

∑

∑

∑ ∑ ∑

√( ∑ (∑ ) ), ∑ (∑ ) -

( ) ( )( )

√, ( ) ( ) -, ( ) ( ) -

CONCLUSIONES

La regresión lineal permite determinar la dependencia que existe entre

dos variables, es decir si los cambios de la una influyen en los cambios

de la otra.

La regresión lineal estimado los ingresos o gastos de la empresa o

determinada organización para saber el salario o ventas del progreso de

la empresa.

RECOMENDACIONES

Es de mucha importancia, que como estudiantes de la carrera de

comercio exterior conozcamos todo lo relacionado con la regresión lineal

para que exista una correcta aplicación en los ejercicios propuestos y

podamos determinar la dependencia que existe entre dos variables.

La utilización correcta de las formulas de la regresión lineal y por ende

son aplicadas en el los negocios de Comercio Internacional ya que

permite una mejor movimiento y reciprocidad para que se resuelva de

manera correcta los problemas de una empresa.

CRONOGRAMA DE ACTIVIDADES

Actividades Fecha Duración

Planteamiento del tema y

problema

(8/Junio/2012) 15 min

Realización de objetivos (11/ Junio /2012) 10 min

Justificación de la investigación (31/ Junio /2012) 15 min

Realización del marco teórico (1/ Junio /2012) 5:45 h

Conclusiones y recomendaciones (2/ Junio /2012) 15 min

Bibliografía

HOWAR B. CHRISTENSEN. (1990). ESTADISTICA PASO A PASO. En H. B.

CHRISTENSEN, ESTADISTICA (págs. 557-590). TRILLAS: TRILLAS.

JOHNSON, R. (1990). Análisis descriptívo y presentación de datos bivariados.

En ESTADÍSTICA ELEMENTAL (pág. 82 ~ 112). Belmont: Wadsworth

Publishing Company Inc.

ANEXOS

Un Ingeniero en Comercio Exterior desea estudiar la relación entre las variables como

exportaciones del año 2010 (x) y exportaciones el año 2011 (y) con el fin de saber que

tan bueno fue el avance económico de Ecuador. Estas variables están dadas en

millones de dólares, y corresponden a exportaciones totales pero solo de bienes que

ha realizado Ecuador.

2010 (X) 2011 (Y) X2 Y2 XY (xi - Ẋ)^2 (Yi -Ῡ)^2

16 42 256 1764 672 3588,01 20078,89

269 646 72361 417316 173774 7276,09 213721,29

286 689 81796 474721 197054 81796 255328,09

62 134 3844 17956 8308 3844 2470,09

52 118 2704 13924 6136 2704 4316,49

34 83 1156 6889 2822 1156 10140,49

10 33 100 1089 330 100 22710,49

26 83 676 6889 2158 676 10140,49

1 2 1 4 2 1 33014,89

3 7 9 49 21 9 31222,89

∑X=759 ∑Y=1837 ∑ X2= 162903

∑ Y2= 940601

∑XY = 391277

∑(xi - Ẋ)^2= 101150,1

∑(Yi -Ῡ)^2= 3374569

= 75,9

= 183,7

(∑ ) (∑ )(∑ )

√, (∑ ) (∑ ) -[ (∑ ) (∑ ) ]

( ) ( )( )

√, ( ) ( ) -, ( ) ( ) -

√, -, -

√, -, -

Como nos podremos dar cuenta la relación es positiva lo que quiere

decir que las exportaciones han aumentado.

La empresa exportadora de calzado desea saber que marca es la que se comercializa más en

el mercado internacional debido a su uso y desgaste recoge una muestra aleatoria de la

cantidad en dólares que sale el producto por mes la marca NAIKE o PUMA.

MARCA NAIKE (X)

MARCA PUMA (Y) X² Y² XY (X¡-Ẋ)² (y¡-ȳ)²

97 78 9409 6084 7566 220,82 31,02

83 56 6889 3136 4648 0,74 269,94

75 87 5625 7569 6525 50,98 212,28

82 54 6724 2916 4428 0,02 274,56

98 89 9604 7921 8722 251,54 16,54

65 65 4225 4225 4225 293,78 55,2

75 78 5625 6084 5850 50,98 31,02

∑ 575 ∑ 507 ∑ 48101 ∑ 37935 ∑ 41964 ∑ 868,86 ∑ 890,56

1. FORMA

√∑( )

√( )

√∑( )

√( )

(∑ ) (∑ )(∑ )

√, (∑ ) (∑ ) -, (∑ )(∑ ) -

( ) ( )( )

√, ( ) ( ) -, ( )( ) -

( )

( )

( )

( )

Ẋ=∑

Ẋ=

=82.14

ȳ=∑

ȳ=

=72.42

( )

( )

( )

( )

Ecuación lineal

2. FORMA

(∑ ) (∑ )(∑ )

, (∑ ) (∑ ) -

( ) ( )( )

, ( ) ( ) -

( )

Ecuación lineal = y= 42.86-0.36x

3. FORMA

∑

( )( )

∑

( )

( )

Ecuación lineal y = 42.86-0.36x

CRONOGRAMA DE ACTIVIDADES DEL PRIMER CAPÍTULO:

Tiempo Actividades

MARZO ABRIL MAYO


1 2 3 4 1 2 3 4 1 2 3 4

PRIMERA CLASE


X


x

SEGUNDA CLASE


X


2012

X

TERCERA CLASE


X


X

CUARTA CLASE


x

APRENDIZAJE MEDIADO


Lectura comprensiva de correlación y regresión lineal






Resolver ejercicios relacionados de correlación y regresión lineal

Establecer problemas para la aplicación de de correlación y regresión

lineal


Con datos relacionados a la carrera de comercio exterior aplicar de

correlación y regresión lineal

Resolver ejercicios aplicando correlación y regresión lineal



Investigar otros conceptos de correlación y regresión lineal



Elaboración de mapas conceptuales de de correlación y regresión

lineal

Elaboración proyectos para una mayor comprensión de los

conceptos de de correlación y regresión lineal


Realizar ejercicios relacionados de correlación y regresión lineal.

Resolver problemas relacionados de correlación y regresión lineal.


Investigar los datos de de comercio exterior de correlación y

regresión lineal

CAPÍTULO

III

PRUEBA DE HIPÓTESIS

Hipótesis Estadística

Se llama hipótesis, a una suposición o conjetura; que se formula, con el

propósito de ser verificada. Cuando se establece la veracidad de una hipótesis,

se adquiere el compromiso de verificada en base a los datos de la muestra

obtenida. La hipótesis estadística es fundamentalmente distinta de una

proposición matemática, debido que al decidir sobre su certeza podemos tomar

decisiones equivocadas, mientras que en la proposición matemática podemos

afirmar categóricamente si es verdadera o falsa.

Hipótesis Nula

Es una hipótesis que afirma lo contrario de lo que se quiere probar. En ella se

supone que el parámetro de la población que se está estudiando, tiene

determinado valor. A la hipótesis nula, se le representa con el símbolo Ho, y se

formula con la intención de rechazarla.

Ejemplo: Para decidir que una moneda está cargada, suponemos lo contrario,

es decir, que la moneda es legal, esto es, que tiene igual probabilidad o

proporción de salir cara, que de salir sello. Llamamos P (proporción poblacional

de cara) y Q (proporción poblacional de sello), P +Q = 1 (proporción del total o

100% de los casos); pero la moneda es legal, entonces esperamos que P = Q,

reemplazando P por Q, P + P = 1, 2P = 1 y P = 0.5, es decir, la proporción

poblacional de éxito (cara), para todas las monedas legales es 0.5. Sobre esta

base, durante la ejecución del experimento, aceptamos que actúan únicamente

las leyes del azar, descartando la influencia de cualquier otro factor.

Hipótesis Alternativa

Es una hipótesis diferente de la hipótesis nula. Expresa lo que realmente

creemos es factible, es decir, constituye la hipótesis de investigación. Se le

designa por el símbolo . En el ejemplo citado, la hipótesis alternativa sería:

: P ≠ 0.5, es decir, P > 0.5 o P < 0.5, si es que queremos realmente

averiguar que la moneda no es legal.

Concepto de significación en una Prueba Estadística

Suponiendo que está formulada una hipótesis y que al realizar un experimento

para someterla a prueba encontramos que el estadístico de la muestra, difiere

marcadamente del valor del parámetro que establece la hipótesis nula , en

ese caso, decimos que la diferencias encontradas son significativas y estamos

en condiciones de rechazar la hipótesis nula o, al menos no aceptarla en

base a la muestra obtenida.

En realidad estamos determinando, si la diferencia, entre el valor del parámetro

establecido en y el valor del estadístico obtenido en la muestra, se debe tan

solo al error de muestreo (en este caso aceptamos ); o si la diferencia es tan

grande que el valor obtenido por el estadístico de la muestra, no es fruto del

error de muestreo, en este caso rechazamos .

Prueba de Hipótesis

Se le llama también ensayo de hipótesis o dócima de hipótesis. Son

procedimientos que se usan para determinar, se es razonable o correcto,

aceptar que el estadístico obtenido en la muestra, puede provenir de la

población que tiene parámetro, el formulado en .

Como resultado de la prueba de hipótesis, aceptamos o rechazamos . Si

aceptamos , convenimos en que el error de muestreo (el azar), por sí solo,

puede dar lugar al valor al estadístico que origina la diferencia entre éste y el

parámetro. Si rechazamos , convenimos que la diferencia es tan grande, que

no es fruto del error de muestreo (al azar) y concluimos que el estadístico de la

muestra no proviene de una población que tenga el parámetro estudiado.

El mecanismo para rechazar la hipótesis , es el siguiente: suponemos como

válida la hipótesis nula , la que afirma que el parámetro tiene cierto valor

(supongamos el caso de la media poblacional entonces : ʯ = . Tomamos

una muestra y calculamos el estadístico de la muestra (para el caso de la

media el estadístico es la media muestral x ). Como suponemos que es

cierta, podemos suponer que la muestra proviene de la población que tiene

como parámetro el de (es decir, no serán muy diferentes) y la

probabilidad de que dicha diferencia muestral pequeña aparezca, será grande.

Si en cambio tomamos una muestra de una población que no tiene como

parámetro , en dicho caso el valor de x - , será grande, (x será muy

distinto que ), es decir, dicha diferencia será significativa, y la probabilidad de

obtener dicha diferencia muestral al muestrear, será pequeña. Necesitamos un

estándar, es decir, un valor tal que, al comparar con l la probabilidad de

obtener una diferencia entre x y , nos permita aceptar o rechazar .

Llamemos a este valor el nivel de significación. Este será tal que, si la

probabilidad de la diferencia entre x y es muy pequeña (menor que ),

rechazaremos y la muestra aleatoria no proviene de la población con

parámetro ; si la probabilidad de la diferencia entre x - es grande (mayor

que ) aceptamos y la muestra aleatoria proviene de la población con

parámetro .

Cuando se toma la decisión de rechazar o aceptar la hipótesis , se corre el

riesgo de equivocarse (recuerde que nos hemos referido a la probabilidad de

obtener una diferencia entre x y y no de un hecho establecido), es decir, de

cometer errores.

Estos posibles errores son:

Error tipo I

Consiste en rechazar la hipótesis , cuando en realidad no debería ser

rechazada, por ser verdadera. La probabilidad de cometer el error tipo I, se

llama alfa ( ).

Error tipo II

Consiste en no rechazar a hipótesis Ho, cuando debería ser rechazada por ser

falsa. La probabilidad de cometer el error tipo II, se llama beta (β).

Se debe procurar que la probabilidad de los errores tipo I y tipo II, sean las más

pequeñas posibles, sin embrago, para un tamaño de muestra dado, el querer

disminuir un tipo de error, trae consigo, incrementar el otro tipo de error. La

única forma de disminuir ambos errores, es aumentar el tamaño de la muestra.

Nivel de significación de una Prueba Estadística.

En relación a la comprobación de una hipótesis dada, se llama nivel de

significación, a la probabilidad a de cometer el error tipo I, al rechazar la

hipótesis nula Ho.

Los niveles de significación más usados en la práctica son: de 0.05 (5%) y de

0.01 (1%).

El nivel de significación de 5% se interpreta de la siguiente manera: en 100

casos, cabe esperar, que en 5 de ellos se cometa una decisión equivocada, al

rechazar la hipótesis Ho, cometiendo, en consecuencia, un error de tipo I.

Pasos de una Prueba de Hipótesis

1o Formular la Ho y la H1

2o Determinar si la prueba es unilateral o bilateral.

3o Asumir el nivel de significación de la prueba.

4oDeterminar la distribución muestral que se usara en la prueba.

5o Elaborar el esquema de la prueba.

6o Calcular el estadístico de la prueba.

7o Tomar la decisión, para esto, se comparan el esquema de la parte.

5o, con el estadístico del paso 6o.

Ejemplo de una prueba de hipótesis utilizando los pasos anteriores.

Se realiza el experimento aleatorio de lanzar 50 veces una moneda,

obteniéndose 34 veces el resultado cara. Al nivel de significación de 5%, se

quiere averiguar si la moneda está cargada.

1) Ho: P= 0.5, la moneda no está cargada.

H1: P≠ 0.5 la moneda está cargada (P>0.5 ó P<0.5).

2) La prueba debe ser bilateral o de dos colas, porque hay dos

posibilidades en la H1:

a) Si se obtiene muchas veces cara, entonces la moneda está cargada

de un lado (P>0.5).

b) Si se obtiene pocas veces cara, entonces la moneda está cargada

del otro lado (P<0.5).

3) Asumimos el nivel de significación de 5%, con lo que estamos

aceptando de que con la probabilidad de 0.05, puede ocurrir que se

rechace Ho, a pesar de ser verdadera; cometiendo por lo tanto el error

de tipo I. la probabilidad de no rechazar Ho, será de 0.95.

4) Determinar la distribución muestral que se utilizara en la prueba.

Tenemos por dato muestral la proporción

, el parámetro de Ho, es la

proporción poblacional P; entonces utilizaremos la distribución muestral

de proporciones para describir la variación de las muestras por el error d

muestreo. Tamaño de muestra n= 50> 30. (Muestra grande)

aproximaremos la distribución muestral de proporciones, mediante la

distribución normal, porque n=50> 30.

5) Esquema de la prueba: En la distribución normal de probabilidades

estandarizadas, para el nivel de significación de 5%, el nivel de

confianza será de 95%, entonces los coeficientes críticos o coeficientes

de confianza para la prueba bilateral serán: -1.96 1.96, es decir -1.96 ≤ z

≤ 1.96.

El esquema correspondiente es:

Si al realizar el experimento y calcular el puntaje estandarizado Z, encontramos

que Z cae fuera del intervalo -195 ≤ z ≥ 1.96, esto indicara que se debe

rechazar H˳

Si por el contrario Z cae dentro del intervalo ya mencionado, eso indicara que

no debemos rechazar H˳

Vemos que hay dos regiones e rechazo, por eso la prueba se llama prueba

bilateral o de dos colas.

6) Cálculo de Z. utilizando la fórmula 5.3.2

Donde Xi corresponde en este caso a la producción de la muestra: p`

: es la medida de la distribución muestral de proporciones, igual a la

proporción poblacional P de H˳

: es la desviación estándar de la distribución muestral de proporciones,

llamada también error estándar de la proporción: p`

Ejemplo de Prueba de una Cola o Unilateral.

Un laboratorio afirma que uno de sus productos tiene 905 de efectividad para

curar una enfermedad. En una muestra de 200 persona de aliviaron 160.

Determinar que a afirmación no es cierta, es decir, la medicina cura meno del

90% de los casos. Sea el nivel de significación 0.05.

1) .- H˳: P = 0.90 P, proporción poblacional de éxito.

H1: P < 0.90 Es lo que queremos probar.

2) .- Habrá una sola región de rechazo o región crítica y es aquella en la

que la proporción de personas curadas por la medicina es menor que

0.90; luego se trata de una prueba unilateral, o de una sea cola; en esta

caso de cola izquierda, que es la dirección a la que apunta la

desigualdad de H1.

3) Asumiendo el nivel de significación de 5% (0.05), en la distribución

normal de probabilidades estandarizada se tiene el coeficiente critico de

Z= -1.65.

4) Como el dato es una proporción muestral, y en Ho hay una proporción

poblacional, usaremos la distribución muestral de proporciones.

5) El esquema de la prueba es:

6)

´P = Proporción de la muestra =

P = Proporción de la población P = 0.9

Grados de libertad: el termino libertad se refiere a libertad para variar y recoger

datos de la muestra. Analicemos la fórmula para la desviación estándar

corregida

√∑( )

Para calcular la desviación estándar es necesario estimar la media poblacional

û mediante x= u, es decir se eta estimando un parámetro poblacional por lo

tanto por grados de libertad serán n-1. Al querer calcular la desviación estándar

ha disminuido en uno la libertad de escoger los datos, por haber estimado un

parámetro, la media poblacional.

En la prueba de student de diferencia de medidas, se estimaran dos medias

poblacionales de cada una de las dos poblaciones de las cuales se toman los

datos, para calcular las dos medias. Los grados de libertad serán n1+n2-2

donde n1 es el tamaño de la muestra 1, tomada de la población 1 y n2 es el

tamaño de la muestra tomada de la población 2.

Los grados de libertad están representados por la siguiente formula

Gl=n-k

N: numero de observaciones independientes

K: numero de parámetros estimados

Distribución de Student

Cuando:

i) el tamaño de la muestra es pequeño y este es menor que 30

ii) la población de donde se obtienen los datos está distribuida normalmente

iii) se desconoce la desviación estándar de la población entonces haremos uso

de la distribución de Student

La distribución de Student está representada por el estadístico t:

√

El estadístico z de la distribución normal era

√

En el denominador de t tenemos s, que varía de muestra en muestra. En el

denominador de z tenemos o , la desviación estándar de la población que es

una constante; t sigue una distribución de Student con n-1 grados de libertad,

los valores de t se pueden encontrar en la tabla correspondiente en el apéndice

de este libro. Existe un valor específico para cada grado de libertad asociado

con un determinado nivel de significación.

La grafica de la distribución de Student es mas aplanada que la distribución

normal Z.

Ejemplo de prueba de una media utilizando la distribución de student

Se aplico un test de inteligencia a una muestra de 15 alumnos de un salón de

clase de cierto Colegio y se determino un CI promedio de 105.4 con una

desviación estándar de 5.3. Se saber que al estandarizar el mencionado test en

los colegios secundarios de la localidad, se hallo un CI medio de 101.

Asumiendo un nivel de significación de 1% probar que el rendimiento mental

del grupo de 15 alumnos, es más alto que el promedio de estandarización del

test.

U= rendimiento mental medio de estandarización = 101

X= rendimiento mental medio de la muestra = 105,4

1) formulación de la hipótesis

H0:µ = 101, no existe diferencias significativas en el rendimiento mental, de la

muestra X y de la población

H1: µ= >101

2) prueba unilateral de cola derecha, de acuerdo con H1,

3) Nivel De Significación Asumido: 1% = 0.01

4) Distribución aplicable para la prueba

Considerando que los datos son la media de la muestra X y la media

poblacional µ, se debe reutilizar la distribución maestral de medias, además

como n <30 (muestra pequeña) y se desconoce 0 (desviación estándar de la

Distribución

de student

Distribución

normal

población) se empleara la distribución de student, ya que ese sabe los valores

de CI siguen una distribución normal.

5) Esquema grafico de la prueba

El nivel de significación es a = 0.01

Los grados de libertad son:

Gi= n-1 = 15 – 1=14g. de lib

En la tabla de distribución de student, con 14gl, a = 0.01 y prueba de 1 cola,

encontramos el t crítica: tc =2.624

6) Cálculo del estadístico de la prueba

Datos

X= 105.4 ; µ = 101 ; s= 5.3 ; n= 15

7) toma de decisiones

Observamos que t=3.11 se ubica en la región de rechazo por tanto se descarta

que µ = 101 y se acepta la alternativa µ > 101 es decir el grupo de 15 alumnos

tiene rendimiento mental mayor que el promedio de estandarización.

Ejemplo:

Una tableteadora de un laboratorio farmacéutico produce comprimidos de cierto

medicamento, con un peso medio de 2grs. Por comprimido. Para determinar si

la maquina sigue en buenas condiciones de producción, se tomó una muestra

de 10 tabletas cuyos pesos en gramos son: 2.04; 1.96; 2.00; 1.98: 2.02; 2.01;

1.97; 1.94; 2.03; 2.01, asumiendo un nivel de significación de 0.01, verificar que

la maquina no está en

Buenas condiciones de producción.

Llamemos:

µ: el peso medio de las tabletas producidas por la máquina.

1) Formulación de hipótesis

H0: µ= 2, la maquinas se halla en buenas condiciones.

H1: µ ≠ 2, la maquina no se halla en buenas condiciones

2) Prueba bilateral porque en H1 hay dos posibilidad

µ>2 o µ< 2

3) Nivel de significación , s4e asume el 1% = 0.01

4) Distribución de probabilidad apropiada para la prueba.

Considerando que las hipótesis se refieren a medios poblacionales, que se

da como dato el valor de la media población µ= 2grs, y que se puede

calcular la media de la muestra, utilizaremos la distribución muestral de las

medias para efectuar la prueba. Siendo la muestra pequeña (n= 10) y la

desviación de student o de la población desconocida, no es aplicable la

distribución normal y por tanto recurridos a la distribución de student,

asumiendo que la población.

Un laboratorio afirma que uno de sus productos tiene el 90% de

efectividad para curar una enfermedad. En una muestra de 200

personas se aliviaron 160. Determinar que la afirmación no es

cierta, es decir que la medicina cura menos del 90% de los casos.

Si el nivel de significancia (error de estimación) es del 0,05

1.- HALLAR H0 Y HA

2.- DETERMINAR LA CAMPANA DE GAUSS

Es unilateral de una cola

3.- DETERMINAR EL VALOR DE CONFIANZA

4.- DETERMINAR EL VALOR DE n

5.- GRAFICAR LA CAMPANA DE GAUSS

6.- CALCULAR EL VALOR DE Z

= 0,80

√

√( )( )

7.- rechazo de la hipótesis nula y aceptación de la hipótesis alternativa, porque

los medicamentos curan menos del 90% a los pacientes.

Una muestra de 80 alambres de acero producidos por la Fábrica A,

da una resistencia media a la rotura de 1230lobras con una

desviación estándar de 120 libras. Una muestra de 100 alambres de

acero producidos por la Fábrica B da una resistencia media a la

rotura de 1190 libras con una desviación estándar de 90 libras.

¿Hay una diferencia real en la resistencia media de las dos marcas

de alambre de acero, si el nivel de confianza es el 95%?

1.- DETERMINAR LA HO Y LA HA.

Ho: U1 = U2

Ha: U1 U2


La campana de gauss es bilateral de 2 colas

3.- DETERMINAR EL VALOR DE CONFIANZA

Nivel de significancia o E.E. = 0,05

Z =1,96 valor estandarizado

4.- DETERMINAR QUÉ TIPO DE MUESTRA SE UTILIZA

n 1 = 80 n > 30

n 2 = 100 n > 30 Prueba de Hipótesis

5.- CONSTRUIR LA CAMPANA DE GAUSS

6.- CALCULAR EL PUNTAJE Z

1 = 1230 S1 = 120

2 = 1190 S2 = 90

√

√

√

√

√

7.- Rechazo la hipótesis nula y acepto la hipótesis alternativa. La rotura de los

alambres de la Fábrica A es diferente a la rotura de los alambres de la Fábrica

B.

Los salarios diarios de una industria particular tiene una

distribución normal con media de 23,20 dólares y una desviación

estándar de 4,50 dólares. Si una compañía de esta industria emplea

40 trabajadores, les paga un promedio de 21,20 dólares. ¿Puede se

acusada esta compañía de pagar salarios inferiores con un nivel de

significancia del 1%?

1.- DETERMINAR LA HO Y LA HA.

Ho: U = 23,20

Ha: U > 23,20


La campana de gauss es de una cola

3.- NIVEL DE CONFIANZA = 99%

4.- DETERMINAR QUÉ TIPO DE MUESTRA SE UTILIZA

5.- CONSTRUIR LA CAMPANA DE GAUSS

6.- CALCULAR EL PUNTAJE Z

√

√

√

7.- Rechazo la hipótesis nula y acepto la hipótesis alternativa. No está pagando

a los trabajadores lo que les corresponde entonces debe entrar a un juicio para

resolver este inconveniente.

EJERCICIO PLANTEADO

Según una encuesta realizada se afirma que la exportación de petróleo crudo

tiene el 95% de efectividad para comercializarse en el mercado internacional.

En una muestra de 45 países a los que se envía el petróleo ecuatoriano, se

reflejaron que 35 países los más grandes importadores de petróleo tienen

ventas elevadas. Determinar que la afirmación no es cierta, es decir que la

exportación de petróleo se comercializa en menos del 95%. Si se tiene un nivel

de significancia del 0,05.

1. Ho: U = 95%

Ha: U < 95%

2. La campana de Gauss es de una cola

3. α = 95%

Error de Estimación: 0,05

Z = -1,65

4. n = 45 n > 30 Prueba de Hipótesis

5. Construir Campana de Gauss

6.

√

√( )( )

7. Rechazo la hipótesis nula y acepto la hipótesis alternativa.

Las exportaciones de petróleo que el Ecuador realiza a diferentes países

se comercializan en más del 95%, por lo que el país puede continuar

realizando sus exportaciones al exterior.

DISTRIBUCIÓN T-STUDENT

En probabilidad y estadística, la distribución t-Student es una distribución de

probabilidad que surge del problema de estimar la media de una población

normalmente distribuida cuando el tamaño de la muestra es pequeño.

Una variable aleatoria se distribuye según el modelo de t-Student con n grados

de libertad, donde n es un entero positivo, si su función de densidad es la

siguiente:

f(t)=

)1(2

12

)1(

)2

(

)2

1(

n

n

t

nn

n

, - t ,

0

1)( dxexp xp

siendo p>0

La gráfica de esta función de densidad es simétrica respecto del eje de

ordenadas, con independencia del valor de n, y de forma semejante a la

distribución normal.

Propiedades:

1. La media es 0 y su varianza 2n

n

, n>2.

2. La gráfica de la función de densidad es en forma de campana.

3. Los datos están más disperso que la curva normal estándar.

4. A medida que n aumenta, la gráfica se aproxima a la normal N(0,1).

5. La gráfica es muy parecida a la de la normal estándar diferenciándose

en que las colas de t están por encima de la normal, y el centro se

encuentra por debajo del de la normal.

6. Cuando los grados de libertad son altos, los valores de t coinciden con

los de la normal.

Ejercicio: La empresa de transporte pesado TRANSURGIR de la ciudad de

Tulcán adquirió camines nuevos que cargan un peso aproximado a 15

toneladas cada uno para determinar si esta afirmación es verdad se tomo una

muestra de 7 camiones con repletos de carga cuya carga pesaba; 15,04tonn,

14,96tonn, 15tonn, 14,98tonn, 15,2tonn, 15,1tonn y 14,96tonn. Asumiendo un

nivel de significancia de 0,01 verificar que los camiones si cumplen con el peso

establecido.

1) Ho: u=15tonn

Ha: u≠2 u es diferente de dos

2) Bilateral

3) 99% 0,01 gl=n-1

gl= 10-1= 9

t=±3,250

4) n˂30 T-student

5) GRAFICA

√∑( )

6) –

√

–

√

Xi (Xi-X) (Xi-X)2

15,04 0,006 0,000032653

14,96 -0,074 0,005518367

15 -0,034 0,00117551

14,98 -0,054 0,002946939

15,2 0,166 0,027461224

15,1 0,066 0,004318367

14,96 -0,074 0,005518367

105,24

-

0,000000000000008881784197 0,046971429

7) Aceptamos la hipótesis nula y rechazamos la hipótesis alternativa ya

que el peso que puede transportar cada camión se encuentra en la

zona de aceptación.

Ejercicio. Un fabricante de focos afirma que su producto durará un promedio de 500

horas de trabajo. Para conservar este promedio esta persona verifica 25 focos cada

mes. Si el valor y calculado cae entre –t 0.05 y t 0.05, él se encuentra satisfecho con

esta afirmación. ¿Qué conclusión deberá él sacar de una muestra de 25 focos cuya

duración fue?:

PROYECTO Nª5

TEMA: PRUEBA DE HIPÓESIS

PROBLEMA: El escaso conocimiento de la prueba de hipótesis no ha

permitido a los estudiantes resolver problemas

OBJETIVOS

OBJETIVO GENERAL:

Aplicar los conocimientos de la prueba de hipótesis para resolver

problemas de Comercio Exterior


Investigar la prueba de hipótesis para resolver problemas de Comercio

Exterior

Conocer la prueba de hipótesis para resolver problemas de Comercio

Exterior

Analizar la prueba de hipótesis para resolver problemas de Comercio

Exterior

JUSTIFICACION

El presente trabajo se lo ha realizado con el fin de obtener información

acerca de la prueba de hipótesis para de esta manera contribuir en nuestro

conocimiento y de esta forma tener claro los ámbitos de aplicación para

resolver problemas que puedan existir en el Comercio Exterior. La prueba

de hipótesis nos permite hacer cálculos y determinar de esta manera la

factibilidad de un proyecto a través de un resultado expresado en

porcentajes para de esta manera lograr determinar los puntos clave del

proyecto o tema de investigación y así lograr obtener un buen resultado. El

tema de prueba de hipótesis nos permite aplicarlo en el Comercio exterior al

momento que se quiera determinar la factibilidad de negociación con una u

otra empresa internacional y de esta manera obtener el mejor resultados.

Además es importante conocer acerca de este tema porque nos ayuda a

verificar si podemos hacer una importación de determinado producto o una

exportación y si sería favorable realizarlo.

MARCO TEORICO

PRUEBA DE HIPÓESIS

Hipótesis: Es un conjunto o que puede ser aceptado o negado. Permite

determinar si un proyecto es viable o no.

Una prueba de hipótesis consiste en contrastar dos hipótesis estadísticas. Tal

contraste involucra la toma de decisión acerca de las hipótesis. La decisión

consiste en rechazar o no una hipótesis en favor de la otra. Una hipótesis

estadística se denota por ―H‖ y son dos.

La hipótesis nula “Ho”

Ho: Hipótesis nula: es un supuesto que determina una igualdad.

Se refiere siempre a un valor específico del parámetro de la población, no a

una estadística de muestra. La letra H significa hipótesis y el subíndice cero no

hay diferencia. Por lo general hay un ―no‖ en la hipótesis nula que indica que

―no hay cambio‖ Podemos rechazar o aceptar Ho.

U = 70%

U 70%

U < 70%

U > 70%

La hipótesis alternativa “Ha”

Es cualquier hipótesis que difiera de la hipótesis nula. Es una afirmación que se

acepta si los datos muestrales proporcionan evidencia suficiente de que la

hipótesis nula es falsa. Se le conoce también como la hipótesis de

investigación. El planteamiento de la hipótesis alternativa nunca contiene un

signo de igualdad con respecto al valor especificado del parámetro.

Nivel de significancia

Probabilidad de rechazar la hipótesis nula cuando es verdadera. Se le denota

mediante la letra griega , tambi n es denominada como nivel de riesgo, este

término es mas adecuado ya que se corre el riesgo de rechazar la hipótesis

nula, cuando en realidad es verdadera.

La distribución de muestreo de la estadística de prueba se divide en dos

regiones, una región de rechazo (conocida como región crítica) y una región

de no rechazo (aceptación). Si la estadística de prueba cae dentro de la región

de aceptación, no se puede rechazar la hipótesis nula. Estos valores no son tan

improbables de presentarse si la hipótesis nula es falsa. El valor crítico separa

la región de no rechazo de la de rechazo.

Aquel que va a marcar valores que se van a la derecha o a la izquierda.

Error de la desviación estándar

Media aritmética de valores actuales

Media aritmética de valore antiguos

Un laboratorio afirma que uno de sus productos tiene el 90% de efectividad

para curar una enfermedad. En una muestra de 200 personas se aliviaron 160.

Determinar que la afirmación no es cierta, es decir que la medicina cura menos

del 90% de los casos. Si el nivel de significancia (error de estimación)es del

0,05.

Z 0 1 2 3 4 5 6 7 8 9

0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359

0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753

0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141

0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517

0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879

0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224

0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549

0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852

0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133

0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389

1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621

1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830

1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015

1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177

1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319

1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441

1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545

1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633

1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706

1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767

2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817

2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857

2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890

2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916

2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936

2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952

2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964

2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974

2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981

2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986

3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990

3.1 0.4990 0.4991 0.4991 0.4991 0.4992 0.4992 0.4992 0.4992 0.4993 0.4993

3.2 0.4993 0.4993 0.4994 0.4994 0.4994 0.4994 0.4994 0.4995 0.4995 0.4995

3.3 0.4995 0.4995 0.4995 0.4996 0.4996 0.4996 0.4996 0.4996 0.4996 0.4997

3.4 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4997 0.4998

3.5 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998 0.4998

3.6 0.4998 0.4998 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999

3.7 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999

3.8 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999 0.4999

3.9 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000 0.5000

Tabla 1. Tabla de áreas bajo la curva normal

z = 1.96 para un 95% de confianza o z= 1.65 para el 90% de confianza

TABLA DE APOYO AL CALCULO DEL TAMAÑO DE UNA MUESTRA

POR NIVELES DE CONFIANZA

Certeza 95% 94% 93% 92% 91% 90% 80% 62.27% 50%

Z 1.96 1.88 1.81 1.75 1.69 1.65 1.28 1 0.6745

3.84 3.53 3.28 3.06 2.86 2.72 1.64 1.00 0.45

e 0.05 0.06 0.07 0.08 0.09 0.10 0.20 0.37 0.50

0.0025 0.0036 0.0049 0.0064 0.0081 0.01 0.04 0.1369 0.25

EJERCICIOS

La calificación de un grupo de estudiantes en el examen parcial (x) y en

el examen final (y), fueron las siguientes.

x y

x y

X y

x y

12 15

18 20

15 17

13 14

8 10

12 14

12 15

10 13

10 12

10 12

11 12

12 15

13 14

12 10

12 13

13 14

9 12

14 16

11 12

12 13

14 15

9 11

10 13

16 18

11 16

10 13

14 12

15 17

a) Determinar la ecuación de regresión lineal de Y en X

X y xy X2 Y2 (xi-x) (xi-x)2 (yi-y) (yi-y)2

12 15 180 144 225 0 0 -1 1

8 10 80 64 100 4 17 4 15

10 12 120 100 144 2 4 2 3

13 14 182 169 196 -1 1 0 0

9 12 108 81 144 3 9 2 3

14 15 210 196 225 -2 4 -1 1

11 16 176 121 256 1 1 -2 5

18 20 360 324 400 -6 35 -6 38

12 14 168 144 196 0 0 0 0

10 12 120 100 144 2 4 2 3

12 10 120 144 100 0 0 4 15

14 16 224 196 256 -2 4 -2 5

9 11 99 81 121 3 9 3 8

10 13 130 100 169 2 4 1 1

15 17 255 225 289 -3 9 -3 10

12 15 180 144 225 0 0 -1 1

11 12 132 121 144 1 1 2 3

12 13 156 144 169 0 0 1 1

11 12 132 121 144 1 1 2 3

10 13 130 100 169 2 4 1 1

14 12 168 196 144 -2 4 2 3

13 14 182 169 196 -1 1 0 0

10 13 130 100 169 2 4 1 1

12 15 180 144 225 0 0 -1 1

13 14 182 169 196 -1 1 0 0

12 13 156 144 169 0 0 1 1

16 18 288 256 324 -4 15 -4 17

15 17 255 225 289 -3 9 -3 10

338 388 4803 4222 5528 142 151

∑

∑

∑ ∑ ∑

∑ (∑ )

( ) ( )( )

( ) ( )

( )

El gerente de personal de la empresa P&C quiere estudiar la relación

entre el ausentismo y la edad de sus trabajadores. Tomo una muestra

aleatoria de 10 trabajadores de la empresa y encontró los siguientes

datos.

Edad (año) 25 46 58 37 55 32 41 50 23 60

Ausentismo (días por

año)

18 12 8 15 10 13 7 9 16 6

a) Use el método de mínimos cuadrados para hallar la ecuación muestral

que relaciona las dos variables.

Edad (años) Ausentismo

x Y X Y X2 Y2 (xi- ) (xi- )2 (yi- ) (yi- )2

25 18 450 625 324 -17,7 313,29 6,6 43,56

46 12 552 2116 144 3,3 10,89 0,6 0,36

58 8 464 3364 64 15,3 234,09 -3,4 11,56

37 15 555 1369 225 -5,7 32,49 3,6 12,96

55 10 550 3025 100 12,3 151,29 -1,4 1,96

32 13 416 1024 169 -10,7 114,49 1,6 2,56

41 7 287 1681 49 -1,7 2,89 -4,4 19,36

50 9 450 2500 81 7,3 53,29 -2,4 5,76

23 16 368 529 256 -19,7 388,09 4,6 21,16

60 6 360 3600 36 17,3 299,29 -5,4 29,16

427 114 4452 19833 1448 1600,1 148,4

∑ ∑ ∑

∑ (∑ )

∑

∑

( ) ( )( )

( ) ( )

( )

b) Calcule el coeficiente de determinación. De su comentario sobre el

ajuste de la línea de regresión a los datos de la muestra.

∑ ∑ ∑

√( ∑ (∑ ) ), ∑ (∑ ) -

( ( )( )

√( ∑ (∑ ) ), ∑ ( )-

√( )( )

En la gráfica se puede observar que se obtiene una regresión lineal negativa y

los puntos de dispersión no se encuentran tan dispersos a la línea.

En un estudio para determinar la relación entre edad (X) y presión

sanguínea (Y) una muestra aleatoria de 9 mujeres ha dado los

siguientes resultados.

x 54 40 70 35 62 45 55 50 38

y 148 123 155 115 150 126 152 144 114

a) Encuentre la ecuación de regresión de Y en X y estime la presión sanguínea

para una mujer de 75 años.

b) Utilizando t-Student pruebe la hipótesis B=0.9, contra la hipótesis B > 0,9 al

nivel de significación a=0.05

c) Pruebe la hipótesis nula Ho: p=0,9 contra H1: p > 0.9

Número Edad(X) Presión (Y) X2 Y2 X*Y (X-X)2 (Y-Y)2

1 54 148 2916 21904 7992 16,90 136,11

2 40 123 1600 15129 4920 97,79 177,78

3 70 155 4900 24025 10850 404,46 348,44

4 35 115 1225 13225 4025 221,68 455,11

5 62 150 3844 22500 9300 146,68 186,78

6 45 126 2025 15876 5670 23,90 106,78

7 55 152 3025 23104 8360 26,12 245,44

8 50 144 2500 20736 7200 0,01 58,78

9 38 114 1444 12996 4332 141,35 498,78

449 1227 23479 169495 62649 1078,89 2214,00

∑

∑

∑

( )( )

√∑( )

√

√∑ ( )

√

∑

( )

( )( )

Ecuación lineal de las dos variables.

∑ ∑ ∑

√( ∑ (∑ ) )[ ∑ (∑ ) ]

( ( )( )

√( ∑ ( ) )[ ∑ ( ) ]

√( )( )

Diagrama de dispersión en el plano cartesiano

PASOS DE UNA PRUEBA DE HIPOTESIS

Primer paso formular la hipótesis nula y la hipótesis alternativa

Hipótesis nula

Ho = β=0

La hipótesis alternativa

0

10

20

30

40

50

60

70

80

0 200 400 600 800 1000 1200 1400

Series1

Ha= β<0; β>0

Segundo paso determinar si la prueba es unilateral o bilateral

Bilateral

Tercer paso Asumir el nivel se significación de la prueba

99% 2.58

Cuarto paso determinar la distribución muestral que se usara en la prueba

Quinto paso elaborar el esquema de la prueba

-2.58 +2.58

Sexto paso calcular el estadístico de la prueba

√

√

√

√ ( )

En un estudio para determinar la relación entre edad (X) y presión

sanguínea (Y) una muestra aleatoria de 9 mujeres ha dado los

siguientes resultados:

X 54 40 70 35 62 45 55 50 38 Y 148 123 155 115 150 126 152 144 114

a) Halle la ecuación de regresión de Y en X y estime la presión sanguínea

para una mujer de 75 años.

b) Utilizando t-Student pruebe la hipótesis , contra la hipótesis

.9 al nivel de significación .

c) Pruebe la hipótesis contra

a) Determinar la ecuación lineal de las dos variables.

Desarrollo

Primer caso

.

/ .

/

X=∑

Y=∑

∑ ∑ ∑

√( ∑ (∑ ) ), ∑ (∑ ) -

( ) ( )( )

√( ( ) ( ) )( ( ) ( ) )

√

√∑( )

√

( )

X Y X Y X2 Y2(xi-x) (xi-x)2 (yi-y) (yi-y)2

54 148 7992 2916 21904 4,11 16,90 11,67 136,11

40 123 4920 1600 15129 -9,89 97,79 -13,33 177,78

70 155 10850 4900 24025 20,11 404,46 18,67 348,44

35 115 4025 1225 13225 -14,89 221,68 -21,33 455,11

62 150 9300 3844 22500 12,11 146,68 13,67 186,78

45 126 5670 2025 15876 -4,89 23,90 -10,33 106,78

55 152 8360 3025 23104 5,11 26,12 15,67 245,44

50 144 7200 2500 20736 0,11 0,01 7,67 58,78

38 114 4332 1444 12996 -11,89 141,35 -22,33 498,78

449 1227 62649 23479 169495 0,00 1078,89 0,00 2214

√∑( )

√

( )

.

/ .

/

(

) (

)

Para una persona de 75 años vamos a encontrar la presión sanguínea.

( )

El gerente de ventas de una cadena de tiendas obtuvo información de

los pedidos por internet y del número de ventas realizadas por esa

modalidad. Como parte de su presentación en la próxima reunión de

vendedores al gerente le gustaría dar información específica sobre la

relación entre el número de pedidos y el número de ventas realizadas.

TIENDA 1 2 3 4 5 6 7 8 9 10

NÚMERO

DE

PEDIDOS

50

56

60

68

65

50

79

35

42

15

NÚMERO

DE

VENTAS

45

55

50

65

60

40

75

30

38

12

a) Use el método de mínimos cuadrados para expresar la relación entre

estas dos variables.

b) Haga un análisis de los coeficientes de regresión.

c) ¿Proporcionan los datos suficiente evidencia para indicar que las

unidades producidas aportan información para producir los gastos

generales?

d) Realice un análisis de la bondad del ajuste de la ecuación de regresión

lineal.

e) ¿Qué puede usted concluir acerca de la correlación poblacional entre

gastos generales y unidades producidas?

Desarrollo

TIENDA NÚMERO

DE PEDIDOS

NÚMERO DE

VENTAS XY X2 X-X (X-X)2 Y2 Y-X (Y-X)2

1 50 45 2250 2500 -2 4 2025 -2 4

2 56 55 3080 3136 4 16 3025 8 64

3 60 50 3000 3600 8 64 2500 3 9

4 68 65 4420 4624 16 256 4225 18 324

5 65 60 3900 4225 13 169 3600 13 169

6 50 40 2000 2500 -2 4 1600 -7 49

7 79 75 5925 6241 27 729 5625 28 784

8 35 30 1050 1225 -17 289 900 -17 289

9 42 38 1596 1764 -10 100 1444 -9 81

10 15 12 180 225 -37 1369 144 -35 1225

TOTAL 520 470 27401 30040 0 3000 25088 0 2998

X=

Y=

∑ ∑ ∑

√( ∑ (∑ ) ), ∑ (∑ ) -

( ) ( )( )

√( ∑ ( ) ), ∑ ( )-

√( )( )

√( )( )

√

√

√∑( )

√

( )

√∑( )

√

( )

∑ ∑ ∑

∑ (∑ )

( ) ( )( )

( ) ( )

( )

-4,324

Ecuación lineal de las dos variables.

PASOS DE UNA PRUEBA DE HIPOTESIS

1. Formular la hipótesis nula y la hipótesis alternativa

Hipótesis nula

Ho = β=0


Ha= β<0; β>0

2. Determinar si la prueba es unilateral o bilateral Bilateral

3. Asumir el nivel se significación de la prueba 95% 1,96

4. Determinar la distribución muestral que se usara en la prueba

Como n es menor que 30 utilizaremos la T de estudent

5. Elaborar el esquema de la prueba

-1.96 +1.96

6. Calcular el estadístico de la prueba

(0,00987)

√

√

√

√ ( )

En este caso la hipótesis nula se acepta. Es decir si existe relación entre el

número de pedidos y las ventas que se realizan en las tiendas.

Con los siguientes datos muestrales

Coeficiente de inteligencia: IQ 135 115 95 100 110 120 125 130 140

Notas de un examen 16 13 12 12 14 14 15 15 18

a) Halle la ecuación de regresión muestral

b) Interprete la pendiente de parcial.

c) Utilizando t-Student pruebe la hipótesis 𝛃 = 0, contra la hipótesis 𝛃>0 al

nivel de significación =0,05. ¿Se puede aceptar que 𝛃=1?

d) El grado de asociación entre las dos variables.

e) Utilizando t-Student pruebe la hipótesis p=0 contra la hipótesis p>0 al

nivel de significación = 0,05

Coeficiente de iteligencia IQ (X)

Notas de un exámen (Y)

( )

135 16 2160 18225 256 16,11 259,57

115 13 1495 13225 169 -3,89 15,12

95 12 1140 9025 144 -23,89 570,68

100 12 1200 10000 144 -18,89 356,79

110 14 1540 12100 196 -8,89 79,01

120 14 1680 14400 196 1,11 1,23

125 15 1875 15625 225 6,11 37,35

130 15 1950 16900 225 11,11 123,46

140 18 2520 19600 324 21,11 445,68

1070 129 15560 129100 1879 1888,89

( )

√ ( )

√

( )

1) Ho= 0

Ha>0

2) Es unilateral con cola derecha

3) NC= 95%

Nivel de significación =0,05

Z= 1,65

4) n < 30 9 < 30 t—Student

5)

Z= 1,65

Zona de rechazo

∑ ∑ ∑

√( ∑ (∑ ) ), ∑ (∑ ) -

( ) ( )( )

√( ( ( ) )( ( ( ) )

X Y XY X2 Y2 X1- (X1- )2 Y1- (Y1- )2

0 64 0 0 4096 -1,0 1,0 -10,8 117,0

1 69 69 1 4761 0,0 0,0 -5,8 33,8

2 94 188 4 8836 1,0 1,0 19,2 368,1

0 55 0 0 3025 -1,0 1,0 -19,8 392,6

1 60 60 1 3600 0,0 0,0 -14,8 219,5

2 92 184 4 8464 1,0 1,0 17,2 295,3

0 70 0 0 4900 -1,0 1,0 -4,8 23,2

1 80 80 1 6400 0,0 0,0 5,2 26,9

2 89 178 4 7921 1,0 1,0 14,2 201,2

0 84 0 0 7056 -1,0 1,0 9,2 84,4

1 82 82 1 6724 0,0 0,0 7,2 51,6

2 99 198 4 9801 1,0 1,0 24,2 584,9

0 73 0 0 5329 -1,0 1,0 -1,8 3,3

1 76 76 1 5776 0,0 0,0 1,2 1,4

2 95 190 4 9025 1,0 1,0 20,2 407,4

0 77 0 0 5929 -1,0 1,0 2,2 4,8

1 56 56 1 3136 0,0 0,0 -18,8 354,0

2 80 160 4 6400 1,0 1,0 5,2 26,9

0 50 0 0 2500 -1,0 1,0 -24,8 615,8

1 50 50 1 2500 0,0 0,0 -24,8 615,8

2 89 178 4 7921 1,0 1,0 14,2 201,2

0 70 0 0 4900 -1,0 1,0 -4,8 23,2

1 65 65 1 4225 0,0 0,0 -9,8 96,3

2 90 180 4 8100 1,0 1,0 15,2 230,6

0 64 0 0 4096 -1,0 1,0 -10,8 117,0

1 67 67 1 4489 0,0 0,0 -7,8 61,1

2 80 160 4 6400 1,0 1,0 5,2 26,9

∑27 ∑2020 ∑2221 ∑45 ∑156310 ∑0,0 ∑18,0 ∑0,0 ∑5184,1

Determine la ecuación de regresión de gastos sobre ingresos

∑

∑

∑ ∑ ∑

√[ ∑ (∑ ) ][ ∑ (∑ )

]

( ) ( )( )

√, ( ) ( ) -, ( ) ( ) -

DESVIACIÓN

√∑( )

√

√∑( )

√

ECUACIÓN

.

/ .

/

.

/ .

/

0

20

40

60

80

100

120

0 0,5 1 1,5 2 2,5

Gas

tos

en

ed

uca

ció

n

Nivel Socioeconomico

ANEXOS

Las cantidades de un compuesto químico (Y) que se disuelve en 100

gramos de agua a diferentes temperaturas (X) se registraron en la tabla

que sigue:

X (ºC) Y gramos

0 15 30 45 60 75

10 15 27 33 46 50

8 12 23 30 40 52

10 14 25 32 43 53

9 16 24 35 42 54

11 18 26 34 45 55

a) Encuentre la ecuación de regresión de Y en X

b) Estime la varianza de la regresión poblacional

c) Determine el coeficiente de regresión estandarizado beta

d) Calcule el error estándar de la pendiente b. Además desarrolle un

intervalo de confianza del 95% para β. ¿Se puede aceptar que β=0.6?

e) Determine un intervalo de confianza del 95% para la cantidad promedio

de producto químico que se disolverá en 100 gramos de agua a 50ºC.

f) Determine un intervalo de predicción del 95% para la cantidad de

producto químico que se disolverá en 100 gramos de agua a 50ºC.

Desarrollo:

X (°C) Y gramos

0 15 30 45 60 75

10 15 27 33 46 50

8 12 23 30 40 52

10 14 25 32 43 53

9 16 24 35 42 54

11 18 26 34 45 55

11,8 15 25

32,8 43,2 52,8

225 180,6

X (°C) Y

gramos

( )

( )

0 11,8 0 0 139,24 1406,25 139,24 15 15 225 225 225 225 225 30 25 750 900 625 900 625 45 32,8 1476 2025 1075,84 2025 1075,84 60 43,2 2592 3600 1866,24 3600 1866,24 75 52,8 3960 5625 2787,84 5625 2787,84

∑ ∑ ∑ ∑ ∑ ∑ ∑

∑

∑

(∑ ) (∑ )(∑ )

√, (∑ ) (∑ ) -, (∑ ) (∑ ) -

( ) ( )( )

√, ( ) ( ) -, ( ) ( ) -

√,( )( )-

√( )( )

√

SEGUNDO MÉTODO

(

) (

)

( ) (

) ( ) (

)

( )( ) ( )( )

√∑( )

√

√

√∑( )

√

√

Primer paso formular la hipótesis nula y la hipótesis alternativa

Hipótesis nula

Ho = β=0.6


Ha= β<0.6; β>0.6

Segundo paso determinar si la prueba es unilateral o bilateral

Bilateral

Tercer paso Asumir el nivel se significación de la prueba

95% 1.96

Cuarto paso determinar la distribución muestral que se usará en la prueba

Quinto paso elaborar el esquema de la prueba

-1.96 +1.96

Se acepta la Ha debido a que está en zona de rechazo, es decir que esta

bananera no debería ampliar las exportaciones en el 2012 y 2013, debe

asegurar el crecimiento d exportaciones para poder tomar esta decisión.

En una empresa exportadora en un nuevo proceso artesanal de

fabricación de cierto artículo que está implantado, se ha considerado

que era interesante ir anotando periódicamente el tiempo medio (medido

en minutos) que se utiliza para realizar una pieza (variable Y) y el

número de días desde que empezó dicho proceso de fabricación

(variable X). Con ello, se pretende analizar cómo los operarios van

adaptándose al nuevo proceso, mejorando paulatinamente su ritmo de

producción conforme van adquiriendo más experiencia en él. A partir de

las cifras recogidas, que aparecen en la tabla adjunta, se decide ajustar

una función exponencial que explique el tiempo de fabricación en

función del número de días que se lleva trabajando con ese método.

X Y

10 35

20 28

30 23

40 20

50 18

60 15

70 13

Tiempo en min. (X)

N° de días (Y)

XY X2

10 35 350 100 -30 900

20 28 560 400 -20 400

30 23 690 900 -10 100

40 20 800 1.600 0 0

50 18 900 2.500 10 100

60 15 900 3.600 20 400

70 13 910 4.900 30 900

∑ 280 ∑ 152 ∑ 5.110 ∑ 14.000

0 ∑( - ) 2.800

a) Determinar la ecuación lineal de las dos variables

∑

∑

∑

( )( )

√∑( )

√

( )

Ecuación

b) Trace el diagrama de dispersión en el plano cartesiano

0

5

10

15

20

25

30

35

40

0 20 40 60 80

N°

de

día

s (Y

)

Tiempo en minutos (X)

c) ¿Qué tiempo se predeciría para la fabricación del artículo cuando

se lleven 100 días?

d) ¿Qué tiempo transcurriría hasta que el tiempo de fabricación que se

prediga sea de 10 minutos?

( )

El concesionario Imbauto realiza una importación consistente en

vehículos marca Toyota RAN, dicha empresa encargo un estudio para

determinar la relación entre los gastos de publicidad semanal por

televisión y la venta de los vehículos. En el estudio se obtuvieron los

siguientes resultados.

Semanas Gasto publicidad Ventas

1 2 3 4 5 6 7 8 9

200 150 300 290 350 270 400 350 400

29500 14750 59000 73750 88500 132750 44250 44250 177000

= ∑

=

= 301,11

= ∑

=

= 73750

Prime Método

.

/ (

)

(

) (

)

( ) ( )

279,82x – 84257,11

-10507,11 + 279,82 x

r= ∑ (∑ )(∑ )

√[ ∑ (∑ ) ][ ∑ (∑ ) ]

r= ( ) ( )( )

√, ( ) ( ) -, ( ) ( ) -

r=

√,( ) ( )-,( ) ( ) -

r=

√, -, -

Semana Volumen Valor

x Y xy

1 200 29500 5900000 40000 870250000 -101,1 10223,23 -44250 1958062500,00

2 150 14750 2212500 22500 217562500 -151,1 22834,23 -59000 3481000000,00

3 300 59000 17700000 90000 3481000000 -1,1 1,23 -14750 217562500,00

4 290 73750 21387500 84100 5439062500 -11,1 123,43 0 0,00

5 350 88500 30975000 122500 7832250000 48,9 2390,23 14750 217562500,00

6 270 132750 35842500 72900 17622562500 -31,1 967,83 59000 3481000000,00

7 400 44250 17700000 160000 1958062500 98,9 9779,23 -29500 870250000,00

8 350 44250 15487500 122500 1958062500 48,9 2390,23 -29500 870250000,00

9 400 177000 70800000 160000 31329000000 98,9 9779,23 103250 10660562500,00

2710 663750 218005000 874500 70707812500 58488,89 21756250000,00

( ) ( )

r=

r= 0,51

√∑( )

√

Sx= 80,61

a) Determinar la ecuación lineal de las 2 variables

-10507,11 + 279,82 x

b) Trace un diagrama de dispersión en el plano cartesiano.

c) Estime el gasto que corresponde a una venta semanal de 28750$

-10507,11 + 279,82 x

( )

0

20000

40000

60000

80000

100000

120000

140000

160000

180000

200000

0 100 200 300 400 500

Títu

lo d

el e

je

Título del eje

Y

Lineal (Y)

𝑠𝑦 √∑(𝑦𝑖 𝑦)

𝑛

𝑠𝑦 √

Sy= 49166,67

d) Si la venta es de $26027,72 que gasto puede realizar dicho obrero

en la semana

-10507,11 + 279,82 x

-10507,11 + 279,82 (26027,72)

7283076,61

e) Si el gasto es de $450 cuál es su venta.

-10507,11 + 279,82 x

= x

X= 39,16

Si la vida media de operación de una pila de linterna es de 24 horas y

está distribuida nor malmente con una desviación de 3 horas. ¿Cuál es

la probabilidad de que una muestra aleatoria de 100 pilas tenga una

media que se desvíe por más de 30 minutos del Promedio?

SOL UCIÓN

√

√

( )

σ = 3 horas n= 100 pilas

Establecer la relación entre el número de pólizas de seguros contratados

durante la semana anterior ―X‖ y el número de vehículos con seguro que

salieron con mercancía de exportación desde el Ecuador ―Y‖. Calcular la

ecuación.

X Y XY

X2

( ) Y2

( )

10 12 120 100 -6,14 37,73 144,00 -7,14 51,02

12 13 156 144 -4,14 17,16 169,00 -6,14 37,73

15 15 225 225 -1,14 1,31 225,00 -4,14 17,16

16 19 304 256 -0,14 0,02 361,00 -0,14 0,02

18 20 360 324 1,86 3,45 400,00 0,86 0,73

20 25 500 400 3,86 14,88 625,00 5,86 34,31

22 30 660 484 5,86 34,31 900,00 10,86 117,88

∑ 113 ∑ 134 ∑ 2325 ∑ 1933 ∑( ) 108,86 ∑ 2824,00 ∑( ) 258,86

∑

∑

√∑( )

√

UNIVERSIDAD POLITÉCNICA ESTATAL DEL CARCHI

√∑( )

√

(∑ ) (∑ )(∑ )

√, (∑ ) (∑ ) -, (∑ ) (∑ ) -

( ) ( )( )

√, ( ) ( )-, ( ) ( )-

√( )( )

Primera forma de cálculo

.

/ .

/

(

) (

) ( )

2. Según el Servicio Nacional de Aduanas del Ecuador se puede afirmar que la

balanza de pagos del presente año será igual a la balanza de pagos de los

próximos años por lo cual afirman que su respuesta tendrá un 90% de


efectividad, para lo cual se ha tomado en cuenta como muestra de 60 datos de

meses anteriores, de los cuales se han analizado 50 al azar, el nivel de

significancia es de 0,05

1.-

2.- 1 cola

3.- = 90% ЄЄ=0,10 Z= - +1,65

4.- n> 30 PRUEBA DE HIPOTESS

5.-

6.-

P= 0,90

√

√

= 0,04

= -2,5

Ho= balanza de pagos presente es igual a la de los demás años.

Ha=balanza de pagos presente es diferente de los demás años.

Z.R Z.A Z.R

-1,96 1,96


7.- La hipótesis nula se rechaza debido y se acepta la hipótesis alternativa que

manifiesta que la Balanza Comercial para el próximo año será diferente a la de

los demás años.

3. Una empresa que importa calzado afirma que su producto tiene el 90%

de acogida en mercados extranjeros. En una muestra de 100 mercados lo

venden 50. Determinar que la afirmación no es cierta, es decir que el

producto es acogido por el 90%. Si el nivel de significancia es igual a 0.05.

1)

Ho = µ = 90% ; µ = 0.9

Ha = µ < 90% ; µ < 0.9

2) La campana es de 1 cola.

3)

NC = = 95%

EE = 0.05 Z = -1.65

4)

n = 100 n > 30

5)

6)

-1.65

Rechazo

Aceptación


√

√

( )( )

7) El -5 está en zona de rechazo los productos en el extranjero, más el 90% de

mercados.

Rechazo la Ho y acepto la Ha.

4. Los salarios diarios de una empresa de comercialización de productos

lácteos. Tiene una distribución normal con una media de 24.20 USD y una

desviación estándar de 5 USD, si una compañía de esta empresa emplea

35 trabajadores les paga una promedio de 22 USD ¿puede ser acusada

esta empresa de pagar un salario inferiores con un nivel de significancia

del 1%?

1)

Ho = µ = 24.20

Ha = µ < 24.20

2) La campana es de 1 cola.

3)

NC = = 99%

EE = 0.01 Z = -2.33

4)

n > 30 35 > 30 prueba de hipótesis

5)

-2.33

Rechazo

Aceptación


6)

√

√

7) Rechazo la Ho y acepto la Ha.

La empresa no está pagando lo justo a los trabajadores contratados por lo que

podría tener problemas ante la ley de trabajadores.


CRONOGRAMA DE ACTIVIDADES DEL TERCER CAPÍTULO:

Tiempo Actividades

MARZO ABRIL MAYO


1 2 3 4 1 2 3 4 1 2 3 4

PRIMERA CLASE


X


x

SEGUNDA CLASE


X


2012

X

TERCERA CLASE


X


X

CUARTA CLASE


x


APRENDIZAJE MEDIADO


Lectura comprensiva de prueba de hipótesis






Resolver ejercicios relacionados de prueba de hipótesis

Establecer problemas para la aplicación de prueba de hipótesis


Con datos relacionados a la carrera de comercio exterior aplicar prueba

de hipótesis

Resolver ejercicios aplicando la prueba de hipótesis




Investigar otros conceptos de prueba de hipótesis



Elaboración de mapas conceptuales de prueba de hipótesis

Elaboración proyectos para una mayor comprensión de los

conceptos de prueba de hipótesis


Realizar ejercicios relacionados de prueba de hipótesis

Resolver problemas relacionados prueba de hipótesis


Investigar los datos de comercio exterior y aplicar la prueba de

hipótesis


CAPÍTULO

IV


PRUEBA CHI - CUADRADO

Pruebas Paramétricas. Se llama así a las pruebas de hipótesis que cumplen

tres requisitos fundamentales:

1. La variable de la prueba debe ser la variable cuantitativa.

2. Los datos se obtienen por muestreo estadístico.

3. Los datos deben ajustarse a determinadas distribuciones estadísticas.

Ejemplos.

1. La prueba basada en la distribución normal de probabilidades.

2. La prueba de student.

Pruebas No Paramétricas.- llamadas también pruebas de distribución libre.

Son aquellas que:

1. La variable de la prueba puede ser cualitativa o cuantitativa.

2. Los datos se obtienen por muestreo estadístico.

3. Son independientes de cualquier distribución de probabilidad.

Ejemplo.

La prueba de Chi – Cuadrado (también llamada prueba Ji –Cuadrado).

Las pruebas paramétricas son mas poderosas. Sin embargo cuando la variable

es cualitativa, sólo se puede usar las pruebas no paramétricas.

El Estadístico Chi – Cuadrado

En un estadístico que sirve de base para una prueba no paramétrica

denominada prueba chi – cuadrado que se utiliza especialmente para variables

cualitativas, esto es, variables que carecen de unidad y por lo tanto sus valores

no pueden expresarse numéricamente. Los valores de estas variables son

categorías que sólo sirven para clasificar los elementos del universo del

estudio. También puede utilizarse para variables cuantitativas,

transformándolas, previamente, en variables cualitativas ordinales.

El estadísticos chi- cuadrado se define por


( )

En donde:

n= número de elementos de la muestra.

n-1= número de grados de libertad

s2= varianza de la muestra

a2= varianza de la población

Desarrollaremos un ejemplo numérico con la finalidad de fijar el concepto de

Chi – cuadrado.

Ejemplo:

En un estudio de la capacidad de aprendizaje de matemáticas, en los niños de

una población, se tomó una muestra representativa de 40 niños. Se les aplicó

una prueba de diagnostico del aprendizaje en matemáticas y con los datos

obtenidos se calculó la varianza s2=8.4, conociendo que la varianza poblacional

es de 2= 12,37, calcular el valor del estadístico chi-cuadrados.

Datos:

n= 40 S2= 8,4 a2= 12,37

( )

Ahora vamos a elaborar el concepto de DISTRIBUCIÓN MUESTRAL DEL

ESTADÍSTICO CHI- CUADRADO.

Supongamos que se realiza los pasos siguientes:

1. De una población de N elementos se extrae todas las muestras posibles

del mismo tamaño n.

2. Con los datos de cada muestra se calcula el estadístico chi – cuadrado.


3. Con todos los valores de Chi – cuadrado se forma una distribución de

frecuencias; éstas se denomina distribución muestral del Chi-cuadrado.

Esta distribución muestral se representa gráficamente en un sistema de

coordenadas, colocando en el eje de abscisas los valores del estadístico Chi-

cuadrado.

Cuadrado en el eje vertical se colocan las frecuencias de cada valor del chi-

cuadrado.

El área encerrada bajo la curva y el eje horizontal es igual a uno y representar

la probabilidad de que Chi-cuadrado tome valores mayores que 0.

El área rayada situada a la derecha de la ordenada levantada en la abscisa x2

(gl), representa la probabilidad de cometer el error tipo l en la prueba de chi-

cuadrado. Esta probabilidad es el nivel de significación de la prueba. El valor

x2 (gl) se llama valor crítico del chi-cuadrado y se determina por medio de una

tabla especial, que representa al final del libro el aprendizaje de tablas.

Antes de entrar en el manejo de la tabla debemos tener encuentra que para

una probabilidad dad, por ejemplo =0.05, al aumentar el número de grados de

libertada también aumenta el valor crítico de Chi-cuadrado; esto se ilustra en

las tres figuras siguientes:


Este crecimiento del valor crítico se debe a que el aumentar el número de

grados de libertad, la curva de la distribución muestral de Chi-cuadrado tiende

a tomar una forma más extendida y por tanto el punto crítico se desplaza hacia

la derecha.

Descripción y manejo de la tabla.- La tabla de valores críticos de x2 se

encuentra en el apéndice. En la línea horizontal superior encabezando en cada

columna se hayan los valores de .

En la primera columna de la izquierda están los grados de libertad. Los

ejemplos siguientes el manejo de la tabla.

1. Ejemplo:

=0.05 y gl= 4 g de l

A partir de gl=4g de l, dirigimos una visual hacia la derecha hasta cortar a la

visual que baja por =0.05; en la intersección se encuentra el valor crítico


2. Ejemplo:

Si

Hallamos x2 (6)=12.592

3. Ejemplo:

Si

Encontramos x2 (10) = 18.307

Con estos 9 valores de la variable de estudio X, vamos a elaborar el cuadro de

frecuencias observadas correspondientes a las 10 categorías establecidas.

Cuadro 11. 3. 2

Intervalos Conteo Frecuencias

Observadas

Menos de 6,26 a 6, 26 IIII - I 6

6 , 26 a 11,62 IIII - I 6

11,62 a 15,51 III 3

15,51 a 18,80 IIII 5

18,80 a 21,96 IIII 4

21,96 a 25,12 IIII - IIII 10

25,12 a 28,41 III 3

28,41 a 32,30 IIII 4

32,30 a 37,66 IIII 4

37,66 a más. IIII 5

A continuación debemos realizar la clasificación y conteo de los 50 datos, es

decir, colocar a cada uno de ellos dentro de su categoría representándolo por

una tarja. La suma de las tarjas de cada clase da la frecuencia observada de

esta clase.

Para facilitar el cálculo del estadístico chi-cuadrado mediante la fórmula

indicada


( ∑( )

)

Agregamos las frecuencias observadas y esperadas en celdas tal como se

presenta a continuación. Recordemos que se fijo la frecuencia esperada de 5

en cada intervalo, luego:

Frecuencia observada O, y frecuencia esperada E, en la Prueba Chi-cuadrado

de Bondad de Ajuste.

Ei 5 5 5 5 5 5 5 5 5 5

Oi 6 6 3 5 4 10 3 4 4 5

( ) ( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

7) Toma de decisiones

Observamos que este valor de Chi-cuadrado, en el esquema grafico (figura

11.3.5) se ubica en la regresión de aceptación, luego aceptamos esto es,

que la muestra se obtiene de una población distribuida normalmente.

Problema

De una investigación demográfica se conoce que los habitantes de ciertos

países se distribuyen en la forma siguiente: 0- 20 años, 25%; 21 – 40 años,

35%; 41 -61 años, 25%; 61 -80 años, 10%; 81 – 100 años, 5%.

Después de transcurridos varios años se quiso probar que la distribución

poblacional de las edades no ha cambiado para lo que se selecciono una

muestra respectiva de 1000 personas y se observo que las frecuencias de las 5

categorías fueron: 0- 20 años, 200; 21 – 40 años, 300; 41 -61 años, 300; 61 -80

años, 100; 81 – 100 años, 100.

1) la distribución actual por edades es igual a la del año de ejecución

del censo


La distribución actual por edades no es igual a la del año de

ejecución

2) La prueba es unilateral y de cola derecha

3) Nivel de significación a= 0.10

4) Se utiliza la distribución CHI – CUADRADO

ESQUEMA DE LA PRUEBA

Existen k= 5 celdas, tenemos gl = K-1 = 5-1=4 grados de libertad a =

0.10 en la tabla de CHI – CUADRADO obtenemos

( )

5) CALCULO DEL ESTADÍSTICO DE LA PRUEBA

77.14

7.779

250 350 250 100 50


200 300 300 100 100

Las frecuencias observadas nos las proporcionan con la muestra aleatoria de

los 1.000 habitantes.

CALCULO DE LAS FRECUENCIAS ESPERADAS

= 1.000 X 25% = 250 = 1.000 X 35% = 350

= 1.000 X 25% = 250 = 1.000 X 105% = 100

= 1.000 X 5% = 50

CALCULO DEL ESTADISTICO CHI – CUADRADO

( ) ∑( )

( ) = ( )

+ ( )

( )

( )

( )

( ) = 10+7.14+10+0+50

( )= 77.14

6) TOMA DE DECISIONES

Vemos que el estadístico calculado CHI – CUADRADO (77.14) es mayor

que el valor critico encontrado en la tabla (7.779) vemos que 77.14 cae


en la región de rechazo por lo tanto rechazamos y aceptamos , es

decir la distribución actual por edades no es igual a la de la investigación

demográfica.

CORRECCIÓN DE YATES

Cuando el número de grados de libertad es igual a la unidad, es necesario

realizar una corrección por continuidad durante el cálculo del estadístico de la

prueba. Esta corrección se denomina de yates y consiste en disminuir en 0.05

al valor absoluto de la diferencia | | entre las frecuencias observadas y as

frecuencias esperadas.

El ejemplo siguiente ilustra la aplicación de esta corrección.

PROBLEMA

En el año de 1960, la proporción de hombres y mujeres de cierta institución de

enseñanza superior, fue de 75% y 25%, respectivamente. Con la finalidad de

verificar si el transcurso del tiempo había originado algún cambio en las

proporciones de estudiantes de ambos sexos, en el año de 1970 se tomó una

muestra aleatoria de 100 alumnos de 1º ciclo, obteniendo 60 hombres y 40

mujeres. Con estos datos realizar la verificación por medio de la prueba de CHI

– CUADRADO, asumiendo el nivel de significación de a= 5%.

1) la distribución de hombres y mujeres en el año de 1970 también es

de 75% y de 25% respectivamente

La distribución de hombres y mujeres en el año de 1970 no es del

75% ni del 25% respectivamente

2) La prueba es universal y de cola derecha

3) Nivel de significación a= 0.05

4) Emplearemos la distribución muestral de CHI – CUADRADO


5) ESQUEMA DE LA PRUEBA

Existen 2 categorías entonces K= 2 y gl = K – 1 =2-1=1 a= 0.05 con

estos datos vamos a la tabla de CHI – CUADRADO y obtenemos ( )

3.841.

6) CALCULO DEL ESTADÍSTICO DE LA PRUEBA

60

40

OBTENCIÓN DE LOS VALORES ESPERADOS

Valor esperado para los hombres: 100 x 75% = 75

11.21

3.841

75 25


Valor esperado para las mujeres: 100 x 25% = 25

CACULO DEL ESTADÍSTICO DE LA PRUEBA

Como gl = 1 utilizaremos la corrección de yates

( ) (| | )

)

(| | ) )

( ) (| | ) )

(| | ) )

( ) (| | ) )

(| | ) )

( ) ( ) )

( ) )

( ) =2.8+8.41= 11.21

7) TOMA DE DESICIONES

Como el valor de CHI – CUADRADO es de 11.21, mayor que el valor

CHI – CUADRADO afirmamos que 11.21 cae en la región de rechazo,

luego rechazamos la por lo tanto afirmamos que la distribución de

hombres y mujeres no es del 75% ni del 25% respectivamente.

En un estudio realizado en el departamento de investigación del ESAN acerca

del perjuicio étnico hacia el negro. En los universitarios de lima se aplico


Una encuesta a los universitarios según su lugar de procedencia, obteniendo

los resultados que presenta la siguiente tabla

Al nivel de significación Q=0.05, determinar que las variables perjuicio étnico

hacia el negro y lugar de residencia son independientes

1. Ho: el perjuicio étnico y el lugar de residencia son independientes

H1: existe dependencia entre las variables.

2. La prueba es unilateral y la cola derecha

3. Asumimos el nivel de significación de Q= 0.05

4. Utilizaremos la distribución muestral de chi-cuadrado porque las dos

variables son cualitativas.

5. Esquema de la prueba

Gl =(C-1) (F-1) 1.1.3.4

Gl =(3-1) (2-1) = 2 11.3.4

Gl= 2

Q= 0.05

X2 = (2) = 5.991

C= # de columnas

F= # de filas

6. Calculo del estadístico de la prueba x= 3.54

5.991

Formula

∑ .

/

2

X2= 3.54

Lugar de residencia

Grado de perjuicio

Barriadas Barrios populares

intermedios

Barrios residenciales

total

Alto 32 225 50 307

Bajo 28 290 79 397

Total 60 515 129 704


Ya conocemos las frecuencias observadas para determinar las frecuencias

esperadas emplearemos la misma tabla, manteniendo invariables de

frecuencias marginales de dos variables

( )

( )

( )

( )

( )

Lugar de Residencia

Grado de perjuicio

Barriadas Barrios populares

(intermedios)

Barrios residenciales

total

Alto E11 E12 E13 307

Bajo E21 E22 E23 397

Total 60 515 129 704

Cuando las variables X y Y son independientes, las frecuencias de cada celda

son igual al productos de las frecuencias marginales correspondientes dividido

por el tamaño de la muestra.

26.16

32

224.58

225

33.84

28

290.42

290

72.75

79

56.25

50


Las frecuencias esperadas y las asociadas determinan las frecuencias

observadas anteriormente


PROYECTO Nª6

TEMA: Estadístico Chi - Cuadrado

PROBLEMA: El escaso conocimiento del Estadístico Chi – Cuadrado no ha

permitido a los estudiantes resolver problemas

OBJETIVOS

OBJETIVO GENERAL:

Aplicar los conocimientos del Estadístico Chi – Cuadrado para resolver

problemas de Comercio Exterior


Investigar del Estadístico Chi – Cuadrado para resolver problemas de

Comercio Exterior

Conocer del Estadístico Chi – Cuadrado para resolver problemas de

Comercio Exterior

Analizar el Estadístico Chi – Cuadrado para resolver problemas de

Comercio Exterior

JUSTIFICACION El presente trabajo se lo ha realizado con el fin de obtener

información acerca del Estadístico Chi – Cuadrado para de esta manera

contribuir en nuestro conocimiento y de esta forma tener claro los ámbitos de

aplicación para resolver problemas que puedan existir en el Comercio Exterior.

El Estadístico Chi – Cuadrado nos permite hacer cálculos y determinar de esta

manera la factibilidad de un proyecto a través de un resultado expresado en

porcentajes para de esta manera lograr determinar los puntos clave del

proyecto o tema de investigación y así lograr obtener un buen resultado. El

tema del Estadístico Chi – Cuadrado nos permite aplicarlo en el Comercio

exterior al momento que se quiera la saber la diferencia entre dos variables

como por ejemplo en una empresa fabricadora que tan productiva esta la

maquinaria.


MARCO TEORICO

PRUEBA CHI-CUADRADO

Pruebas paramétricas: Se llaman así a las pruebas de hipótesis que cumplen

tres requisitos fundamentales

La variable de la prueba debe ser variable cuantitativa

Los datos se obtiene por muestreo estadístico

Los datos deben ajustarse a determinadas distribuciones estadísticas

Pruebas no paramétricas.- Llamadas también pruebas de distribución libre.

Son aquellas en que:

La variable de la prueba puede ser cualitativa o cuantitativa

Los datos se obtiene por muestreo estadístico

Son independientes de cualquier distribución de probabilidad.

EL ESTADISITICO CHI- CUADRADO

Es un estadístico que sirve de base para una prueba no paramétrica

denominada Prueba de Chi- Cuadrado que se utiliza especialmente para

variables cualitativas, esto es, variables que carecen de unidad y por lo tanto

sus valores no pueden expresarse numéricamente. Los valores de estas

variables son categorías que solo sirven para clasificar los elementos del

universo de estudio. También puede utilizarse para variables cuantitativas,


Pruebas chi-cuadrado de ajuste e independencia

Las pruebas chi-cuadrado son un grupo de contrastes de hipótesis que sirven

para comprobar afirmaciones acerca de las funciones de probabilidad (o

densidad) de una o dos variables aleatorias.

Estas pruebas no pertenecen propiamente a la estadística paramétrica pues no

establecen suposiciones restrictivas en cuanto al tipo de variables que admiten,


ni en lo que refiere a su distribución de probabilidad ni en los valores y/o el

conocimiento de sus parámetros.

Se aplican en dos situaciones básicas:

a) Cuando queremos comprobar si una variable, cuya descripción parece

adecuada, tiene una determinada función de probabilidad. La prueba

correspondiente se llama chi-cuadrado de ajuste.

b) Cuando queremos averiguar si dos variables (o dos vías de

clasificación) son independientes estadísticamente. En este caso la

prueba que aplicaremos ser la chi-cuadrado de independencia o chi-

cuadrado de contingencia.

Chi-cuadrado de ajuste

En una prueba de ajuste la hipótesis nula establece que una variable X tiene

una cierta distribución de probabilidad con unos determinados valores de los

parámetros. El tipo de distribución se determina, según los casos, en función

de: La propia definición de la variable, consideraciones teóricas al margen de

esta y/o evidencia aportada por datos anteriores al experimento actual.

A menudo, la propia definición del tipo de variable lleva implícitos los valores de

sus parámetros o de parte de ellos; si esto no fuera así dichos parámetros se

estimarán a partir de la muestra de valores de la variable que utilizaremos para

realizar la prueba de ajuste.


EJERCICIOS

1. Un jugador quiere probar que es legal el dado con el que juega. Tiro el

dado 120 veces y obtuvo la siguiente distribución de frecuencias de las

caras restantes.

Resultado 1 2 3 4 5 6

Frecuencia 15 25 33 17 16 14

a) Enuncie la hipótesis de la prueba y determine las frecuencias esperadas

b) Describa la estadística de la prueba

c) Determine la región crítica de la prueba al nivel de significación del 5%.

d) ¿A qué conclusión llega usando el nivel de significación 0.05?

e) Determine la probabilidad P

Resolución

1.- Hₒ = El dado es legal

Hₐ = El dado no es igual

2.- La prueba es unilateral e de una sola cola a la derecha

3.- Nivel de significación 0.05

4.- Se utiliza la distribución de chi-cuadrado

5.- Esquema de la prueba

gl = k-1=6-1=5

gl= 11.070

6.- ∑( )

( )

( )

( )

( )

( )

( )

7.- Decisión: rechazamos hipótesis nula y aceptamos hipótesis alternativa.


2. El gerente de ventas de una compañía P&C afirma que todos sus

vendedores realizan el mismo número de visitas durante el mismo

periodo de tiempo. Una muestra aleatoria de 5 registros de los

vendedores en una semana dada revelo el siguiente número de visitas.

Vendedor A B C D E

Número de visitas 23 29 25 23 30

Con el nivel de significación de 0.05. ¿ es razonable aceptar la

afirmación del gerente?

Resolución

1.- Hₒ = Mismo número de visitas

Hₐ = Diferentes visitas

2.- La prueba es unilateral e de una sola cola a la derecha

3.- Nivel de significación 0.05

4.- Se utiliza la distribución de chi-cuadrado

5.- Esquema de la prueba

gl = k-1=5-1=4

gl= 9.49

6.- ∑( )

( )

( )

( )

( )

( )

7.- Decisión: rechazamos hipótesis nula y aceptamos hipótesis alternativa.


3. El gerente de personal de la compañía REXA quiere probar la hipótesis

que hay diferencias significativas de tardanzas de los diferentes días de

la semana. De los registros de asistencia obtuvo la siguiente tabla de

tardanzas de un personal para cada uno de los días de la semana:

Días Lunes Martes Miércoles Jueves Viernes

Tardanzas 58 39 75 48 80

¿Se puede aceptar la hipótesis del gerente con un nivel de significación de

0.05?

1._

H0 = EXISTEN DIFERENCIAS SIGNIFICATIVAS DE TARDANZAS.

Ha= NO EXISTEN DIFERENCIAS SIGNIFICATIVAS DE TARDANZAS.

2._ Una sola cola hacia la derecha

3._ Nivel de significancia 0.05

4._ Prueba Chi Cuadrado

5._ Esquema prueba

Gl=5 celdas

Gl= k- 1=5-1=4

Gl=(x2) (4) = 9.49

6._ x2= € (0i - £i)2

X2 = ( )

+

( )

+

( )

+

( )

+

( )

= 20.233

7._ Se rechaza la Hipótesis Nula.

9.49


4. De una muestra de turistas que se hospedan en el hotel EL PALMER se

recogió sus opiniones acerca de los servicios del hotel, resultando los

siguientes datos.

Pésima Mala Regular Buena Muy buena

Excelente

Turistas 20 25 40 54 56

Pruebe con un nivel de significancia del 5% la hipótesis nula de que no hay

diferencias significativas entre las opiniones de los turistas.

1._

H0 = No hay diferencia significativa de las opiniones del turista

Ha= Si hay opiniones significativas del turista.

2._ Una sola cola hacia la derecha

3._ Nivel de significancia 0.05

4._ Prueba Chi Cuadrado

5._ Esquema prueba

Gl=5 celdas

Gl= k- 1=5-1=4

Gl=(x2) (4) = 9.49

6._ x2= € (0i - £i)2

X2 = ( )

+

( )

+

( )

+

( )

+

( )

= 27.4873

7._ Se rechaza la Hipótesis Nula.

9.49


5. En un día dado se observó el número de conductores que escogieron

cada una de las 10 casetas de pago de peaje ubicadas a la salida al sur.

Los datos se registraron en la siguiente tabla:

Caseta # 1 2 3 4 5 6 7 8 9 10

# de conductores 58

0

700 730 745 720 710 660 655 670 490

¿Presentan estos datos suficiente evidencia para concluir que hay casetas

preferidas? Utilice el nivel de significancia del 5%

1.-

2.- 1 cola unilateral

3.- Nivel de confianza = 90% Error Estimado=0,10

gl= 3-1= 2 RC= 5,999

4.- n> 30 CHI CUADRADO

5.-

Z.R Z.A

5,999

Ho= los pagos con cheque, efectivo o tarjeta tienen relación

Ha= los pagos con cheque, efectivo o tarjeta no tienen relación


6.-

E1=400 * 30% =120

E2= 400* 45% =180

E3= 400* 255 = 100

( )

( )

( )

7- se rechaza la hipótesis ya que los pagos con cheque, efectivo o tarjeta no

tiene relación por este motivo es que se rechaza esta hipótesis.

6. Un ejecutivo de hipermercado ―TOD‖ afirma que las compras se pagan

30% con cheque, 45% con efectivo y 25% con tarjeta de crédito. En una

muestra aleatoria de 400 compradores se encontró que 110 de ellos

pagan con cheque, 210 con efectivo, y 80 con tarjeta. ¿Puede usted

concluir con la significación de 0,05, que la afirmación del ejecutivo es

razonable?

1.-

2.- 1 cola unilateral

3.- Nivel de confianza = 95% Error Estimado=0,05

gl= 10-1= 9 RC= 16,92

120 180 100

110 210 80

Ho= hay preferencia de casetas

Ha= no hay preferencia de casetas


4.- n> 30 CHI CUADRADO

5.-

6.-

E1=400 * 30% =120

E2= 400* 45% =180

E3= 400* 255 = 100

( )

( )

( )

( )

( )

( )

( )

( )

( )

( )

7. se rechaza la hipótesis nula ya que los conductores no tiene preferencia por

las casetas de peaje sino que deciden por alguna que ya este bacía o en la que

haya menor número de autos para sí poder seguir de forma más rápida a su

destino final.

120 180 100

110 210 80

Z.R Z.A

16,92


9. Un investigador escogió una muestra aleatoria de 192 familias con 4 hijos y

encontró la siguiente distribución de frecuencias del número de hijos varones:

VALORES OBSERVADOS

Número de varones 0 1 2 3 4 Total

Número de familias 18 42 64 40 28 ∑ 192

El quiere probar la hipótesis de que los nacimientos de varones y mujeres son

igualmente probables. Esto es, quiere probar que la distribución de estos datos se

aproxima a una distribución binomial.

Enuncie las hipótesis de la prueba y obtenga las frecuencias esperadas

Describa la estadística de la prueba

Determine la región crítica de la prueba al nivel de significación del 5%.

¿A qué conclusión llega usando el nivel de significación de 0.05?

Determine el nivel de significación de la prueba. (Calcule probabilidad: P)

1. Ho: Los nacimientos de varones y mujeres son igualmente probables.

Ha: Los nacimientos de varones y mujeres no son igualmente probables.

2. La prueba es unilateral y de cola derecha

3. = 5% = 0.05

gl = (f – 1 )(c - 1) = (2 – 1)(5 - 1) = 4

4. Valor chi – cuadrado x2 (4) = 9,488


= 5% = 0.05

gl = 4


6. Cálculo del estadístico de la prueba

Ei 38.4 38.4 38.4 38.4 38.4

Oi 18 42 64 40 28

Cálculo de las frecuencias esperadas

( ) ∑( )

*( )

( )

( )

( )

( )

+

7. Toma de decisiones

Aceptamos la Ha y rechazamos la Ho.

Esto significa que los nacimientos de varones y mujeres no son igualmente

probables.

9,488


10. Se lanzaron 200 veces 5 monedas y en cada tirada se contaron el número de

caras. Los resultados de este experimento son los siguientes:

Número de caras 0 1 2 3 4 5 Total

Número de tiradas 3 15 55 60 40 27 200

Frec. Esperadas (Ei) 33,33 33,33 33,33 33,33 33,33 33,33 200

Oi – Ei -30.33 -18.33 21.67 26.67 6.67 -6.33

(Oi – Ei)2 919.91 335.99 469.59 711.29 44.49 40.07

(Oi – Ei)2 / Ei 27.60 10.08 14.09 21.34 1.33 1.20 75.61

Pruebe la hipótesis de que la distribución del número de caras se ajusta a una

distribución binomial. Use el nivel de significación del 1%.

1. Ho: la distribución del número de caras se ajusta a una distribución binomial.

Ha: la distribución del número de caras no se ajusta a una distribución

binomial.

2. La prueba es unilateral y de cola derecha

3. Nivel de significación = 1% = 0,01

4. Se utilizará la Distribución Muestral de Chi - cuadrado


gl = k – 1 = 6 – 1 = 5

= 1% = 0,01

x2 (5) = 15.086

15.086


6. Cálculo del Estadístico de la Prueba

( ) ∑( )

*( )

( )

( )

( )

( )

( )

+

7. Toma de decisiones

Aceptamos la Ha y rechazamos la Ho. La distribución del número de caras se

ajusta a una distribución binomial.


CONCLUSIONES

El chi-cuadrado permite determinar la aprobación o rechazo de dos

hipótesis planteadas

El chi-cuadrado sirven para comprobar afirmaciones acerca de las

funciones de probabilidad (o densidad) de una o dos variables

aleatorias.

RECOMENDACIONES

Es de mucha importancia, que como estudiantes de la carrera de

comercio exterior conozcamos todo lo relacionado con El chi-cuadrado

para que exista una correcta aplicación en los ejercicios propuestos y

podamos determinar la dependencia que existe entre dos variables.

La utilización correcta de las formulas del chi-cuadrado y por ende son

aplicadas en empresas de Comercio exterior ya que permite un mejor

análisis para que se resuelva de manera correcta los problemas de una

empresa.

Bibliografía

HOWAR B. CHRISTENSEN. (1990). ESTADISTICA PASO A PASO. En H. B.

CHRISTENSEN, ESTADISTICA (págs. 557-590). TRILLAS: TRILLAS.

JOHNSON, R. (1990). Análisis descriptívo y presentación de datos bivariados.

En ESTADÍSTICA ELEMENTAL (pág. 82 ~ 112). Belmont: Wadsworth

Publishing Company Inc.


ANEXOS

1. Un estudio en el departamento de investigación de logística acerca de la

aceptabilidad de la creación de la empresa de transporte pesado se ha

aplicado una encuesta a las diferentes entidades de transporte,

exportadores, importadores de la localidad, obteniéndose los resultados

que presenta la siguiente tabla.

CREAR EMPRESA DE TRANSPORTE PESADO

Grado de perjuicio

Transportistas Empresas de transporte

Exportadores Importadores TOTAL

Aceptable 220 230 75 40 565

No aceptable

150 250 50 30 480

TOTAL 370 480 125 70 1045

El nivel de significancia es de =0.10 determinar las variables de la

aceptabilidad de la creación de la empresa de transporte pesado y el lugar de

la creación de la empresa.

1). la aceptabilidad y el lugar de la creación de la empresa de transporte

pesado.

Existe aceptabilidad en la localidad.

2). La prueba es unilateral y la cola es derecha.

3). Asumimos el nivel de significancia de =0.10

4). Utilizaremos la distribución muestral de Chi-Cuadrado porque las dos


5). Esquema de la prueba

( )( )

( )( )

=0.10


( )

( ) ( )

( )

6). Calculo del estadístico de la prueba

∑ ( )

CREAR EMPRESA DE TRANSPORTE PESADO

Grado de perjuicio



Aceptable

220

230 75 40 565

No aceptable

150

250 50 30 480

TOTAL 370

480 125 70 1045

2. Una empresa bananera ECUABANANO realiza exportaciones hacia

América Latina, sin embargo está considerando ampliar el destino de

sus exportaciones hacia Norte América, debido a que las exportaciones

han crecido notablemente en los dos anteriores años se han presentado

los siguientes datos:

Sur América Centro américa

México Total

2010 5000 7000 8500 20500

2011 6500 8000 9500 24000

Total 11500 15000 18000 44500

(valor en cajas)

200,05

220,48 57,42 32,15

37,85 67,58 259,52

169,95

2,62



aceptabilidad de la ampliación de las exportaciones de ECUABANANO hacia

norte américa.

Desarrollo:

1). les aceptable la ampliación de las exportaciones de ECUABANANO

No Existe aceptabilidad de la ampliación de las exportaciones de

ECUABANANO


3). Asumimos el nivel de significancia de =0.10

4). Utilizaremos la distribución muestral de Chi-Cuadrado porque las dos


5). Esquema de la prueba

( )( )

( )( )

=0.10

( )

( )

6). Calculo del estadístico de la prueba

∑ ( )

6,251


7. Se acepta la Ha debido a que está en zona de rechazo, es decir que esta

bananera no debería ampliar las exportaciones en el 2012 y 2013, debe

asegurar el crecimiento d exportaciones para poder tomar esta decisión.

3. En la comercialización de manzanas, una empresa exportadora envía

semanalmente lotes de 50 cajas al exterior, cada caja tiene un peso

aproximado de 20 kilos. Las cajas son previamente almacenadas. Para

el control de calidad se

examinan al azar, si en alguna caja encuentran por lo menos una

manzana malograda, esta es calificada mala. Para que pase el control

mediante la inspección de la muestra no debe haber caja malograda, si

solo ex is te una ca ja es ta se rá cambiada , s i hay más de 1

en las 5 inspeccionadas, inspeccionaran las cincuenta cajas. Según las

estadísticas pasadas de un total de 40 envíos, registro lo siguiente: Se

puede afirmar que la variable número de cajas malogradas en la

muestra de 5 sigue una distribución Binomial?.

manzanas rojas verdes ambos

Grandes 3 5 5 13

Medianas 5 4 8 17

pequeñas 7 9 6 22

total 15 18 19 52

1)

H0: La variable número de cajas sigue una distribución Binomial.

Grado de perjuicio Importadores Exportadores Transportistas TOTAL

Aceptable 5000 7000

8500 20500

No aceptable 6500 8000

9500 24000

TOTAL 11500 15000

18000 44500


Ha: No siguen una Binomial.

2) La prueba es unilateral y de una cola derecha

3) Nivel de significación 0.10

4) Utilización del chi cuadrado

5) Esquema de la prueba

Gl = (c-1) (f-1)

= (3-1) (3-1)

= 4

= 0.10

En la tabla de chi cuadrada obtenemos

X2 (4) = 7.779

6) Calculo del estadístico de la prueba

∑( )

Calculo de las pruebas esperadas.

( )

( )

( )

( )


( )

( )

( )

( )

( )

manzanas Rojas verdes ambos

Grandes 3.75 4.5 4.75

13

3

5

5

Medianas 4.90 5.88 6.21

17 5

4

8

pequeñas 6.35 7.62 8.04 22 7 9 6

total 15

18

19

52

( )

( )

( )

( )

( )

( )

( )

( )

( )

= 0.15+ 0.06+ 0.01+ 0.002+0.60+0.52+ 0.07+ 0.25+ 0.52

=2.182


7)

ZA ZR

2.182 7.779

ZA= aceptamos la hipótesis nula porque La variable número de cajas

sigue una distribución Binomial.

4. En un estudio realizado en Tulcán acerca si es factible la creación de la

Zona Franca en la ciudad, para la cual se aplicó una encuesta a las

personas que se dedican al comercio exterior según su actividad,

obteniéndose los resultados que se presentan a continuación:

Actividad de Comercio Exterior

Factibilidad Importadores Exportadores Agentes de Aduana

Total

Si 18 20 38 76

No 12 8 14 34

Total 30 28 52 110

Al nivel de significación = 0.05, determinar que las variables factibilidad de

creación de Zona Franca y actividad de comercio exterior son independientes.

1-

Ho= factibilidad de creación de Zona Franca y la actividad de comercio exterior

son independientes;

H1=existe dependencia entre las dos variables.


2 La prueba es unilateral y de cola derecha.

3 Asumimos el nivel de significación de = 0.05

4 Utilizaremos la distribución muestral de Chi-cuadrado porque las dos

variables son cualitativas

gl= (C-1)(F-1)

gl= (3-1)(2-1) = 2

= 0.05

x2(2)=5.991

5

Actividad de Comercio Exterior

Factibilidad Importadores Exportadores Agentes de Aduana

Total

Si E11 E12 E13 76

No E21 E22 E23 34

Total 30 28 52 110


Ei 20,73 19,35 35,93

Oi 18 20 38

9,27 8,65 16,07

12 8 14

∑( )

( )

( )

( )

( )

( )

( )

7-Vemos que el valor se encuentra en la zona de aceptación por lo tanto

aceptamos la Ho.

5. Un grupo de estudiantes quiere determinar si la creación de una

empresa de alquiler de contenedores para el trasporte de mercancías

entre Colombia y Ecuador, se obtiene los siguientes datos.

EMPRESA DE ALQUILER DE CONTENEDORES

Grado de perjuicio



Están de acuerdo

392 222 331 123 1068

No Están de

acuerdo

122 324 122 323 891

TOTAL 514 546 453 446 1959


aceptabilidad de la creación de la empresa.

1). la aceptabilidad de la creación de la empresas.


Existe aceptabilidad.


3) Asumimos el nivel de significancia de =0.05

4) Utilizaremos la distribución maestral de Ji-Cuadrado porque las dos variables

son cualitativas.

5) Esquema de la prueba

( )( )

( )( )

6) Calculo del estadístico de la prueba

∑ ( )

∑( )

EMPRESA DE DE ALQUILER DE CONTENEDORES

Grado de perjuicio Transportistas

Empresas de transporte Exportadores Importadores TOTAL

Están de acuerdo 392

222 331 123 1068

No Están de acuerdo 122 324 122 323 891

TOTAL 514 546 453 446 1959


CAPÍTULO

V


APLICACIÓN DE LOS ESTADISTICOS EN EL PROGRAMA SPPS

TEMA: Aplicación de los estadísticos en el programa SPSS

PROBLEMA: El escaso conocimiento de la Aplicación de Estadísticos en

programas SPSS no ha permitido a los estudiantes resolver problemas

OBJETIVOS

OBJETIVO GENERAL:

Aplicar los estadísticos en el programa SPSS que permita resolver

problemas de comercio exterior


Investigar la aplicación de los Estadísticos en el programa SPSS para


Conocer la aplicación de los Estadísticos en el programa SPSS

Analizar la aplicación de Estadísticos en el programa SPSS para

resolver problemas de Comercio Exterior.

JUSTIFICACION

Con esta investigación se quiere conocer los programas que hoy en la

actualidad permiten aplicar problemas y ejercicios que surgen en el comercio

exterior, en este caso queremos interpretar los diferentes estadísticos que

manejamos dentro de la estadística inferencial, utilizando el programa SPSS

17, el cual permite calcular resultados de una forma más rápida y precisa.

Con la aplicación de los estadísticos en este programa buscamos que la forma

para tomar y analizar resultados, sea más factible para la persona que requiere

de esta información.

En este proyecto esta detallado cada paso que se deberá tomar al momento de

calcular los diferentes estadísticos de manera que sea entendible y practico.


MARCO TEÓRICO

SPSS STADISTIC

SPSS es un programa estadístico informático muy usado en las ciencias

sociales y las empresas de investigación de mercado. Originalmente SPSS fue

creado como el acrónimo de Statistical Package for the Social Sciences aunque

también se ha referido como "Statistical Product and Service Solutions" (Pardo,

A., & Ruiz, M.A., 2002, p. 3). Sin embargo, en la actualidad la parte SPSS del

nombre completo del software (IBM SPSS) no es acrónimo de nada.

Como programa estadístico es muy popular su uso debido a la capacidad de

trabajar con bases de datos de gran tamaño. En la versión 12 es de 2 millones

de registros y 250.000 variables. Además, de permitir la recodificación de las

variables y registros según las necesidades del usuario. El programa consiste

en un módulo base y módulos anexos que se han ido actualizando

constantemente con nuevos procedimientos estadísticos. Cada uno de estos

módulos se compra por separado.

Actualmente, compite no sólo con software licenciados como lo son SAS,

MATLAB, Statistica, Stata, sino también con software de código abierto y libre,

de los cuales el más destacado es el Lenguaje R. Recientemente ha sido

desarrollado un paquete libre llamado PSPP, con una interfaz llamada PSPPire

que ha sido compilada para diversos sistemas operativos como Linux, además

de versiones para Windows y OS X. Este último paquete pretende ser un clon

de código abierto que emule todas las posibilidades del SPSS.

CORRELACIÓN LINEAL

El análisis de correlación se dirige sobre todo a medir la fuerza de una relación

entre variables. El coeficiente de correlación lineal, r, es la medida de la fuerza

de la relación lineal entre dos variables. La fortaleza de la relación se determina


mediante la magnitud del efecto que cualquier cambio en una variable ejerce

sobre la otra. (JOHNSON, 1990)

Si X o Y son las dos variables en cuestión, un diagrama de la dispersión

muestra la localización de los puntos (X,Y) sobre un sistema rectangular de

coordenadas. Si todos los puntos del diagrama de dispersión parecen estar en

una recta, como la figura 14(a) y 14(b) la correlación se llama lineal. (SPIEGEL,

1992)

REGRESIÓN LINEAL

Fases del modelo de regresión lineal

La recta de regresión y el coeficiente de correlación tienen sentido en tanto en

cuanto son instrumento para inferir la relación de las variables en la población.

El conocimiento exacto del coeficiente de correlación solo es posible si

analizamos la totalidad de la población. Sin embargo, a la hora de evaluarlo,

nos encontramos con el problema habitual de tener que inferirlo desde la

estimación que proporcionan los datos de una muestra.

La recta de regresión lineal y=a+bx, es una estimación de la recta de regresión

lineal de la población y= +ßx. Los parámetros y ß son evaluados a partir de

los datos de una muestra, y es fundamental tener unas garantías de que los

valores a y b estimados no difieren significativamente de los parámetros

poblacionales y ß.

El proceso que se sigue en la construcción del modelo de regresión se

compone de tres fases o etapas. En la primera fase, se comprueba si la

relación entre las variables que componen el modelo está de acuerdo con la

propia forma del modelo.

La segunda fase consiste en la estimación de los parámetros de acuerdo con el

criterio elegido (en nuestro caso, el método de mínimos cuadrados).

La última fase es fundamental para el investigador, que debe comprobar si las

inferencias o pronósticos que se pueden hacer de la relación encontrada entre

las variables se ajustan a los datos. (VARGAS, 1995).


PRUEBA DE HIPÓTESIS

La prueba de hipótesis comienza con una suposición, llamada hipótesis, que

hacemos acerca de un parámetro de población. Después recolectamos datos

de muestra, producimos estadísticas muéstrales y usamos esta información

para decidir qué tan probable es que nuestro parámetro de población hipotético

sea correcto. Digamos que suponemos un cierto valor para una medida de

población, para probar validez de esa suposición recolectamos datos de

muestra y determinamos la diferencia entre el valor hipotético y el valor real de

la media de la muestra. Después juzgamos si la diferencia obtenida es

significativa o no. Mientras más pequeña sea la diferencia, mayor será la

probabilidad de que nuestro valor hipotético para la media sea correcto.

Mientras mayor sea la diferencia, más pequeña será la probabilidad. (LEVIN,

2010)

T DE STUDENT

En probabilidad y estadística, la distribución T - Student es una distribución de

probabilidad que surge del problema de estimar la media de una población

normalmente distribuida cuando el tamaño de la muestra es pequeño.

Una variable aleatoria se distribuye según el modelo de T - Student con n

grados de libertad.

Propiedades:

7. La gráfica de la función de densidad es en forma de campana.

8. Los datos están más dispersos que la curva normal estándar.

9. A medida que n aumenta, la gráfica se aproxima a la normal N (0,1).

10. La gráfica es muy parecida a la de la normal estándar diferenciándose

en que las colas de t están por encima de la normal, y el centro se

encuentra por debajo del de la normal.


11. Cuando los grados de libertad son altos, los valores de t coinciden con

los de la normal.

CHI- CUADRADO

Es un estadístico que sirve de base para una prueba no paramétrica

denominada prueba de chi cuadrado que se utiliza especialmente para

variables cualitativas, esto es, variables que carecen de unidad y por lo tanto

sus valores no pueden expresarse numéricamente. Los valores de estas

variables son categorías que solo sirven para clasificar los elementos del

universo del estudio. También puede utilizarse para variables cuantitativas,


El estadístico Chi- Cuadrado se define por:

( )

En donde:

n=número de elementos de la muestra

n-1= números de grados de libertad.

=varianza de la muestra

= varianza de la población

VARIANZA

Cuando es necesario hacer comparaciones entre tres o más medias

muéstrales para determinar si provienen de poblaciones iguales utilizamos la

técnica de análisis de varianza. Esta técnica se realiza utilizando la distribución

de probabilidad F vista anteriormente. Para el uso de esta técnica es necesario

seguir los siguientes supuestos:


1) Las poblaciones siguen una Distribución de Probabilidad Normal

2) Las poblaciones tienen desviaciones estándar (σ) iguales

3) Las muestras se seleccionan de modo independiente

La técnica del análisis de varianza descompone la variación total en dos

componentes de variación llamados variación debida a los tratamientos y

variación aleatoria.

INSTALACIÓN DEL SPSS

PASOS PARA DESCARGAR EINSTALAR EL SPSS

1. Prender el computador

2. Descargar el programa spss

3. Entrar en la pagina 4 shared

4. Clic en archivos y poner el nombre del programa y buscar

5. Clic en descargar spss

6. Clic en descargar archivo esperar algunos segundo

7. Clic en descargar archivo

8. Asegurarse de no estar conectado a internet: durante la instalación el

programa

Para desconectar el acceso a la red hacer clic en Inicio

9. Panel de control

10. Conexiones de red.

11. Luego hacer clic con el botón secundario del mouse en el ícono de la

placa de red y hacer clic en "Desactivar".


12. ) Ir a la carpeta donde se ubica el archivo "SPSS 17 Setup.exe" y hacer

doble clic en el mismo.

13. Se abrirá una ventana que muestra el progreso de la instalación.

14. Se abre otra ventana. Seleccionar "Licencia de usuario individual" y

hacer clic en "Siguiente >". En la siguiente ventana hacer clic en "Acepto

los términos del contrato de licencia" y hacer clic en "Siguiente >". En la

ventana de "Información de última hora" hacer clic en "Siguiente >".

15. Se abre una nueva ventana

a) Completar los campos "Nombre de usuario" y "Organización" con los

datos que se desee.

b) Ir a la carpeta donde se ubica el archivo "keygen.exe" y hacer doble clic

en el mismo.

c) Atención: antes de continuar, tener en cuenta que los códigos mostrados

aquí pueden diferir de los que muestra el programa en su computadora


(se recomienda utilizar solamente los códigos mostrados en el programa

que se utiliza al instalar y no los mostrados aquí

16. Se abre una ventana para ingresar licencia y registro de SPSS. Hacer

clic en "Aceptar".

17. Se abre una nueva ventana.

a) Seleccionar "Conseguir una licencia para mi producto ahora".

18. Clic en siguiente

19. Introducir el código de autorización que está debajo del botón

"Generate" del keygen mencionado en 5b. Hacer clic en "Siguiente >".

Aparece una ventana que indica un error en la conexión a internet.

Hacer clic en "Siguiente >".

20. Clic en siguiente para que se instale el programa

21. Luego clic en inicio programas spss Aparece una ventana que indica las

licencias de las que se dispone. Hacer clic en "Siguiente >".

22. Se abre una nueva ventana.

a) Seleccionar "Conseguir una licencia para mi producto ahora".

23. Luego se introduce la licencia del producto

24. Clic en siguiente

25. Para pasar el idioma del programa a español

26. Abrir un archivo .sav o alguno de la carpeta Samples. En el menú "Edit"

hacer clic en el botón "Options..."

En la pestaña "General", en el área "Output", en la sección "Language" hacer

clic la lista desplegable (el triángulo que apunta hacia abajo) y hacer clic en

"Spanish".

Repetir el paso 19 en la sección "User Interface" y hacer clic en "OK".


27. Para reconectar el acceso a la red hacer clic en Inicio / Panel de control /

Conexiones de red. Luego hacer clic con el botón secundario del mouse

en el ícono de la placa de red y hacer clic en "Activar".


UTILIZACIÓN DEL SPSS

1.- Abrir el programa SPSS,

2.- Menú inicio y clic en el icono que aparece del programa con el nombre de

SPSS.

3.- A continuación se desplegara la ventana SPSS, con un cuadro de dialogo,

hacer clic en la opción introducir datos y luego clic en aceptar.


SELECCIÓN DE DATOS

1.- Clic en abrir archivo

2.- Selecciona la ubicación en donde se encuentra el archivo


3.- Selecciona el formato del archivo a ser introducido.

4.- Busca el archivo para introducir los datos en el SPSS.

5.- En el cuadro de dialogo que indica el tipo de archivo seleccionado, escoge

el formato y presiona clic en aceptar.


6.- Automáticamente se desplegaran los datos

7.- Coloca cero en decimales, la medida en escalar y el tipo numérico para que

se pueda calcular los datos requeridos,.


CÁLCULO DE CORRELACIÓN EN EL SPSS

Se calculara la relación que existe entre las exportaciones en toneladas

con las exportaciones en valor FOB.

1.- Hacer clic en análisis

2.- Elige la opción correlación en el menú que se despliega y luego escoge la

opción bivariadas.


3.- Mira el cuadro de dialogo con las dos variables propuestas.

4.- Luego se procede a traspasar cada variable.


5.- Luego has click en aceptar y se desplegaran los datos y tablas optenidas a

traves de programa.


CÁLCULO DE REGRESIÓN EN EL SPSS

Se podrá calcula la ecuación para correlación donde la ecuación nos

servirá para hacer proyecciones al futuro.

1.- Clic en análisis, en el menú que se despliega elige la opción regresión y

después la opción lineal,

2.- En el cuadro que aparece se determinará la variable dependiente e

independiente, y colocarlas en el espacio que aparece en el cuadro de dialogo.


3.- Despliega el cuadro de dialogo en la opción ―estadísticos‖

4.- Elige las opciones de ―estimaciones‖ y ―intervalo de confianza‖.

5.- Clic en continuar.

6.- Elige la opción ―gráficos‖


7.- Selecciona ―histogramas‖ y ―gráfico de prob. normal‖, para obtener el cálculo

de la gráfica de los datos.

8.- Has clic en aceptar si ya realizaste los pasos anteriores para obtener el

resultado de la Regresión.


9.- En la hoja siguiente observa el cálculo siguiente:


10.- Gráfica de dispersión.


CÁLCULO DE PRUEBA DE HIPÓTESIS EN EL SPSS

Calcularemos la relación existente entre las exportaciones en valor FOB y

las exportaciones en toneladas en donde determinamos la aprobación o

rechazo de la hipótesis nula o hipótesis alternativa

Pasos de una prueba de hipótesis

En la prueba de hipótesis que goza de aceptación general figuran siete pasos:

1.- Formular la hipótesis nula HO,

De manera que pueda determinarse exactamente , la probabilidad de

cometer un error tipo 1. (Esto equivale a determinar el parámetro de población

que interesa y proponer la validez de un valor para él) (Signo =)

Ho = las exportaciones en valor FOB son iguales a las exportaciones en

toneladas


1.1.- Formular la hipótesis alternativa Ha

De manera que el rechazo de la hipótesis nula signifique aceptar la hipótesis

alternativa. (Signo > o <)

Al formular estas dos hipótesis, se determinan el parámetro y el valor

propuesto;

Ha = las exportaciones en valor FOB son diferentes a las exportaciones en

toneladas

2.- Determinar si la prueba es unilateral o bilateral

3.- Asumir el nivel de significación

4.- Determinar la distribución muestral que se usara en la prueba

5.- Elaborar el esquema de la prueba

6.- Calcular el estadístico de la prueba

7.- Tomar la decisión, para esto, se comparan el esquema de la parte 5, con el

estadístico del paso 6

Cálculo en SPSS

1.- Has clic en la opción análisis.

2.- Selecciona la opción ―compara medias‖ y ―prueba T para muestras

relacionadas‖.


3.- En el cuadro siguiente, aparecen las dos variables con las cuales se está

trabajando.

4.- Presiona el botón con la flecha para traspasar las variables al cuadro vacío.

5.- luego de haber insertado las variables, haz clic en opciones.


6.- Haz clic en el cuadro de dialogo en las opciones excluir casos según

análisis.

7.- en el intervalo de confianza pon el porcentaje con el que vas a trabajar.

8.- Haz clic en aceptar para que se desplieguen los cálculos de regresión.


9.- Observa los cálculos de regresión en la siguiente hoja del programa SPSS.


CÁLCULO DE CHI CUADRADO EN EL SPSS

Se ha realizado una encuesta a 17 persona vinculadas con el comercio

exterior acerca de acuerdo al nivel que tienen de ceptaciooon con la

restriccion que puso el gobierno a la importaciómn de celulares.

Ho= la dependencia que existe entre las empresas vinculadas con el comercio

exterior y el nivel de acuerdo sobre el porcentaje a la importacion de celulares

Ha = no exite dependencia entre las empresas vinculadas con el comercio

exterior y el nivel de acuerdo sobre el porcentaje a la importacion de celulares.

CALCULO EN EL SPSS DEL CHI CUADRADO

1. Ingresamos los datos al SPSS en este caso deben ser tablas de

contingencia para poder analizar.

2. Nos ubicamos en la barra de herramientas y damos clic en analizar,

estadísticos descriptivos y tablas de contingencia.


3. Se nos desplegara un cuadro de dialogo en el cual aparecerán nuestras

variables.

4. Determinaremos que variable ira en las filas y que variable ira en las

columnas y las pasaremos con las flechas que tiene el cuadro de

dialogo.


5. Damos clic en exacta para determinar el nivel de confianza.

6. Clic en continuar

7. Clic en estadísticos para colocar el estadístico chi cuadrado

8. Clic en continuar


9. A continuación damos clic en casillas donde nos aparece otro cuadro de

dialogo y hacemos clic en observadas, esperadas y en porcentajes.

10. Clic en continuar y aceptar.

A continuación nos aparecerá otra hoja del SPSS donde nos mostrara los

resultados obtenidos y podremos observar si aceptamos la hipótesis nula o si la

rechazamos y aceptamos la hipótesis alternativa.

CÁLCULO DE LA VARIANZA EN EL SPSS

Podremos calcular el grado de dispersión que tienen los datos

1.- Se selecciona la opción analizar y escoge la opción frecuencias.


2.- En el cuadro de dialogo que aparece traslada las variable dependiente a la

derecha.


3.- Haz clic en la opción ―estadísticos‖.

4.- En esta ventana haz clic en varianza y luego clic en continuar

5.- Observa los resultados en la hoja de cálculo del SPSS


CÁLCULO DE LA T STUDENT EN EL SPSS

Podemos calcular la aceptación o rechazo de una hipótesis siempre y

cuando la cantidad de datos no supere los 30 donde las exportaciones en

valor FOB y entoneladas de un año son las variables.

Ho = las exportaciones en valor FOB son iguales a las exportaciones en

toneladas

Ha = las exportaciones en valor FOB son diferentes a las exportaciones en

toneladas

1.- Elige la opción analizar, donde se despliega otra ventana y selecciona

prueba T para una muestra.


2.- En el cuadro de dialogo Traslada la variable hacia la ventana derecha.

3.- Haz clic en continuar.

4.- Observa los resultados en la hoja de cálculo del SPSS.


CONCLUSIONES:

Como vemos los estadísticos como correlación lineal, regresión lineal, prueba

de hipótesis, t de Student, Chi- cuadrado, varianza, nos permiten determinar las

relaciones de las variables poblacionales, sean estas cualitativas o cuantitativa,

para las cualitativas tenemos el chi- cuadrado que permite determinar variables

que carecen de unidad.

Cada uno de los estadísticos nos ayudan a determinar la situación de las

variables en las cuales existen problemas o desconocimiento de la realidad del

entorno en estudio, principalmente muestral, a medida que aplicamos los

estadísticos correctamente, los datos que nos bota cada permitirá aclarar

dudas o lo que se desconoce de ciertos aspectos en el campo empresarial,

económico, financiero, social, educacional, en fin de cualquier área que se

desee investigar el comportamiento de las variables ya sean cualitativas o

cuantitativas y la posterior toma de decisiones.


Seguir todos y cada uno de los pasos hasta llegar a insertar todos los datos en

el software, esto nos ayudara a ubicarlos correctamente en su pantalla

principal para continuar con una aplicación correcta de la investigación o del

estudio de las variables.

Los diferentes programas para la resolución e interpretación de variables

estadísticas principalmente el SPSS, nos permiten descubrir el comportamiento

de cada una de las variables, con las cuales necesitamos determinar o

investigar cual es la situación actual o futura. Mediante los datos recopilados

para la investigación el SPSS ayudara a la rápida resolución estadística para

una posterior toma de decisiones.

SPSS es el programa apropiado para la correcta resolución e interpretación de

las variables, dependiendo de los datos a calcular debemos aplicar el

estadístico adecuado e inmediatamente obtendremos la gráfica requerida, lo

que nos ayudara a tomar decisiones acertadas basadas en un estudio

comprobado por el SPSS.

RECOMENDACIONES:

Es importante aplicar muy correctamente cada uno de estos estadísticos que

nos ayudaran a definir el comportamiento de las variables ya sean cualitativas

o cuantitativas para una posterior toma de decisiones.

Del como apliquemos las variables en cada estadístico, dependerá el éxito del

problema o la investigación que pretendemos descubrir o resolver, es por eso

que debemos dar a cada variable su correspondiente estadístico y de seguro

tomaremos la decisión más acertada al interpretar los datos y descubrir el

comportamiento de las variables.

Al realizar o aplicar estadísticos en el software apropiado (SPSS), debemos

llevar cada uno de los pasos indicados y que no existan fallos en la inserción

de datos y proseguir con los cálculos correspondientes.


Emplear apropiadamente el software SPSS en la interpretación de variables

muestrales estadísticas mediante un histograma, para la correcta toma de

decisiones, y de seguro éxito en nuestro proyecto o investigación que estamos

dando resolución.

Es recomendable que todos y cada uno de los datos estén clasificados entre

las variables a determinar, ya sea por género, país, actividad, etc. Esto ayudara

al programa a desarrollarse con más facilidad y a obtener los resultados más

exactos de nuestra investigación.

ANÁLISIS

Es importante conocer el uso de sistemas informáticos para el cálculo de la

estadística inferencial ya que nos permite determinar resultados de una manera

más rápida y precisa y a la vez buscar formas de solución tanto a problemas

como la factibilidad de un proyecto como también a problemas de relación con

otras variables, además, a través de la utilización de los programas estadísticos

nos podemos ahorrar tiempo y tener datos más precisos y solamente con

saber usar el SPSS y saber aplicar los estadísticos correctamente.

Es importante tener en cuenta que antes que nada debemos aprender a

realizar los cálculos estadísticos de manera manual para posteriormente

realizarlos en el programa y así lograr interpretar su significado


ANEXOS

Correlaciones

Correlaciones

EXPORTACIO

NES FOB

EXPORTACIO

NES

TONELADAS

EXPORTACIONES FOB Correlación de Pearson 1 .317*

Sig. (bilateral) .043

N 41 41

EXPORTACIONES

TONELADAS

Correlación de Pearson .317* 1

Sig. (bilateral) .043

N 41 41

*. La correlación es significante al nivel 0,05 (bilateral).

Regresión

Variables introducidas/eliminadasb

Model

o

Variables

introducidas

Variables

eliminadas

Método

1 EXPORTACIO

NES FOBa

. Introducir

a. Todas las variables solicitadas introducidas.

b. Variable dependiente: EXPORTACIONES

TONELADAS

Resumen del modelob

Model

o

R R cuadrado R cuadrado

corregida

Error típ. de la

estimación

1 .317a .101 .078 152421.164

a. Variables predictoras: (Constante), EXPORTACIONES FOB

b. Variable dependiente: EXPORTACIONES TONELADAS

ANOVAb

Modelo Suma de

cuadrados

gl Media

cuadrática

F Sig.

1 Regresión 1.014E11 1 1.014E11 4.366 .043a

Residual 9.061E11 39 2.323E10


Total 1.007E12 40

a. Variables predictoras: (Constante), EXPORTACIONES FOB

b. Variable dependiente: EXPORTACIONES TONELADAS

Coeficientesa

Modelo Coeficientes no estandarizados Coeficientes

tipificados

B Error típ. Beta t Sig.

1 (Constante) 2058480.667 106316.321 19.362 .000

EXPORTACIONES FOB .139 .066 .317 2.090 .043

a. Variable dependiente: EXPORTACIONES TONELADAS

Coeficientesa

Modelo Intervalo de confianza de 99,0%

para B

Límite inferior Límite superior

1 (Constante) 1770585.299 2346376.035

EXPORTACIONES FOB -.041 .318



Estadísticos sobre los residuosa

Mínimo Máximo Media Desviación

típica

N

Valor pronosticado 2169559.00 2352589.25 2274989.22 50356.849 41

Residual -292126.719 323109.656 .000 150503.841 41

Valor pronosticado tip. -2.094 1.541 .000 1.000 41

Residuo típ. -1.917 2.120 .000 .987 41


Gráficos


Prueba T

Estadísticos de muestras relacionadas

Media N Desviación típ. Error típ. de la

media

Par 1 EXPORTACIONES

TONELADAS

2274989.22 41 158704.815 24785.528

EXPORTACIONES FOB 1560876.00 41 363037.841 56696.985

Correlaciones de muestras relacionadas

N Correlación Sig.

Par 1 EXPORTACIONES

TONELADAS y

EXPORTACIONES FOB

41 .317 .043


Prueba de muestras relacionadas

Diferencias relacionadas

Media Desviación típ. Error típ. de la

media

Par 1 EXPORTACIONES

TONELADAS -

EXPORTACIONES FOB

714113.220 347017.015 54194.953


Diferencias relacionadas

99% Intervalo de confianza para

la diferencia

Inferior Superior

Par 1 EXPORTACIONES

TONELADAS -

EXPORTACIONES FOB

567545.177 860681.262


t gl Sig. (bilateral)

Par 1 EXPORTACIONES

TONELADAS -

EXPORTACIONES FOB

13.177 40 .000

Tablas de contingencia

Resumen del procesamiento de los casos

Casos

Válidos Perdidos Total

N Porcentaje N Porcentaje N Porcentaje

EXPORTACIONES

TONELADAS *

EXPORTACIONES FOB

41 95.3% 2 4.7% 43 100.0%


Pruebas de chi-cuadrado

Valor gl Sig. asintótica

(bilateral)

Chi-cuadrado de Pearson 1640.000a 1600 .238

Razón de verosimilitudes 304.513 1600 1.000

Asociación lineal por lineal 4.027 1 .045

N de casos válidos 41

a. 1681 casillas (100,0%) tienen una frecuencia esperada inferior a 5. La

frecuencia mínima esperada es ,02.

Frecuencias

Estadísticos

EXPORTACIO

NES

TONELADAS

EXPORTACIO

NES FOB

N Válidos 41 41

Perdidos 2 2

Varianza 2.519E10 1.318E11

Tabla de frecuencia

EXPORTACIONES TONELADAS

Frecuencia Porcentaje Porcentaje

válido

Porcentaje

acumulado

Válidos 1944753 1 2.3 2.4 2.4

2029567 1 2.3 2.4 4.9

2062106 1 2.3 2.4 7.3

2082129 1 2.3 2.4 9.8

2087716 1 2.3 2.4 12.2

2094673 1 2.3 2.4 14.6

2109277 1 2.3 2.4 17.1

2111688 1 2.3 2.4 19.5

2126750 1 2.3 2.4 22.0

2129090 1 2.3 2.4 24.4

2131598 1 2.3 2.4 26.8

2135589 1 2.3 2.4 29.3

2159617 1 2.3 2.4 31.7


2200673 1 2.3 2.4 34.1

2207587 1 2.3 2.4 36.6

2213808 1 2.3 2.4 39.0

2263398 1 2.3 2.4 41.5

2266774 1 2.3 2.4 43.9

2268435 1 2.3 2.4 46.3

2275843 1 2.3 2.4 48.8

2276219 1 2.3 2.4 51.2

2276238 1 2.3 2.4 53.7

2291789 1 2.3 2.4 56.1

2309041 1 2.3 2.4 58.5

2325590 1 2.3 2.4 61.0

2329229 1 2.3 2.4 63.4

2345900 1 2.3 2.4 65.9

2352703 1 2.3 2.4 68.3

2356567 1 2.3 2.4 70.7

2371979 1 2.3 2.4 73.2

2374973 1 2.3 2.4 75.6

2386512 1 2.3 2.4 78.0

2391048 1 2.3 2.4 80.5

2395715 1 2.3 2.4 82.9

2427325 1 2.3 2.4 85.4

2440271 1 2.3 2.4 87.8

2471923 1 2.3 2.4 90.2

2502616 1 2.3 2.4 92.7

2516369 1 2.3 2.4 95.1

2555781 1 2.3 2.4 97.6

2675699 1 2.3 2.4 100.0

Total 41 95.3 100.0

Perdidos Sistema 2 4.7

Total 43 100.0

EXPORTACIONES FOB

Frecuencia Porcentaje Porcentaje

válido

Porcentaje

acumulado

Válidos 800798 1 2.3 2.4 2.4

873693 1 2.3 2.4 4.9

993825 1 2.3 2.4 7.3


1018148 1 2.3 2.4 9.8

1113441 1 2.3 2.4 12.2

1167336 1 2.3 2.4 14.6

1212690 1 2.3 2.4 17.1

1237432 1 2.3 2.4 19.5

1249447 1 2.3 2.4 22.0

1286133 1 2.3 2.4 24.4

1328430 1 2.3 2.4 26.8

1334448 1 2.3 2.4 29.3

1359233 1 2.3 2.4 31.7

1360062 1 2.3 2.4 34.1

1369489 1 2.3 2.4 36.6

1392258 1 2.3 2.4 39.0

1397918 1 2.3 2.4 41.5

1467517 1 2.3 2.4 43.9

1469969 1 2.3 2.4 46.3

1489381 1 2.3 2.4 48.8

1514772 1 2.3 2.4 51.2

1576829 1 2.3 2.4 53.7

1613436 1 2.3 2.4 56.1

1621543 1 2.3 2.4 58.5

1690476 1 2.3 2.4 61.0

1726282 1 2.3 2.4 63.4

1772258 1 2.3 2.4 65.9

1827860 1 2.3 2.4 68.3

1831303 1 2.3 2.4 70.7

1856081 1 2.3 2.4 73.2

1863189 1 2.3 2.4 75.6

1868972 1 2.3 2.4 78.0

1974010 1 2.3 2.4 80.5

1975163 1 2.3 2.4 82.9

2009483 1 2.3 2.4 85.4

2021540 1 2.3 2.4 87.8

2032005 1 2.3 2.4 90.2

2053808 1 2.3 2.4 92.7

2060096 1 2.3 2.4 95.1

2064843 1 2.3 2.4 97.6

2120319 1 2.3 2.4 100.0

Total 41 95.3 100.0

Perdidos Sistema 2 4.7

Total 43 100.0


Prueba T

Estadísticos para una muestra

N Media Desviación típ. Error típ. de la

media

EXPORTACIONES

TONELADAS

12 2279029.33 171968.265 49642.962

EXPORTACIONES FOB 12 1155254.08 203515.472 58749.856

Prueba para una muestra

Valor de prueba = 0

t gl Sig. (bilateral) Diferencia de

medias

EXPORTACIONES

TONELADAS

45.908 11 .000 2279029.333

EXPORTACIONES FOB 19.664 11 .000 1155254.083

Prueba para una muestra

Valor de prueba = 0

99% Intervalo de confianza para

la diferencia

Inferior Superior

EXPORTACIONES

TONELADAS

2124847.90 2433210.77

EXPORTACIONES FOB 972788.40 1337719.77

5297,75 6910,11 8292,13 6202,25 8089,89 9707,86 297,66 280.22 246.96 206,03 243,14 233,77 248,33 202,85 6,62 7,815

Portafolio

Documents

Portafolio