Top Banner

of 53

Modulometodosestadisticos USS

Aug 07, 2018

Download

Documents

Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
  • 8/20/2019 Modulometodosestadisticos USS

    1/141

     

    MODULO EDUCATIVO DEL CURSO

    DE MÉTODOS ESTADÍSTICOS 

     Autor: Msc. César A. Zatta Silva

    Universidad Señor de Sipan

    2011-I

  • 8/20/2019 Modulometodosestadisticos USS

    2/141

     

    INTRODUCCIÓN

     Las acciones que acometemos hoy

     se basan en un plan de ayer ylas expectativas del mañana. 

    Para satisfacer las necesidades de conocimiento sobre los Métodos Estadísticos, seha diseñado este módulo teniendo en consideración los objetivos señalados en lascompetencias, capacidades y actitudes que el alumno debe alcanzar en este curso.

    Se contempla en este curso que los estudiantes conozcan el origen de la palabraestadística, las técnicas de recolección, organización, conservación, y tratamientode los datos para su análisis y posterior interpretación de la información.

    En nuestros días, son de uso cotidiano las diferentes técnicas estadísticas que partiendo de observaciones muestrales o históricas, crean modelos lógico-matemáticos que se "aventuran" describir o pronosticar un determinado fenómenocon cierto grado de certidumbre medible.

    El avance tecnológico en la informática ha contribuido enormemente al desarrollode la estadística, sobre todo en la manipulación de la información, pues en el

    mercado existen paquetes estadísticos de excelente calidad como el SPSS y MSExcel que ya existe en el computador sin mayores exigencias técnicas,

  • 8/20/2019 Modulometodosestadisticos USS

    3/141

     

    Contenido

    Semana 1 Introducción, reseña histórica, contenidos. Objetivos. Definición de Estadística.Conceptos básicos importantes. Importancia y objeto de la estadística. Elementos

     básicos: Población, muestra, variable, unidad de estudio, parámetro. Clasificación de lasvariables.

    Semana 2 Organización y presentación de los datos. Tablas de distribución de frecuencias.Tipos de tablas estadísticas. Procesamiento de datos en cuadros y gráficos estadísticos.

    Semana 3 Métodos Estadísticos en la investigación, etapas de la investigación estadística:Planeamiento, organización, análisis e interpretación de datos, formulación deconclusiones. Técnicas de recolección de datos, observación, entrevista, cuestionario,encuestas por muestreo, sistemas de recolección.

    Semana 4 Medidas de Tendencia Central: Media Aritmética. Media Ponderada. Mediana.Moda. Medidas de Posición: Cuartiles. Deciles y Percentiles.

    Semana 5 Medidas de Dispersión. Descripción de las medidas de dispersión: Rango,Desviación y Varianza para datos simples y agrupados, Coeficiente de Variación 

    Semana 6 Introducción al Cálculo de Probabilidades. Experimento aleatorio, espaciomuestral, suceso o evento. Definición de Probabilidad Clásica, Probabilidad deFrecuencia Relativa, Probabilidad Subjetiva. Combinación, Variación, Permutación.

    Semana 7 Probabilidad de un evento. Teorema de la adición y de la complementación. Reglasde multiplicación y de probabilidad total. Probabilidad Condicional. Teorema de Bayes.

    Semana 8 Variables aleatorias. Función de probabilidad. Variables aleatorias discretas ycontinuas.Distribuciones discretas de probabilidad. Distribución Binomial y de Poisson.

    Distribuciones continuas de probabilidad. Distribución Normal. Uso de Tablas

    Semana 9 Primer Examen Parcial

    Semana 10 Introducción a la Inferencia Estadística. Métodos y distribuciones de muestreo.Muestreo de la población. Métodos de muestreo probabilístico. Error de muestreo.Distribución de muestreo de medias muestrales. Tamaño de muestra.

    Semana 11 Introducción a la Teoría de la estimación Estadística.Estimaciones puntuales eIntervalos de Confianza sobre parámetros.

    Semana 12 Prueba de Hipótesis, introducción, hipótesis estadísticas, pasos para una verificación dehipótesis. Hipótesis para la media poblacional. Prueba de Hipótesis para una varianza

     poblacional y una proporción poblacional.Semana 13 Análisis de tendencia o series de tiempo. Análisis de regresión, formas de encontrar la

    regresión simple. Método de los mínimos cuadrados. La tendencia lineal.

    Semana 14 Correlación y desviación estándar. Tasas y Números Índices, aplicación de los númerosíndices.

    Semana 15 Control de Calidad y Procesos Estadísticos. Aplicación de la estadística en trabajo deInvestigación. Presentación de Diagnóstico en Proyecto Integrador.

    Semana 16 Segundo Examen Parcial

  • 8/20/2019 Modulometodosestadisticos USS

    4/141

     

    Semana 1

    ESTADÍSTICA

    La Estadística es la ciencia que nos ofrece un conjunto de métodos y técnicas para: Recolectar,

    Resumir, Procesar, Presentar , Analizar e Interpretar un conjunto de datos, con la finalidad deconocer el problema, proyectar su comportamiento y colaborar en la toma de decisiones sobredicho problema.

    Otra definición: La estadística es una rama de las matemáticas, constituye uno de los idiomasesenciales para comunicarse en el mundo universal de la ciencia y la tecnología. Aquellos

     profesionales que no conozcan Estadística tendrán serias dificultades para ser expertos en surespectivo campo científico.

    ImportanciaLos métodos estadísticos tradicionalmente se utilizan para propósitos descriptivos, para

    organizar y resumir datos numéricos. La estadística descriptiva,  por ejemplo trata de latabulación de datos, su presentación en forma gráfica o ilustrativa y el cálculo de medidasdescriptivas.

    Ahora bien, las técnicas estadísticas se aplican de manera amplia en mercadotecnia, contabilidad,control de calidad y en otras actividades; estudios de consumidores; análisis de resultados endeportes; administradores de instituciones; en la educación; organismos políticos; médicos; y porotras personas que intervienen en la toma de decisiones 

    Método que sigue la Estadística

    Recolectar Resumir y Ordenar Procesar

    E S T A D I S T I C A

    Tomar decisiones Analizar e Interpretar Presentar

    Clasificación: La Estadística para su mejor estudio se ha dividido en dos grandes ramas: laEstadística Descriptiva y la Inferencial.

    Estadística Descriptiva: Comprende a los procesos de consolidación, resumen y descripción delos datos recopilados. Consiste sobre todo en la presentación de datos en forma de tablas ygráficas. Esta comprende cualquier actividad relacionada con los datos y está diseñada pararesumir o describir los mismos sin factores pertinentes adicionales; esto es, sin intentar inferirnada que vaya más allá de los datos, como tales.

    Estadística Inferencial: Incluye procedimientos que permiten la extrapolación y generalizaciónsobre características que tipifican a todos los elementos de la población. Es decir, la inferencia

  • 8/20/2019 Modulometodosestadisticos USS

    5/141

     

    estadística es el proceso de hacer afirmaciones o predicciones sobre toda la población tomandocomo base sólo a la información recabada a través de una muestra representativa.

    CONCEPTOS FUNDAMENTALES

    1.  POBLACIÓN: Es el conjunto de todos los datos que intervienen en una investigación.Al número de elementos de una población se denota por “ N.” 

    Población finita: Es el conjunto finito de unidades de análisis donde se puede identificar aun elemento inicial y/o a un elemento final.Ejemplo: Población de hoteles de Lima, población de agencias de viaje existentes en laciudad de Cajamarca, turistas de nacionalidad alemana que ingresaron al Perú en el año2000.

    Población Infinita: Conjunto infinito de elementos donde no se podría identificar a unaunidad inicial ni a la unidad final.

    Ejemplo: la población de los peces del mar, los árboles de la selva peruana

    2.  MUESTRA: Es una parte de la población y como tal es también un conjunto de datos. Al número de elementos de una muestra se denota por “n”. Una muestra tiene 2 características principales: Es representativa y es adecuada.

    Muestra No Probabilística: Corresponde al subconjunto de observaciones elegidassiguiendo un criterio de representatividad establecida arbitrariamente por el investigador.Ejm. Analizo todos los ratones que son de color blanco del total de ratones

    Muestra Probabilística: Comprende a las observaciones realizadas en unidades que hansido elegidas siguiendo un criterio probabilístico, esto es a cada unidad de la población seasigna probabilidad conocida para estar incluida como parte de la muestra. Ejm. Sacar 2

     pelotas blancas de una canasta de 8 pelotas entre blancas y negras.

    3.  UNIDAD DE ESTUDIO: Es el objeto o elemento indivisible que será estudiado. Esquien nos va a dar la información.Ejemplo: Se va a estudiar la capacidad hotelera de la ciudad de Lima, se define la unidadde análisis “hotel” 

    4.  VARIABLE: Es una característica de estudio de una población, que toma diferentes

    valores Las variables son características observables referidas a la unidad de estudio. Se denota por las letras X, Y, Z, etc. Se clasifican en:

    4.1 Variable cualitativa : Son aquellas variables que expresan cualidades o atributos, yque por tanto su medida no tiene un carácter numérico, esta variables pueden ser:Nominales  Sus valores representan un atributo a manera de etiqueta y no contieneinformación sobre ordenamiento. Ejm. Sexo del cliente, nacionalidad del entrevistado,etc.Ordinales  Sus valores sí representan un ordenamiento del atributo. Ejm. Grado deeducación del entrevistado, grado de satisfacción sobre la atención recibida por el cliente,

    etc.

  • 8/20/2019 Modulometodosestadisticos USS

    6/141

     

    4.2 Variable Cuantitativa: Comprende aquellos conceptos que sí pueden ser expresadosen forma numérica porque corresponde a criterios de cantidad. Pueden ser:v. c. Discretas  Son variables que toman valores que se expresan en números enteros. Esel resultado del proceso de conteo. Ejm. Número de empleados, Número de habitaciones,Total de alumnos, etc.

    v.c. Continuas  Son aquellas variables que sus cantidades se expresan con númerosreales, es decir, tienen parte fraccionaria. Son el resultado del proceso de medición. Ejm.Ingresos totales mes de julio, costo de servicio diario del hotel, toneladas embarcadas,etc.

    Ejemplos:El alumno deberá identificar las variables para las unidades de estudio siguiente*UNIDAD DE ESTUDIO: Estudiante Variables: Peso, edad, talla, tipo de sangre, color de ojos, ingreso familiar, número de hermanos,etc.*UNIDAD DE ESTUDIO: Empresa 

    Variables: Ventas, ganancias, número de trabajadores, número de computadoras, gastos en publicidad, etc.

    Práctica Calificada Nº 01

    A.  Determina la población y la muestra, y la variable de los siguientes ejemplos:1.  Tiempo dedicado a las tareas domésticas por los hombres y las mujeres que trabajan fuera

    del hogar en Lambayeque2.  Estudios que quieren hacer las alumnas y los alumnos del Colegio Manuel Pardo al

    terminar la Educación Secundaria3.  Intención de voto en unas elecciones municipales4.  Horas que dedican a ver televisión los estudiantes de educación primaria del colegio San

    José5.   Número de aparatos de radio que hay en los hogares chiclayanos6.  Se quiere realizar un estudio para determinar la cantidad promedio de huevos que ponen

    los pingüinos hembras en el período reproductivo en Puerto Maldonado.7.  Se quiere determinar la audiencia de cierto programa televisivo de televisión de aire.8.  Se requiere determinar el grado de afectación que tuvo la salmonella en las gallinas

     provenientes de las granjas del empresario Gonzales

    9.  Se quiere estimar el grado de aceptación que tiene la mermelada de carambola en la zonaoeste de Chiclayo

    B.  De las siguientes variables, determinar cuáles son cualitativas y cuales son cuantitativasdiscretas o cuantitativas continuas1.  Precio del pollo2.  Angulo de inclinación de los puentes3.  Grado de instrucción de los postulantes4.  Color de ojos de las finalistas5.  Peso promedio de las bolsas6.   Número de taxis que ingresan por hora a Chiclayo

    7.  Comida favorita8.   Número de goles marcados por la selección9.  Profesión que te gusta

  • 8/20/2019 Modulometodosestadisticos USS

    7/141

     

    10. Coeficiente intelectual de tus compañeros de clase11. El color de los ojos de tus compañeros de clase12. Temperaturas registradas en verano13.  Número de acciones vendidas en la Bolsa de valores14. Diámetro de las ruedas de varios coches

    15. Censo anual de los españoles16.  Número de libro en un estante17. Litros de agua contenidos en un depósito18. La profesión de una persona19. Suma de puntos obtenidos en un lanzamiento de dados

    C.  Determina lo siguiente:

    CASO Nº 01:Dentro de los estudios sociales que realiza el Dr. Pauling sobre rendimiento y característicascognoscitivas de los alumnos pertenecientes al Colegio Público San Carlos, ha llegado a

    resultados inesperados. Unidad de estudioVariable de estudioPoblaciónMuestra

    CASO Nº 02Un proveedor de servicios de línea blanca desea saber cuál es la marca preferida de cocinas delas amas de casa pertenecientes a la ciudad de Chiclayo. Para llevar a cabo esta investigación,selecciona a 120 amas de casa que fueron escogidas según la zona de la ciudad de Chiclayo.Unidad de estudioVariable de estudioPoblaciónMuestra

    CASO Nº 03Un investigador de mercado quiere saber cuál es la marca de detergente que más se utiliza o más

     prefieren las amas de casa de la ciudad de Chiclayo. Para llevar a cabo esta investigaciónselecciona una muestra de 504 amas de casa que fueron escogidas según zona o urbanización dela ciudad de Chiclayo.Unidad de estudio Amas de casa

    Variable de estudio Marca de detergente (tipo cualitativa nominal)Población Amas de casa de la ciudad de ChiclayoMuestra 504 amas de casa

    CASO Nº 04:El Ingeniero de Producción de Cerveza Cristal en Motupe, dentro de su evaluación diaria, deseasaber si el brix (grado de azúcar), porcentaje de alcohol, tiempo de maduración, etc, hancumplido con las parámetros de calidad en la producción del fin de semana.Unidad de estudio CervezaVariable de estudio Brix, porcentaje de alcohol, tiempo maduración

    (cuantitativa)Población Producción de cerveza del fin de semanaMuestra Producción de cerveza de un día

  • 8/20/2019 Modulometodosestadisticos USS

    8/141

     

    CASO Nº 05:Un investigador social desea saber cuáles son las características socio demográficas que influyenen el rendimiento académico de los Estudiantes de la Universidad Señor de Sipan, de laespecialidad de Ingeniería Agroindustrial matriculados en el 2º Semestre-Año 2006.Unidad de estudio Estudiante

    Variable de estudio Características socio demográficasPoblación Estudiantes matriculados de Ing. Agroindustrial de la USS

    (cualitativa)Muestra Alumnos matriculados del 2º semestre

    CASO Nº 06:El gerente del Grifo “San Luis” ubicado en el ovalo  está haciendo un estudio de factibilidad paradeterminar si es conveniente la instalación de un nuevo servidor de gasolina en dichoestablecimiento. Para realizar este estudio toma información sobre el tiempo que se demora endar el servicio y el tiempo que demora en llegar el usuario (automóvil).Unidad de estudio Usuario de automóvilVariable de estudio Tiempo en dar el servicio y tiempo llegar usuario

    (cuantitativa)Población Todos los clientes del grifoMuestra Algunos clientes del grifo

    CASO Nº 07Un investigador de mercado quiere saber cuál es la marca de jabones que más se utiliza o más

     prefieren las empleadas de casa de la ciudad de Tarapoto. Para llevar a cabo esta investigaciónselecciona una muestra de 610 empleadas que fueron escogidas según zona o urbanización de laciudad de Tarapoto.

    Unidad de estudioVariable de estudioPoblaciónMuestra

  • 8/20/2019 Modulometodosestadisticos USS

    9/141

     

    Semana 2

    ORGANIZACIÓN DE DATOS Y DISTRIBUCIONES DEFRECUENCIA

    Frecuencia: (fi) Número de individuos o elementos que pertenecen o aparecen en cadacategoría.

    1. ORGANIZACIÓN DE VARIABLES CUALITATIVAS: Comprende la representacióngráfica de conceptos cualitativos y/o atributos que se registran para las unidades de análisis.Ejemplo:El número de turistas que registraron su ingreso por el aeropuerto de Chiclayo el mes deFebrero, se registra según su nacionalidad

    NACIONALIDAD Número de Turistas (fi)Argentina 20Boliviana 10Brasileña 5Venezolana 15TOTAL 50

    2. ORGANIZACIÓN DE VARIABLES CUANTITATIVAS DISCRETAS: Comprendeclasificaciones de variables que sólo toman valores enteros, por tanto las unidades de análisis seordenan de acuerdo con sus propios valores. Ejm:

    Las puntuaciones obtenidas por los 30 alumnos del curso de Física I, fueron:

    [12,11,13,13,10,10,12,12,09,09,08,14,12,11,14,14,14,10,10,14,13,13,11,11,14,13,14,13,14,12]

    Se consolida la información en una Tabla de Frecuencia:

     NotasXi

    FrecuenciaAbsoluta ( fi )

    FrecuenciaRelativa ( hi)

    Frecuencia AcumuladaAbsoluta

    (Fi)Relativa

    (Hi)08 1 0.03 1 0.0309 2 0.07 3 0.1010 4 0.13 7 0.2311 4 0.13 11 0.3612 5 0.17 16 0.5313 6 0.20 22 0.73

    14 8 0.27 30 1.00TOTAL 30 1.00

    El gráfico que corresponde a esta tabla de frecuencia se denomina: HistogramaHistograma de frecuencias absolutas Histograma de frecuencias absolutas acumuladas

  • 8/20/2019 Modulometodosestadisticos USS

    10/141

     

    3. ORGANIZACIÓN DE VARIABLES CUANTITATIVAS CONTINUAS: Comprendeclasificaciones de unidades de análisis resultantes de una medición, que en ocasiones tomanvalores decimales. Ejemplo:El Gran Hotel Chiclayo, durante los últimos 32 días, el valor de las compras en revistas y

     periódicos para la sala de recepción fueron:

    Esta información diaria y dispersa no permitirá analizar su comportamiento, es necesarioresumirla en una tabla de frecuencia. Para organizar una tabla de frecuencia se deberá seguir el

     procedimiento siguiente:

    * Elegir el número de intervalos de clase ( k )Se puede utilizar la regla se Sturges: k = 1 + 3.322 log n Donde: k = número de intervalos

    n = número de datosEn el ejemplo: k = 1 + 3.322 Log(32) = 5.967 = Aprox. 6 intervalos

    * Determinar el Tamaño del Intervalo de Clase ( c )c = A/kA= Amplitud de los datos = (Observación máxima –  Observación Mínima) = 10.2 –  5.2 =

    5.0k = 6Por tanto: c = 5.0 / 6 = 0.8333 = Aproximadamente = 0.9

    * Realizar la clasificación y el conteo de datos en cada clase construida

    * Construir la Tabla de FrecuenciaIntervalo de clase(escala de gasto)

    Marca de ClaseXi

    FrecuenciaAbsoluta

    fi

    FrecuenciaRelativa

    hi

    Frec. Acumul.Absoluta

    Fi

    Frec. Acumul.Relativa

    Hi

    [ 5.2 –  6.1 ) 5.65 3 0.094 3 0.094[ 6.1 –  7.0 ) 6.55 5 0.156 8 0.250[ 7.0 –  7.9 ) 7.45 9 0.281 17 0.531[ 7.9 –  8.8 ) 8.35 7 0.219 24 0.750[ 8.8 –  9.7 ) 9.25 5 0.156 29 0.906

    [ 9.7 –  10.6 ) 10.15 3 0.094 32 1.000TOTAL 32 1.000

  • 8/20/2019 Modulometodosestadisticos USS

    11/141

     

    Análisis de la distribución de frecuencias:* ¿Cuántos días el hotel gastó “de 7.0 a menos de 7.9 soles”?  : 9 días* ¿Cuántos días el hotel gastó “menos de 7.9 soles”?  : 17 días* ¿Cuántos días el hotel gastó “menos de 9.7 soles”?  : 29 días* ¿Qué porcentaje de días el hotel gastó “menos de 7.9 soles”?  : 53.1%

    * ¿Qué porcentaje de días el hotel gastó “más de 7.9 soles”?  : 46.9 %

    Polígono de Frecuencias: Es la línea que une los puntos medios de los lados superiores (marcasde clase) de un histograma. Los puntos o vértices del polígono de frecuencias están situados, portanto, en las marcas de clase, ya que estos corresponden a los puntos medios de los intervalos.

    Histograma y Polígono de Frecuencias

  • 8/20/2019 Modulometodosestadisticos USS

    12/141

     

    USO DE MS EXCEL

    Construcción tablas tipo A en EXCEL: Para variables cualitativas y cuantitativas discretas 

    Color f F h HAzul =contar.si($B$2:$H$11;B14) 21

    Rojo 16

    Verde 13

    Negro 8

    Blanco 12

    Construcción tablas tipo B en EXCEL: Para variables cuantitativas continuasLas densidades de los materiales en estudio fueron:

     n = contar (celda inicio: celda final)

    K = numero de intervalos, con fórmula

    Xmin= Valor Mínimo = MIN (celda)

    Xmax= Valor Máximo = MAX( celda)

    Rango = Max – MinC = R/K

    Intervalos f

    = Frecuencia (datos; grupos) B2:H8 Todos los datos

    = Frecuencia (B2:H8; D22:D28) D22:D28 La columna de datos del límite superior

  • 8/20/2019 Modulometodosestadisticos USS

    13/141

     

    PRESENTACIÓN DE DATOS MEDIANTE GRÁFICOS ESTADÍSTICOS 

    Los gráficos son medios popularizados y a menudo los más convenientes para presentar datos, seemplean para tener una representación visual de la totalidad de la información. Los gráficosestadísticos presentan los datos en forma de dibujo de tal modo que se pueda percibir fácilmentelos hechos esenciales y compararlos con otros.

    TIPOS DE GRÁFICOS

    Gráficos de barras verticalesRepresentan valores usando trazos verticales, aislados o separados unos de otros, según lavariable a graficar sea discreta o continua. Pueden usarse para comparar y representar: una serie;dos o mas series

    Gráficos de barras horizontalesRepresentan valores discretos a base de trazos horizontales, aislados unos de otros. Se utilizancuando los textos correspondientes a cada categoría son muy extensos. Pueden usarse para unaserie, dos o más series.

  • 8/20/2019 Modulometodosestadisticos USS

    14/141

     

    Gráficos de barras proporcionalesSe usan cuando lo que se busca es resaltar la representación de los porcentajes de los datos quecomponen un total. Las barras pueden ser: Verticales u Horizontales

    Gráficos de líneasEn este tipo de gráfico se representan los valores de los datos en dos ejes cartesianos ortogonalesentre sí. Estos gráficos se utilizan para representar valores con grandes incrementos entre sí. Se

     pueden usar para representar una serie, dos o más series.

    Gráficos circulares

    Estos gráficos nos permiten ver la distribución interna de los datos que representan un hecho, enforma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menorvalor, según lo que se desee destacar. Pueden ser: En dos dimensiones o tres dimensiones

    Gráficos de ÁreasEn estos tipos de gráficos se busca mostrar la tendencia de la información generalmente en un

     período de tiempo. Pueden ser para representar una, dos o más series; en dos dimensiones o en tresdimensiones.

  • 8/20/2019 Modulometodosestadisticos USS

    15/141

     

    PRACTICA CALIFICADA Nº 02

    USANDO EL PAQUETE O SOFTWARE RESPECTIVO, RESOLVER LOS SIGUIENTES EJERCICIOS

    1. ¿Qué es frecuencia absoluta?

    2. Cómo se obtiene:2.1 ¿La frecuencia acumulada?2.2 ¿La frecuencia relativa?2.3 ¿La frecuencia relativa acumulada

    3. En una distribución de frecuencias ¿se pueden establecer conclusiones porcentuales,utilizando solamente la frecuencia relativa? ¿Por qué?  4. ¿Por qué se recurre al agrupamiento en distribuciones de frecuencias por intervalos?5. ¿Cómo se determina el número de intervalos y la amplitud de ellos?6. ¿Qué es una marca de clase? 

    7. La siguiente tabla relaciona las ausencias al trabajo de 50 obreros, durante el mes deoctubre, en la fábrica de confecciones "La Unión".

    1 0 2 1 3 1 4 3 2 53 2 4 2 0 3 1 2 0 21 1 0 1 0 0 1 2 1 34 0 2 3 2 0 0 2 5 22 4 2 1 3 1 2 1 0 2

    7.1 Construir una distribución de frecuencias simple.7.2 Sacar 3 conclusiones.

    8. Años de experiencia de las 50 operarias de agro exportadora “La Calidad” 

    Ordenar la Información y responder:8.1 ¿Qué porcentaje de las obreras tiene experiencia inferior o igual a 6años?

    8.2 ¿Qué porcentaje tiene experiencia entre 5 y 7 años (incluyendo los extremos)?

  • 8/20/2019 Modulometodosestadisticos USS

    16/141

     

    9. Peso de los sacos de ají páprika que fueron cosechados en los primeros 50 días de producción de la empresa Exporta SAC

    Construir una distribución de frecuencias y resaltar 3 conclusiones 

    10. Consumo de agua, en m3de 184 familias n un barrio residencial de una ciudaddurante el mes de octubre:

    Construir una distribución de frecuencias por intervalos.Comparar las distribuciones con intervalos y sin intervalos; y las conclusiones que deellas se deriven. 

  • 8/20/2019 Modulometodosestadisticos USS

    17/141

     

    MÉTODOS ESTADÍSTICOS EN LA INVESTIGACION YRECOLECCIÓN DE LA INFORMACIÓN

    Semana 3

    El método estadístico, parte de la observación de un fenómeno, y comono puede siempre mantener las mismas condiciones predeterminadas o avoluntad del investigador, deja que actúen libremente, pero se registranlas diferentes observaciones y se analizan sus variaciones.Para el planeamiento de una investigación, por norma general, se siguenlas siguientes etapas: 

    1. PLANTEAMIENTO DEL PROBLEMAAl abordar una investigación se debe tener bien definido qué se va a investigar y por qué se pretendeestudiar algo. Es decir, se debe establecer una delimitación clara, concreta e inteligible sobre el o losfenómenos que se pretenden estudiar, para lo cual se deben tener en cuenta, entre otras cosas, larevisión bibliográfica del tema, para ver su accesibilidad y consultar los resultados obtenidos porinvestigaciones similares, someter nuestras proposiciones básicas a un análisis lógico; es decir, sedebe hacer una ubicación histórica y teórica del problema.

    2. FIJACIÓN DE LOS OBJETIVOSLuego de tener claro lo que se pretende investigar, debemos presupuestar hasta dónde queremosllegar; en otras palabras, debemos fijar cuáles son nuestras metas y objetivos.Estos deben plantearse de tal forma que no haya lugar a confusiones o ambigüedades y debe,

    además, establecerse diferenciación entre lo de corto, mediano y largo plazo, así como entre losobjetivos generales y los específicos.

    3. FORMULACIÓN DE LAS HIPÓTESISUna hipótesis es ante todo, una explicación provisional de los hechos objeto de estudio, y suformulación depende del conocimiento que el investigador posea sobre la población investigada. Unahipótesis estadística debe ser susceptible de demostrar, esto es, debe poderse probar para suaceptación o rechazo.

    Una hipótesis que se formula acerca de un parámetro (media, proporción, varianza, etc.), con el propósito de rechazarla, se llama Hipótesis de Nulidad y se representa por Ho; a su hipótesis

    contraria se le llama Hipótesis Alternativa (H1).

    4. DEFINICIÓN DE LA UNIDAD DE OBSERVACIÓN Y DE LA UNIDAD DEMEDIDALa Unidad de Observación, entendida como cada uno de los elementos constituyentes de la

     población estudiada, debe definirse previamente, resaltando todas sus características; pues, al fin decuentas, es a ellas a las que se les hará la medición. La unidad de observación puede estar constituida

     por uno o varios individuos u objetos y denominarse respectivamente simple o compleja.

    El criterio sobre la unidad de medición debe ser previamente definido y unificado por todo el equipode investigación. Si se trata de medidas de longitud, volumen, peso, etc., debe establecerse bajo qué

    unidad se tomarán las observaciones ya sea en metros, pulgadas, libras, kilogramos, etc.

  • 8/20/2019 Modulometodosestadisticos USS

    18/141

     

    Asociado a la unidad de medida, deben establecerse los criterios sobre las condiciones en las cualesse ha de efectuar la toma de la información.

    5. DETERMINACIÓN DE LA POBLACIÓN Y DE LA MUESTRAEstadísticamente, la población se define como un conjunto de individuos o de objetos que poseen

    una o varias características comunes. No se refiere esta definición únicamente a los seres vivientes;una población puede estar constituida por los habitantes de un país o por los peces de un estanque,así como por los establecimientos comerciales de un barrio o las unidades de vivienda de unaciudad.

    Existen desde el punto de vista de su manejabilidad poblaciones finitas e infinitas. Aquí el términoinfinito no está siendo tomado con el rigor semántico de la palabra; por ejemplo, los peces dentro deun estanque son un conjunto finito; sin embargo, en términos estadísticos, puede ser consideradocomo infinito.

    Muestra es un subconjunto de la población a la cual se le efectúa la medición con el fin de estudiar

    las propiedades del conjunto del cual es obtenida.

    En la práctica, estudiar todos y cada uno de los elementos que conforman la población no esaconsejable, ya sea por la poca disponibilidad de recursos, por la homogeneidad de sus elementos,

     porque a veces es necesario destruir lo que se está midiendo, por ser demasiado grande el número desus componentes o no se pueden controlar; por eso se recurre al análisis de los elementos de unamuestra con el fin de hacer inferencias respecto al total de la población.

    Existen diversos métodos para calcular el tamaño de la muestra y también para tomar los elementosque la conforman, pero no es el objetivo de este curso estudiarlos. Diremos solamente que la muestradebe ser representativa de la población y sus elementos escogidos al azar para asegurar la objetividadde la investigación.

    6. LA RECOLECCIÓNUna de las etapas más importantes de la investigación es la recolección de la información, la cual hade partir, a menos que se tenga experiencia con muestras análogas, de una o varias muestras piloto enlas cuales se pondrán a prueba los cuestionarios y se obtendrá una aproximación de la variabilidad dela población, con el fin de calcular el tamaño exacto de la muestra que conduzca a una estimación delos parámetros con la precisión establecida.

    El establecimiento de las fuentes y cauces de información, así como la cantidad y complejidad de las

     preguntas, de acuerdo con los objetivos de la investigación son decisiones que se han de tomarteniendo en cuenta la disponibilidad de los recursos financieros, humanos y de tiempo y laslimitaciones que se tengan en la zona geográfica, el grado de desarrollo, la ausencia de técnica, etc.

    Es, entonces, descubrir dónde está la información y cómo y a qué "costo" se puede conseguir; esdeterminar si la encuesta se debe aplicar por teléfono, por correo, o si se necesitan agentes directosque recojan la información; establecer su número óptimo y preparar su entrenamiento adecuado.

    7. CRITICA, CLASIFICACIÓN Y ORDENACIÓNDespués de haber reunido toda la información pertinente, se necesita la depuración de los datosrecogidos. Para hacer la crítica de una información, es fundamental el conocimiento de la población

     por parte de quien depura para poder detectar falsedades en las respuestas, incomprensión a las

  • 8/20/2019 Modulometodosestadisticos USS

    19/141

     

     preguntas, respuestas al margen, amén de todas las posibles causas de nulidad de una pregunta onulidad de todo un cuestionario.

    Separado el material de "desecho" con la información depurada se procede a establecer lasclasificaciones respectivas y con la ayuda de hojas de trabajo, en las que se establecen los cruces

    necesarios entre las preguntas, se ordenan las respuestas y se preparan los modelos de tabulación delas diferentes variables que intervienen en la investigación.

    El avance tecnológico y la popularización de los computadores hacen que estas tareas, manualmentedispendiosas, puedan ser realizadas en corto tiempo.

    8. LA TABULACIÓNUna tabla es un resumen de información respecto a una o más variables, que ofrece claridad al lectorsobre lo que se pretende describir; para su fácil interpretación una tabla debe tener por lo menos: Untitulo adecuado el cual debe ser claro y conciso.La Tabla propiamente dicha con los correspondientes subtítulos internos y la cuantificación de los

    diferentes ítems de las variables, y las notas de pie de cuadro que hagan claridad sobre situacionesespeciales de la tabla, u otorguen los créditos a la fuente de la información.

    9. LA PRESENTACIÓNUna información estadística adquiere más claridad cuando se presenta en la forma adecuada. Loscuadros, tablas y gráficos facilitan el análisis, pero se debe tener cuidado con las variables que se vana presentar y la forma de hacerlo. No es aconsejable saturar un informe con tablas y gráficosredundantes que, antes que claridad, crean confusión.

    Además la elección de determinada tabla o gráfico para mostrar los resultados, debe hacerse no sóloen función de las variables que relaciona, sino del lector a quien va dirigido el informe.

    10. EL ANÁLISISLa técnica estadística ofrece métodos y procedimientos objetivos que convierten las especulacionesde primera mano en aseveraciones cuya confiabilidad puede ser evaluada y ofrecer una premisamedible en la toma de una decisión.

    Es el análisis donde se cristaliza la investigación. Esta es la fase de la determinación de los parámetros y estadísticos muestrales para las estimaciones e inferencias respecto a la población, elajuste de modelos y las pruebas de las hipótesis planteadas, con el fin de establecer y redactar lasconclusiones definitivas.

    11. PUBLICACIÓNToda conclusión es digna de ser comunicada a un auditorio. Es más, hay otros estudiosos del mismo

     problema a quienes se les puede aportar información, conocimientos y otros puntos de vista acercade él.

  • 8/20/2019 Modulometodosestadisticos USS

    20/141

     

    MÉTODOS DE RECOLECCIÓN DE DATOS PARA UNAINVESTIGACIÓN

    En una investigación científica se procede básicamente por observación, por

    encuestas o entrevistas a los sujetos de estudio y por experimentación. 

    FUENTES DE INFORMACIÓN 

    Unidades Estadísticas: Elementos componentes de la población estudiada.

    Ejemplo: personal de una empresa, habitantes del distrito de Oyotún, etc.

    La población en una investigación debe ser definida con precisión.  

  • 8/20/2019 Modulometodosestadisticos USS

    21/141

     

    FUENTES DE INFORMACIÓN

    PRIMARIAS SECUNDARIAS

    Los datos provienendirectamente de la población

    o muestra de la población

    Los datos parten de datos pre-elaborados, ejemplo: anuariosestadísticos, de Internet, de mediosde comunicación.

    Se subdividen

    en:Observación Directa: 

    Cuando el investigador toma

    directamente los datos de la población.

    Ejm: un científico realiza

    un experimento.

    Observación Indirecta: 

    Cuando los datos no son obtenidos

    directamente por el investigador.

    Usa un cuestionario u otro medio

    para obtener los datos.

    Debe realizar una encuesta

    Deben ser analizadas bajo 4 preguntas básicas que son:

    • ¿Es pertinente? cuando la información se adapta a los

    objetivos

    • ¿Es obsoleta? cuando ha perdido actualidad

    • ¿Es Fidedigna cuando la veracidad de la fuente de

    origen no es cuestionada

    • y ¿Es digna de Confianza? si la información ha sido

    obtenida con la metodología adecuada y honestidad

    necesaria, con objetividad, naturaleza continuada yexactitud

  • 8/20/2019 Modulometodosestadisticos USS

    22/141

     

    Encuesta : Constituye el término medio entre la observación y la experimentación. En

    ella se pueden registrar situaciones que pueden ser observadas y en ausencia de

    poder recrear un experimento se cuestiona a la persona participante sobre ello.

    La encuesta es un método descriptivo con el que se pueden detectar ideas,necesidades, preferencias, hábitos de uso, etc.

     

  • 8/20/2019 Modulometodosestadisticos USS

    23/141

     

  • 8/20/2019 Modulometodosestadisticos USS

    24/141

     

    Codificación. Una vez cumplimentados los cuestionarios, viene la fase derecuento de las respuestas. Cuando estas son numéricas no hay ningunadificultad, pero cuando las preguntas han tenido una contestación no numérica, espreciso traducir estas respuestas a números.Esto se conoce con el nombre de codificación.  

  • 8/20/2019 Modulometodosestadisticos USS

    25/141

     

    Por ejemplo:

    ¿Como ves el estado actual del Instituto?

    Muy Bien …………….. 5

    Bien …………….. 4

    Regular …………….. 3

    Mal …………….. 2

    Muy Mal …………….. 1

     No sabe/No contesta …………….. 0  

  • 8/20/2019 Modulometodosestadisticos USS

    26/141

     

    EJEMPLO 

    DE

    CUESTIONARIO 

     

  • 8/20/2019 Modulometodosestadisticos USS

    27/141

     

    REPASO: En el siguiente blog www.ingenieriainvestigacazasi.blogspot.com encontrará información adicional sobre los temas descritos, tales como:

      Ficha Técnica-Encuesta INEI 2007  Modelo de Encuesta  – INEI

      Caso  – Preferencia por Leche Envasada  Encuesta Servicio PLAZA VEA  Estadística en la Investigación Científica  Resultado Encuesta (Modelo Computacional)

    Se solicita organizarse en grupos ypresentar el resultado de uncuestionario aplicado a determinada

    población sobre un tema libre.

    http://www.ingenieriainvestigacazasi.blogspot.com/http://www.ingenieriainvestigacazasi.blogspot.com/http://www.ingenieriainvestigacazasi.blogspot.com/

  • 8/20/2019 Modulometodosestadisticos USS

    28/141

     

    MEDIDAS DE TENDENCIA CENTRAL

    Semana 4

    Las medidas de tendencia central,

    llamadas así porque tienden a

    localizarse en el centro de la

    información, son de gran importancia

    en el manejo de las técnicas estadísticas,

    sin embargo, su interpretación no debe

    hacerse aisladamente de las medidas de

    dispersión, ya que la representatividad

    de ellas está asociada con el grado deconcentración de la información.

    Las principales medidas de tendencia central son:

    1.  MEDIA ARITMETICA:

    Se conoce comúnmente como promedio. La media aritmética se calcula como la suma de todos losvalores que toma la característica en estudio dividida por el número total de unidades experimentales

    observadas. En símbolos:

    Como ejemplo, consideremos 10 pacientes de edades 21 años, 32, 15, 59, 60, 61, 64, 60, 71, y 80. _x = 21+32+15+59+60+61+64+60+71+80 = 52.3 años

    10

    Interpretación: La edad media de estos pacientes es de: 52.3 años

      Si se trata de datos agrupados se utiliza para variables discretas: 

    Donde: Xi = valores que toma la variable, fi = Frecuencia absoluta, n = total de datos

    Ejemplo:

  • 8/20/2019 Modulometodosestadisticos USS

    29/141

     

    Un investigador social está interesado en conocer el número promedio de hijos en una muestra de 10 familiasentrevistadas para una encuesta en particular. Luego de efectuar el trabajo de recolección de datos, el listadode las familias con su correspondiente número de hijos se formó la siguiente tabla:

    Familia No Número de Hijos1  2

    2  43  44  35  46  37  38  39  610  3

    Con esta información se construye la tabla de frecuencias de la siguiente manera: Número de Hijos (Xj) Frecuencia (fj) Xjfj

    2  1 23  5 154  3 126 1 6

    Total 10 35 _

    Luego: x = 35 = 3.510

    Interpretación:La familia promedio proporcionada por la encuesta es aquella que presenta entre 3 y 4 hijos; el valor 3,5 es elresultado matemático del cálculo de la media aritmética pero no es un valor posible de la variable por su propia definición.

      En el caso de datos numéricos continuos agrupados en intervalos de clase, el cálculo de la mediaaritmética es similar al caso anterior, es decir :

     _Y = ∑Yi fi 

    n

    Cuando se agrupan datos continuos en intervalos de clase, se pierde la información original. Luego, parasolucionar este problema, Yi se calcula como el promedio entre los extremos de cada intervalo, es decir Yirepresenta el punto medio del intervalo de clase.

    Ejemplo:Calcular la media aritmética de la longitud de 100 tornillos fabricados por una máquina.(Tabla 1)

  • 8/20/2019 Modulometodosestadisticos USS

    30/141

     

    Luego: _Y = ∑Yi fi = 1014,0 = 10,14 mm

     N 100

    Interpretación : En promedio el proceso productivo fabrica tornillos de 10,14 mm de longitud

    2.  MEDIANA: (Md o Me)

    Es el valor que ocupa la posición central de un conjunto de observaciones ordenadas. El 50% de lasobservaciones son mayores que este valor y el otro 50% son menores.

    A continuación se muestran los criterios para construir la mediana. Se puede construir los siguientes criterios:• Lo primero que se requiere es ordenar los datos en forma ascendente o descendente, cualquiera de los doscriterios conduce al mismo resultado.• Si n (tamaño de la muestra) es impar, entonces, la mediana coincide con el valor medio, el  cual correspondeal dato Xn/2.• Si n (tamaño de la muestra) es par, no existe un solo valor medio, si no que existen dos valores medios, ental caso, la mediana es el promedio de esos valores, es decir, los sumamos y luego los dividimos por dos.

    La Mediana para datos no agrupados

    Ejemplo 1:Dados los siguientes datos: 1, 2, 3, 4, 0, 1, 4, 3, 1, 1, 1, 1, 2, 1, 3 correspondientes al número de hijos de 15empleados de una empresa. Para la obtención de la mediana se deberán de ordenar.Tomemos el criterio de orden ascendente con lo que, tendremos:

    0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 3, 3, 3 4, 4

  • 8/20/2019 Modulometodosestadisticos USS

    31/141

     

    Por otro lado el número de datos n = 15, siendo el número de datos impar se elige el dato que se encuentra ala mitad, una vez ordenados los datos, en este caso es 1.

    0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 3, 3, 3 4, 4Mediana

    Interpretación: El número mediano de hijos para estos empleados es 1.Ejemplo 2:Las calderas de una planta de energía de vapor a alta presión tuvieron las siguientes eficiencias en porcentajes:90,3 - 91,6 - 90,9 - 90,4 - 90,3 - 91,0 - 87,9 - 89,4El tamaño de la muestra, n=8, número par. Luego los ordenamos y la mediana es la semisuma de los valorescentrales o sea el promedio de esos valores.87,9 - 89,4 - 90,3 - 90,3 - 90,4 - 90,9 - 91,0 - 91,6

    Mediana = 90,3 + 90,4 = 90,352

    Interpretación: El número mediano de eficiencia en porcentaje de las calderas de una planta de energía es de90,35 % aunque el mismo no sea un valor posible de la variable.

      Hallar la mediana de los siguientes datos: 7,10,15,13,10,12

    La Mediana para datos agrupados

    Si tenemos datos agrupados en tablas simples de frecuencia, procedemos de la siguiente manera:

    • Calculamos el orden que ocupa la Mediana, lo llamaremos orden de la mediana, cuya fórmula es:

    Orden = n (este valor lo observamos en la frecuencia acumulada)2Ejemplo 1:Supongamos que el gerente de personal de una empresa obtuvo los siguientes datos, correspondientes alnúmero de días que 19 de sus empleados faltan por enfermedad en un año.Luego:

    Orden = 19 = 9.5 (está contenido en Fj = 10)2

    Los datos se presentan en la siguiente tabla:

  • 8/20/2019 Modulometodosestadisticos USS

    32/141

     

    La mediana es 8Interpretación: El 50 % de los 19 empleados faltan menos de 8 días y el 50% restante más de 8 días.

    Ejemplo 2: Supongamos que la siguiente tabla corresponde a la vida útil en horas de 100 válvulas

    Orden = 100 + 1 = 101 = 50,52  2

    Esto nos indica que la mediana se encuentra entre el lugar 50 y el lugar 51. Pero, qué valores ocupan esoslugares?Por lo explicado anteriormente, desde el lugar 38 y hasta el lugar 57, hay valores 39. Luego el valor número50 y el valor número 51 son 39. Entonces:

    Mediana = 39 + 39 = 392

      Si los datos están agrupados en intervalo de clase, veamos cómo se calcula la medianaEjemplo: Tenemos los siguientes datos agrupados en una Tabla de Frecuencia que representan los montos de40 préstamos personales, en dólares, en una compañía financiera de consumidores. (Tabla Nº 4)

  • 8/20/2019 Modulometodosestadisticos USS

    33/141

     

    En este caso se emplea la siguiente fórmula:Dónde:Li = Límite Inferior del intervalo que contiene a la MedianaFi-1 = Frecuencia Acumulada en la clase anterior i-ésimafi = Frecuencia en la clase que contiene a la medianaHi-1 = Frecuencia Relativa Acumulada en la clase anterior i-ésimahi = Frecuencia Relativa en la clase que contiene a la medianac =Tamaño del intervalo de clase.

    Mediana = 930.64

    3.  MODA: (Mo) La moda es el valor que aparece con mayor frecuencia, es decir, el que ocurre más frecuentemente.

    Se dice que cuando un conjunto de datos tiene una moda la muestra es unimodal, cuando tiene dos modas bimodal, cuando la muestra contiene más de un dato repetido se dice que es multimodal y un último caso escuando ningún dato tiene una frecuencia, en dicho caso se dice que la muestra es amodal.

    Moda para datos no agrupadosSi tenemos datos sin agrupar, la encontramos fácilmente observando cuál es el valor que más se repite.

    Ejemplos:1.- Determinar la moda del siguiente conjunto de datos:a).- 1, 2, 3, 3, 4 , 5, 6, 7, 7, 3, 1, 9, 3Respuesta: La moda de este conjunto de datos es igual a 3 y si considera unimodal.

     b).- 1, 2, 3, 4, 4, 5, 2, 1, 3, 4, 2, -3, 4, 6, 3, 3Respuesta: Las modas de este conjunto de datos son 3 y 4 ya que ambas tienen la más alta frecuencia, por loque la muestra es bimodal

    c).- 1, 2, 3, 4, 5, 6, 7, 8, 9Respuesta: La muestra no contiene ningún dato repetido por lo que se considera que la muestra es amodal.

  • 8/20/2019 Modulometodosestadisticos USS

    34/141

     

    Moda para datos agrupados

      En datos agrupados en tablas simples de frecuencias, nos fijamos que valor corresponde a lamayor frecuencia absoluta. En la siguiente tabla

    En este ejemplo, la mayor frecuencia absoluta es 4, que corresponde al valor 10. Luego la Moda es10.Interpretación: La cantidad de días más frecuente que los empleados faltan por enfermedad es 10.

      En datos agrupados en intervalos de clases, existen varios métodos para calcular la Moda. Cadamétodo puede darnos un valor diferente, pero aproximado, para un mismo conjunto de datos.Se puede hallar de la siguiente manera:

    Donde: Li= extremo inferior de la clase modald1= (fi –  fi-1), d2 = ( fi –  fi+1)

    Ejemplo: Hallar la moda de la tabla Nº 4

    Solución: Mo = 685

    Interpretación: El monto de préstamos personales en dólares más frecuente otorgados por una compañíafinanciera de consumidores es de 685 dólares.

  • 8/20/2019 Modulometodosestadisticos USS

    35/141

     

    MEDIDAS DE POSICIÓN NO CENTRALES.

    CUARTILESLos cuarteles de una distribución, como si nombre lo indica, son valores de la variable que dividen al

    conjunto de datos (ordenados de menor a mayor) en cuatro subconjuntos que contienen la mismacantidad de datos.Para calcular los cuartiles de una distribución de frecuencias se procede del mismo modo que en elcaso de la mediana, salvo que ahora dividiremos a la distribución de la variable en cuatro partesiguales en lugar de dos.

    A partir de esta definición es evidente que la mediana coincide con el segundo cuartil. Los cuartelesse simbolizan con la letra Q.

    Ejemplo:

    Supongamos que un veterinario ha registrado los pesos de 8 pollos de seis semanas de vida y ordenóde menor a mayor, obteniendo:150 - 151 - 152 - 154 - 155 - 156 - 157 - 159 gramos.

    La mediana de este conjunto de datos estará posicionada entre el 4º y 5º valor de la serie, siendo:Mediana = Q2 = 154,5 gramos

    El primer cuartel Q1, debe dividir a la primera mitad de la serie en dos partes iguales, por lo cual Q1se ubicará entre el 2º y el 3º valor de la serie.

    Luego:Q1 = 151,5 gramosDel mismo modo Q3, el tercer cuartel, divide a la segunda mitad de la serie en dos partes iguales.Es decir:Q3 = 156,5 gramos

    Interpretación:Si Q1 = 151,5 gramos significa que el 25 % de los pollos tendrán un peso inferior a 151,5 gramos y

    el 75 % un peso superior a ese valor.Si Q2 = 154,5 gramos significa que el 50 % de los pollos tendrán un peso inferior a 154,5 gramos yel 50% restante superior a ese peso.Si Q3 = 156,5 gramos significa que el 75 % de los pollos tendrán un peso inferior a 156,5 y un 25%será superior a ese peso.

  • 8/20/2019 Modulometodosestadisticos USS

    36/141

     

    * Cuando se trata de cuartiles para datos agrupados continuos, se aplica la fórmula de interpolación:

    Dónde: n/4: es el número total de observaciones dividido por 4Fj-1 : es el mayor de las frecuencias acumuladas que no supera a n/4Fj : es la frecuencia acumulada que le sigue a Fj-1Xj-1 : es el extremo inferior del intervalo que tiene como frecuencia acumulada F.c ó h : amplitud de dicho intervalo

    Para la tabla No 1 (longitud de los tornillos), calcular Q1 y Q3.Respuestas: Q1= 8,36 mm

    Q3= 11,57mm

    Interpretación: Q1= Este valor indica que el 25% de los tornillos miden menos de 8,36 mm mientrasque el 75% restante mide más de 8,36mmQ3 = Este valor indica que el 75% de los tornillos miden menos de 11,57 mm mientras que el 25%restante mide más de 11,57mm.

    PERCENTILES:Los percentiles de una distribución, como su nombre lo indica, son valores de la variable, quedividen al conjunto de datos (ordenados de menor a mayor) en cien partes iguales.Los percentiles tienen el mismo significado y la misma forma de cálculo que los cuartiles. Así,cuando se habla del percentil 15 se quiere expresar que es el valor de la variable que deja el 15% delos datos a su izquierda y el 85 % de los mismos a su derecha o lo que es lo mismo decir que es elvalor de la variable que deja al 15 % de los datos por debajo de él y el 85% por encima.

    Se puede emplear la siguiente fórmula:

    Li = Límite Inferior del intervalo que contiene al PercentilFi-1 = Frecuencia Acumulada en la clase anterior k-ésimafi = Frecuencia en la clase que contiene al Percentilc =Tamaño del intervalo de clase.

    k = 1%, 2%, 3%, ... , 97%, 98%, 99% Percentiles

  • 8/20/2019 Modulometodosestadisticos USS

    37/141

     

    Práctica Calificada Nº 04

    1. ¿Qué es una medida de tendencia central?2. ¿Cuáles son las principales medidas de tendencia central?3. Defina: media aritmética mediana y moda.

    4. ¿Cuándo se utiliza la media aritmética ponderada?5. Enuncie las propiedades de la media aritmética6. Para cada información de los ejercicios del capítulo 3, calcular e interpretar la media aritmética, lamediana y la moda.

    7.

    Elaborar la tabla de frecuencia y determinar las medidas de tendencia central

    8.  Los siguientes datos representan las temperaturas observadas al proceso de fermentación en un díacualquiera de producción de cerveza “ALE”. Determine utilizando intervalos: la media, mediana ymoda a la siguiente tabla de frecuencia:

    25 33 27 20 14 21 33 29 25 1731 18 16 29 33 22 23 17 21 2613 20 27 37 26 19 25 24 25 2025 29 33 17 22 25 31 27 21 14

    24  7 23 15 21 24 18 25 23 24

    9. Los estadísticos del programa de “Comida Sobre Ruedas”, el cual lleva comidas calientes aenfermos confinados en casa, desean evaluar sus servicios. El número de comidas diarias quesuministran aparece en la siguiente tabla de frecuencia. Calcular la media, mediana y la moda.

     Número decomidas por día

     Número dedías

    0 - 5 35 - 10 610 - 15 515 - 20 8

    20 - 25 225 - 30 3

  • 8/20/2019 Modulometodosestadisticos USS

    38/141

     

    10.Las edades de 50 de los directores ejecutivos de las mejores corporaciones de la nación reportadasaparecen en la siguiente tabla de frecuencias. Calcule e interprete la media, la mediana y la moda.Además, calcule e interprete: Q1 y P15.

    Edades Frecuencias

    50 y menos de 55 855 y menos de 60 13

    60 y menos de 65 15

    65 y menos de 70 10

    70 y menos de 75 3

    75 y menos de 80 1

    11. Una granja ganadera registró durante febrero el nacimiento de 29 terneros, cuyos pesos al nacer(en kilogramos) fue el siguiente:

    22,31,33,34,35,36,37,38,38,39,40,40,40,41,41,42,42,42,42,42,43,43,44,45,46,46,46,46,50

    12. Los datos anteriores al ser dispuestos en una tabla de distribución de frecuencias se obtuvieron enla siguiente tabla resultante. 

    Calcular la el promedio y la mediana para datos agrupados y no agrupados; ycomparar resultados

    13. Ingresando a la biblioteca Digital E-libro , de la USS, busquen en el libro:

    Título Estadística

    Autor: Colegio24hsEditorial: Colegio24hsPublicado: 2004

    Y desarrollen los ejercicios 1 al 5, de la página 47 a la 49 según corresponda a encontrar la mediaaritmética, la mediana, y la moda.

    http://www.monografias.com/trabajos7/regi/regi.shtmlhttp://www.monografias.com/trabajos7/regi/regi.shtmlhttp://www.monografias.com/trabajos7/regi/regi.shtmlhttp://www.monografias.com/trabajos7/regi/regi.shtml

  • 8/20/2019 Modulometodosestadisticos USS

    39/141

     

    MEDIDAS DE DISPERSIÓN

    Semana 5

    Las medidas de dispersión  muestran la variabilidad de unadistribución, indicando por medio de un número la tendencia delos datos a dispersarse respecto al valor central o media. Cuantomayor sea ese valor, mayor será la variabilidad, cuanto menor sea,más homogénea será a la media. Así se sabe si todos los casos son

     parecidos o varían mucho entre ellos.

    Las medidas de dispersión más usuales son:

    1.  RANGO ESTADÍSTICO, AMPLITUD Ó RECORRIDO.

    Es la medida de variabilidad más fácil de calcular. Es la diferencia entre el valor mínimo y el valormáximo en un grupo de números. Para averiguar el rango de un grupo de números:

      Ordenamos los números según su tamaño

      Restamos el valor mínimo del valor máximo

    R= Xmáx. - Xmín.

    Ejemplo:

    a. Para una muestra (1, 45, 50, 55, 100), el dato menor es 1 y el dato mayor es 100. Sus valores seencuentran en un rango de:

    Rango = 100 –  1 = 99

     b. Hallar el rango de los conjuntos: x= 12, 6, 7, 3, 15, 10, 18, 5

    y= 9, 3, 8, 8, 9, 8, 9, 18

    En ambos casos, rango: 18 –  3 = 15; sin embargo si ordenamos se ven como sigue:

    x = 3, 5, 6, 7, 10, 12, 15, 18 y = 3, 8, 8, 8, 9, 9, 9, 18

    hay mucha más dispersión en “x” que en “y”, por  lo que “y” consiste esencialmente en ochos ynueves, pero en este caso el rango no indica diferencia entre ambos conjuntos, no es una buenamedida de la dispersión. Cuando hay valores muy extremos, el rango es una pobre medida de ladispersión.

  • 8/20/2019 Modulometodosestadisticos USS

    40/141

     

    2. LA VARIANZA. (S2 ó δ2)

    Es una variable estadística que mide la dispersión de los valores respecto a un valor central (media).

    Específicamente, la varianza es una medida de que tan cerca o que tan lejos están los diferentes

    valores de su propia media aritmética.

    Cuando más lejos están las Xi de su propia media aritmética, mayor es la varianza; cuandomás cerca estén las Xi a su media menos es la varianza. La Var ianza es el cuadrado de ladesviación estándar

      Para datos no agrupados

      Para datos agrupados

    La variancia de los valores: (x1 x2 … xk ) que ocurren con las frecuencias (f 1 f 2 … f k ) es:

  • 8/20/2019 Modulometodosestadisticos USS

    41/141

     

    3. DESVIACION ESTANDAR (S ó δ) . (ó DESVIACIÓN TIPICA) 

    La varianza a veces no se interpreta claramente, ya que se mide en unidades cuadráticas. Para evitarese problema se define otra medida de dispersión, la desviación estándar, que se halla como la raízcuadrada de la varianza. La desviación estándar o desviación típica nos informa sobre la dispersiónde los datos respecto al valor de la media; cuanto mayor sea su valor, más dispersos estarán los datos.Desviación Estándar: S = √S2 ó δ = √ δ2 (Es la raíz cuadrada de la varianza) 

    Propiedades de la Desviación EstándarA su vez la desviación estándar, también tiene una serie de propiedades que se deducen fácilmente de

    las de la varianza (ya que la desviación típica es la raíz cuadrada positiva de la varianza):1. La desviación estándar es siempre un valor no negativo S2. Es la medida de dispersión óptima por ser la más pequeña.3. La desviación estándar toma en cuenta las desviaciones de todos los valores de la variable4. Si a todos los valores de la variable se le suma una misma constante la desviación estándar novaría.5. Si a todos los valores de la variable se multiplican por una misma constante, la desviación estándarqueda multiplicada por el valor absoluto de dicha constante.

    Para el ejemplo anterior, la desviación estándar es 1.293 soles.

  • 8/20/2019 Modulometodosestadisticos USS

    42/141

     

    4. COEFICIENTE DE VARIABILIDAD

    Es una medida de variabilidad de los datos que se expresa en porcentaje, en la cual se compara la desviaciónestándar con el respectivo valor del promedio de los datos, se expresa en porcentaje:

  • 8/20/2019 Modulometodosestadisticos USS

    43/141

     

    Practica Calificada Nº 05

    1. ¿Cuál es la utilidad de las medidas de dispersión?2. ¿Cuáles son las principales medidas de dispersión?

    3. ¿Cuál es la medida adecuada para comparar la dispersión entre varias variables que poseandiferente magnitud o diferente unidad de medida?4. Para cada una de las informaciones de las unidades 2 y 4 de las sesiones anteriores, calcular einterpretar:4.1 Rango4.2 Desviación media4.3 Desviación Estandar4.4  Coeficiente de variabilidad5.  La tabla de frecuencias exhibe las edades de una muestra de 36 personas que asistieron a una película: 

    Años f

    8-13 2

    14-19 7

    20-25 13

    26-31 5

    32-37 9

    Hallar:

    a. La media

     b. La varianza

    c. La desviación

    6.  La siguiente tabla muestra los coeficientes de inteligencia de 480 niños de una escuela elementalC.I. 70 74 78 82 86 90 94 98 102 106 110 114 118 122 126

    f i 4 9 16 28 45 66 85 72 54 38 27 18 11 5 2

    Calcula:a) El C.I. promedio de los niños estudiados

     b) Su desviación.

    7.  El entrenador de un equipo de baloncesto duda entre seleccionar a Elena o María. Los puntos

    conseguidos por cada una, en una semana de entrenamiento fueron: Elena 18 23 22 24 19 25 16

    María 18 26 18 28 22 17 18

    a.  ¿Cuál de las dos tiene mejor media?

     b.  Calcula la desviación típica. ¿Cuál de las dos es más regular?

    c.  Si tú fueras el entrenador, a quién seleccionarías?

  • 8/20/2019 Modulometodosestadisticos USS

    44/141

     

    INTRODUCCIÓN A LAS PROBABILIDADES

    Semana 6

    “Los planes corresponden al hombre,

    las probabilidades a Dios.” 

    Proverbio chino 

    1.  EXPERIMENTO ALEATORIO:

    Es cualquier hecho o fenómeno cuyo resultado no puede predecirse antes de que suceda.Ejemplo:- Rendir un examen y observar su resultado- Tirar una moneda y observar cual de las caras queda hacia arriba- El lanzamiento de 2 dados paralelamente y observar el puntaje obtenido- Elegir un cliente del restaurante y preguntar su opinión sobre el servicio recibido.

    2.  ESPACIO MUESTRAL:Es el conjunto de todos los resultados posibles de un experimento aleatorio. Se representacomúnmente con la letra S.

    Ejemplos:

    * En el experimento aleatorio de lanzar una moneda 3 veces

    El espacio muestral es un conjunto formado por 8 elementos:

  • 8/20/2019 Modulometodosestadisticos USS

    45/141

     

    * En el experimento aleatorio de lanzar un par de dados, el espacio muestral es:

    3. EVENTO O SUCESO: 

    Es un subconjunto de elementos que pertenecen al espacio muestral y que cumple una

    característica determinada. Ejemplos:* Del espacio muestral, lanzamiento de un dado; el evento

    A= puntaje obtenido es mayor de 3A= [4,5,6]

    * Al lanzar una moneda 3 veces, el evento de obtener por lo menos dos caras es:E = [(C,C,C), (C,C,S), (C,S,C), (S,C,C)] ; tiene 4 elementos

    * Al lanzar un par de dados, el evento “la suma es igual a 7” ser á:

    4. PROBABILIDAD

    Es una medida que expresa la “tasa de ocurrencia de un evento a largo plazo”. El valor de estamedida está comprendido entre [0 y 1].La probabilidad de que ocurra un evento A se define como el valor que corresponde al número decasos “favorables” entre el número de casos “posibles”: 

    Ejemplos:  Si se lanza un dado, cual es la probabilidad de obtener un puntaje impar. Rpta. 0.5  De un juego de 52 naipes se extrae una carta al azar (aleatoria), cuál es la probabilidad de obtener

    un puntaje mayor de 9. Rpta. 0.3077  Si se lanza un dado 2 veces cuál es la probabilidad de que:

    - Se obtenga un puntaje igual a 8 - Se obtenga un puntaje = a 2

  • 8/20/2019 Modulometodosestadisticos USS

    46/141

     

    OPERACIONES CON PROBABILIDADES

    1. Eventos Mutuamente ExcluyentesDos eventos son mutuamente excluyentes cuando “no pueden ocurrir los dos al mismo tiempo”, es

    decir la ocurrencia de uno de ellos impide automáticamente la ocurrencia del otro. Por tanto, si 2eventos son mutuamente excluyentes no habrá intersección entre ellos.

    Si el evento A y el evento B son excluyentes:A∩B = 0, Luego P(A∩) = 0 

    Ejemplo: Los clientes de una agencia de turismo se clasifican según nacionalidad y edad:

    ¿Cuál es la probabilidad de elegir un cliente joven o adulto?

    P(J U A) = P(J) + P(A) = 130 + 40 = 170 = 0.85200 200 200

    2. Intersección de Eventos: En el ejemplo anterior, calcular la probabilidad de que un clienteelegido sea Joven o Extranjero:

    P(J U E) = P(J) + P(E) –  P(J∩E) = 130 + 80 - 30 = 180 = 0.9200 200 200 200

    Si A y B son no excluyentes: P(A U B) = P(A) + P(B) –  P(A∩B) 

    “o” = unión “y” = intersección

    Ejemplos:

    1.  De la urna que tienes a la derecha, sacamos una bola a azar y anotamos su númeroa)  Describe el espacio muestral. ¿Cuántos casos tiene?

     b)  Describe los siguientes sucesos:Bola Roja = A; Bola Verde = B; Bola Azul = C; Bola Roja con númeroimpar = D; Bola con número par = F

    c) Calcula la probabilidad de cada uno de los sucesos anteriores2.  ¿Cuál es el espacio muestral correspondiente al lanzamiento de una moneda? ¿Cuál es la

     probabilidad de cada una de las dos caras?3.  Si se lanza un dado, cuál es la probabilidad de obtener un puntaje impar

  • 8/20/2019 Modulometodosestadisticos USS

    47/141

     

    4. Al extraerse una carta de un juego de 52 naipes, cual es la probabilidad de que ésta sea decolor rojo o tenga un puntaje menor de 5.

    5. En una encuesta aplicada a 50 estudiantes secundarios, 22 alumnos manifestaron inclinación por laQuímica, 28 por Estadística y 10 alumnos por ambos cursos. Si se selecciona al azar a uno de estosalumnos:a) ¿Cuál es la probabilidad de que les guste Química o Estadística?

     b) ¿De qué se incline por Química y Estadística?c) ¿Qué no le guste ninguno de los 2 cursos?6. En un salón de clase hay 15 alumnos y 24 alumnas, la tercera parte de los hombres y la mitad demujeres son de Chiclayo. Hallar la P[ ] de que sea alumno ó sea de Chiclayo; y de que sea alumna yque haya nacido fuera de Trujillo.

    TÉCNICAS DE CONTEO

    Repaso de Factorialesn! = 1x2x3x4x……xn 0! = 11! = 1

    PERMUTACIÓN  “Pn” 

    Una permutación es un conjunto de arreglos diferentes de n en n elementos de un total de nSe lee: Pn = permutación de n elementos.

    Fórmula: Pn = n!

    Ejemplo:1. De cuántas formas diferentes se pueden sentar 3 personas ABC en 3 asientos consecutivos:[ ABC, ACB, BAC, BCA, CAB, CBA ] P3 = 3! = 6

    2. Cuántas juntas directivas diferentes se podrían formar con las personas ABC y D, si dicha juntatiene los cargos de Presidente, Vicepresidente, Secretario y Tesorero.P4 = 4! = 24 juntas

    mCOMBINACIÓN  C = m! 

    n (m-n)! n! 

    Se lee: “combinación de n en n elementos de un total de m” 

    Son arreglos diferentes de n en n elementos de un total de m, en los cuales no interesa el orden enque se presentan.

    Ejm. Se desea elegir un comité de 3 personas entre 8 candidatos, cuantos comités diferentes puedenformarse:

  • 8/20/2019 Modulometodosestadisticos USS

    48/141

     

    8C 3 = 8! = 8! 56 formas diferentes

    (8-3)! 3! 5! 3!

    mVARIACIÓN  V = m! __

    n (m-n)! 

    Se lee: “Variación de n en n elementos de un total de m”. Sí interesa el orden de los elementos. 

    Ejm. Se desea formar una junta directiva con los cargos de presidente, secretario y tesorero. Si hay 8candidatos, cuantas juntas directivas diferentes se podría formar:

    8! = 8! = 8x7x6x5! = 336 formas diferentes(8-3)! 5! 5!

    Ejemplos para el Aula:1.  Si un conjunto A tiene 5 elementos. ¿Cuántas duplas se pueden formar con los elementos de

    A?.2.  En el concurso de belleza de Miss Universo, se suelen elegir primero 15 semifinalistas, luego

    se eligen 5 finalistas. ¿De cuántas formas diferentes se pueden ocupar las 5 primeras posiciones entre las 15 semifinalistas?

    3.  La junta directiva de la compañía ABC consta de 15 miembros. ¿De cuántas formas se puedeelegir presidente, vicepresidente y secretario?

    4.  ¿Cuántos equipos de basquet de cinco hombres se pueden formar de una escuadra de 12hombres si no tienen en cuenta las posiciones de juego?5.  En una clase de estadística hay 30 estudiantes 24 hombres y 6 mujeres. ¿De cuántas formas

    distintas se puede construir un comité de cuatro estudiantes?¿De cuántas formas distintas se puede construir un comité de cuatro estudiantes si dos debenser mujeres?

  • 8/20/2019 Modulometodosestadisticos USS

    49/141

     

    Practica Calificada N° 06

    ACTIVIDAD Nº 1A continuación se describen varias situaciones. Contesta la pregunta, en cada caso, razonando las respuestas:a) En una clase de 30 alumnos, 12 chicos y 18 chicas, cada uno escribe su nombre en una papeleta y la

    introduce en una caja. ¿Qué es más probable que aparezca el nombre de una chica o de un chico? b) Se lanza un dado cúbico con las caras numeradas del 1 al 6. ¿Qué es más probable que salga el 5 o el 1?c) Si lanzas una ficha cuyas caras son verde y rojo ¿qué color esperas que salga?

    ACTIVIDAD Nº 2Indica el espacio muestral de los siguientes sucesos:a) Obtener par, al lanzar un dado cúbico con las caras numeradas del 1 al 6. b) Lanzamos dos monedas al aire.c) Obtener impar al lanzar un dado cúbico.

    ACTIVIDAD Nº 3En cada uno de los siguientes experimentos aleatorios, diga cuál es la probabilidad de que ocurra el suceso

    que se indica:a) CESTA I CESTA II b) BOLSA I BOLSA II

    Se extrae una pieza de fruta Se extrae una bolaSuceso: OBTENER UNA PERA Suceso: OBTENER UNA BOLA VERDE

    ACTIVIDAD Nº 4Resolver:1. Hallar la probabilidad de sacar por suma 4 o 11 al lanzar dos dados.2. Una urna tiene 8 bolas rojas, 5 amarillas y 7 verdes. Se extrae una al azar, calcular la probabilidad de que:

    Sea roja.Sea verde.Sea amarilla.

    3. Se extrae aleatoriamente una baraja de un juego de 52 cartas. ¿Cuál es la probabilidad de que la cartaseleccionada?

    a) Sea un “as”  b) Sea una carta negra ó un número menor de 5

    c) Sea número 8 y de color rojo4. De 100 personas que fueron consultadas sobre sus preferencias a la hora de realizar un deporte, 50 practicaban fútbol, 40 practicaban baloncesto y 30 practicaban ciclismo. Además, 25 personas practicabanfutbol y baloncesto, 15 practicaban fútbol y ciclismo, y 12 practicaban baloncesto y ciclismo. Por último, tansólo 5 personas practicaban los tres deportes. El resto no sabe o no contesta.a) Representa el diagrama de Venn correspondiente. b) Calcula las siguientes probabilidades: P(practicar fútbol), P(practicar fútbol y baloncesto), P(practicar sólociclismo), P(practicar los tres deportes), P(practicar alguno de los tres deportes), P(no practicar ninguno de lostres deportes. 

  • 8/20/2019 Modulometodosestadisticos USS

    50/141

     

    Permutaciones, Combinaciones, Variaciones

    1. ¿De cuántas maneras se pueden colocar dos anillos diferentes en la misma mano, demodo que no estén en el mismo dedo?

    2. Al lanzar cinco dados de distintos colores ¿cuántos resultados podemos obtener?3. Con los números 1,2,3,4,5 y 6:3.1 ¿Cuántos números distintos de siete cifras podríamos formar?3.2 ¿Podremos numerar a los 3224564 habitantes de una ciudad con esosnúmeros?4. Se lanzan al aire uno tras otro cinco dados equilibrados de seis caras. ¿Cuál es elnúmero de casos posibles?5. ¿Cuántos números de seis cifras existen que estén formados por cuatro números dosy por dos números tres?6. Lola tiene 25 bolitas (10 rojas, 8 azules y 7 blancas) para hacerse un collar.Engarzando las 25 bolitas en un hilo, ¿cuántos collares distintos podrá realizar?7. ¿Cuántas palabras distintas, con o sin sentido, podremos formar con las letras de la

     palabra educación? ¿y con la palabra vacaciones?8. Un grupo de amigos formado por Raúl, Sonia, Ricardo y Carmen organizan unafiesta, acuerdan que dos de ellos se encargarán de comprar la comida y las bebidas¿De cuántas formas posibles puede estar compuesta la pareja encargada de dichamisión?9. Una fábrica de helados dispone de cinco sabores distintos (vainilla, chocolate, nata,fresa y cola) y quiere hacer helados de dos sabores ¿Cuántos tipos de helado podrán

    fabricar?10. Un grupo de amigos y amigas se encuentran y se dan un beso para saludarse. Si sehan dado en total 21 besos, ¿cuántas personas había?11. En una carrera de 500 metros participan doce corredores ¿De cuántas maneras

     pueden adjudicarse las medallas de oro, plata, bronce?12. ¿De cuántas formas pueden cubrirse los cargos de presidente, vicepresidente,secretario y tesorero de un club deportivo sabiendo que hay 14 candidatos? 

  • 8/20/2019 Modulometodosestadisticos USS

    51/141

     

    PROBABILIDADES CONDICIONALES

    Semana 7

    Hasta ahora se ha estudiado la probabilidad absoluta de un evento, es decir sin relacionarlo uno conotro. Sin embargo pudiera ser de interés calcular la probabilidad de que ocurra un evento de ciertoespacio muestral “S” a la luz de que otro evento de ese mismo espacio “S” ocurra. 

    Sean A y B dos eventos de un mismo espacio muestral S. La probabilidad condicional de A, dadoque ha ocurrido B (o viceversa), está dado por:

    P[ A/B ] = “ probabilidad de que ocurra A habiendo sucedido B” 

    P[ A/B ] = P[A∩B] = n (A∩B)P[B] n(B)

    P[B/A] = “probabilidad de que ocurra B habiendo sucedido A” 

    P[ B/A ] = P[B∩A] = n (B∩A)P[A] n(A)

    Ejemplos:1. En una empresa el 50% de trabajadores trabaja por la mañana, el 30% lo hace por las tardes y el 20% tanto

    en la mañana como por la tarde; si se escoge aleatoriamente a un trabajador cualquiera:a) Cual es la probabilidad de que trabaje en la mañana si se conoce que labora en la tarde

     b) Cual es la probabilidad de que trabaje por las tardes si se conoce que labora por la mañanaSOLUCIÓNA= labora en la mañana …………. 50%B= labora en la tarde …………….. 30% A Π B = labora en los dos turnos … 20%

    a)  P[A/B] = P[A ∩ B] = 20/30 = 2/3 ó 66.67%P[B]

  • 8/20/2019 Modulometodosestadisticos USS

    52/141

     

     b)  P[B/A] = P[B ∩A] = 20/50 = 2/5 ó 40%P[A]

    2. De todos los alumnos que el ciclo pasado llevaron los cursos de Estadística Aplicada y Matemática I, se

    tienen los siguientes datos:El 20% desaprobaron Matemática IEl 35% desaprobaron Estadística AplicadaEl 10% desaprobaron ambos cursos

    Si se escoge aleatoriamente a un alumno que lleva estos cursos, cual es la probabilidad de que este:a)  Haya sido desaprobado en Matemática I conociéndose que fue desaprobado en Estadística Aplicada b)  Haya sido desaprobado en Estadística Aplicada conociéndose que fue desaprobado en Matemática Ic)  De que haya sido desaprobado en Matemática I ó Estadística Aplicada

    SOLUCIÓN:

    M = desaprobó Matemática I =20%E = desaprobó Estad. Aplicada =35%M ∩ E = desaprobaron ambos cursos = 10

    a)  P[M/E] = 10/35 = 2/7 = 28,57%

     b)  P[E/M] = 10/20 = ½ = 50%

    c)  P[E UM] = P[E] + P[M] –  P[E ∩M] = 35/100 + 20/100 –  10/100 = 9/20 = 45%

    3. En la parte preferencial de un teatro solamente hay 120 asientos, los cuales son de 2 colores, azules o

    negros; algunos son de madera y otros son metálicos. El resumen se presenta en el recuadro siguiente:

    Asientos Metálicos Madera TotalAzul 35 45 80 Negro 18 22 40Total 53 67 120

    Si se selecciona aleatoriamente uno de estos asientos, calcule la probabilidad de que este sea:a)  De color azul b)  De color negro metálicoc)  El asiento elegido sea de maderad)  Sea de color azul si se sabe que es de metale)  El asiento sea de madera si se sabe que es de color negrof)  El asiento no sea de color azul

    SOLUCIÓNA= Azul, N=Negro, M=Metálico, Ma=Madera

    a)  P[A] = n(A)/n(S) = 80/120 = 2/3 = 66.47%

     b)  P[N ∩M] = n(M ∩ N)/n(S) = 18/120 = 9/60 = 3/20 = 15%

    c)  P[Ma] = 67/120 = 55.83 %

    d)  P[A/M] = P[A ∩M] / P[M] = n(A ∩M) / n(M) = 35/53 = 66.04%

    e)  P[M/N] = P[Ma ∩ N]/ P[N] = n(Ma ∩ N)/n(N) = 22/40 = 11/20 = 55%

  • 8/20/2019 Modulometodosestadisticos USS

    53/141

     

    Complemento de un suceso=> P[M’]= 1 – P[M]

    Sea de color azul: P[A], complemento = 1 –  P[A]

    f)  P[A]’ = 1 –  P[A] = 1 - 80/120 = 40/120 = 4/12 = 1/3 = 33.33%

    TEOREMA DE BAYES

    Es un caso particular de la probabilidad condicional.Si A1, A2, A3, …, An, son sucesos mutuamente excluyentes de los cuales al menos uno de lossucesos Ai (i=1,2,3,…,n) debe ocurrir y siendo B un suceso cualquiera del espacio muestral, la

     probabilidad de que ocurra el suceso “Ak” habiendo ocurrido B se puede definir como: 

    P[Ak  / B] = P[Ak ] . P[B/Ak ]∑ P[Ai] . P[B/Ai]

    Ejemplo 11. En una empresa el 50% de trabajadores pertenecen al área técnica profesional, el 30% sonoficinistas y el 20% pertenecen al área de personal de servicio; se sabe además que el 8, 9 y 10% delos técnicos profesionales, oficinistas y personal de servicio respectivamente son provincianos.

    a) Represente las condiciones enunciadas en un árbol de probabilidades b) Si se selecciona al azar un trabajador, cual es la probabilidad de que este sea técnico profesional o personal de servicio.c) Sea técnico profesional si se conoce que es provincianod) Sea de personal de servicio si se sabe que es de la capital

    SOLUCIÓNT= técnico profesional P=provincianoO=oficinistas C=capitalS=personal servicio

    a)  Árbol de probabilidades

     b)  P[T U S] = P[T] + P[S] –  P[T ∩ S] = 50/100 + 20/100 –  0 = 70/100 = 70%

    c)  P[T/P] = _________50/100 x 8/100_______________________50/100x8/100 + 30/100x9/100 + 20/100x10/100

    = 50 x 8_____________ = ___400 = 400/870 = 40/87 ó 45.98%50x8 + 30x9 + 20x10 400+270+200

    d) P[S/C] = P[S].P[C/S]P[T].P[C/T] + P[O].P[C/O] + P[S].P[C/S]

  • 8/20/2019 Modulometodosestadisticos USS

    54/141

     

    = 20/100 . 90/10050/100x92/100 + 30/100x91/100 + 20/100x90/100

    = 1800 = 1800 / 9130 = 180/913 ó 19.72 %

    4600 + 2730 + 1800

    Ejemplo 2El 70% de los pacientes de un hospital son mujeres y el 20% de ellas son fumadoras. Por otro lado el40% de los pacientes hombres son fumadores. Se elige al azar un paciente del hospital. ¿Cuál es la

     probabilidad de que sea fumador?

    Solución Diagrama de Árbol para el ejemplo:

    Ejemplo 3Consideremos un control de calidad de una empresa en el cual se desea saber la probabilidad de queun determinado artefacto tenga una vida útil superior a las 1200hs. Para ello el dpto. de Control deCalidad separa 500 unidades de la producción y mide la vida útil de cada unidad. Los resultados deobservan en la siguiente tabla:

    Duración(en hs) Frec. Abs.(fi) Frec. Relat.

    Menos de 800 10 2%800 a 899 40 8%900 a 999 55 11%1000 a 1099 70 14%1100 a 1199 85 17%1200 a 1299 115 23%1300 a 1399 84 17%1400 a más 41 8%

    Total 500 100%

    P(A) = 115 + 84 +41 ó = 23% + 17% + 8%500 = 48%

  • 8/20/2019 Modulometodosestadisticos USS

    55/141

     

    Práctica Calificada N° 07

    Ejercicio 1: 

    Tres máquinas,  A, B y C , producen el 45%, 30% y 25%, respectivamente, del total de las piezas producidas en una fábrica. Los porcentajes de producción defectuosa de estas máquinas son del 3%,4% y 5%.

    a.  Seleccionamos una pieza al azar; calcula la probabilidad de que sea defectuosa. b.  Tomamos, al azar, una pieza y resulta ser defectuosa; calcula la probabilidad de haber sido

     producida por la máquina B.c.  ¿Qué máquina tiene la mayor probabilidad de haber producido la citada pieza

    Ejercicio 2:

    Tras un estudio estadístico en una ciudad se observa que el 70% de los motoristas son varones y, deestos, el 60% llevan habitualmente casco. El porcentaje de mujeres que conducen habitualmente concasco es del 40%. Se pide:

    a.  Calcular la probabilidad de que un motorista elegido al azar lleve casco. b.  Se elige un motorista al azar y se observa que lleva casco. ¿Cuál es la probabilidad de que sea

    varón?

    Ejercicio 3:

    En una ciudad, el 35% vota al partido A, el 45% vota al partido B y el resto se abstiene. Se sabeademás que el 20% de los votantes de A, el 30% de los de B y el 15% de los que se abstienen, sonmayores de 60 años. Se pide:

    a.  Hallar la probabilidad de que un ciudadano elegido al azar sea mayor de 60 años. b.  Hallar la probabilidad de que un ciudadano mayor de 60 años se haya abstenido.

    Ejercicio 4:

    Los alumnos de Primero de Biología tienen que realizar dos pruebas, una teórica y otra práctica. La

     probabilidad de que un estudiante apruebe la parte teórica es de 0.6, la probabilidad de que apruebela parte práctica es de 0.8 y la probabilidad de que apruebe ambas pruebas es 0.5.

    a.  ¿Son independientes los sucesos aprobar la parte teórica y la parte práctica? b.  ¿Cuál es la probabilidad de que un alumno no apruebe ninguno de los dos exámenes?c.  ¿Cuál es la probabilidad de que un alumno apruebe solamente uno de los dos exámenes?d.  Se sabe que un alumno aprobó la teoría. ¿Cuál es la probabilidad de que apruebe también la

     práctica?

    Ejercicio 5:

    El 35% de los créditos de un banco es para vivienda, el 50% para industrias y el 15% para consumodiverso. Resultan fallidos el 20% de los créditos para vivienda, el 15% de los créditos para industrias

  • 8/20/2019 Modulometodosestadisticos USS

    56/141

     

    y el 70% de los créditos para consumo. Calcula la probabilidad de que se pague un crédito elegido alazar.

    Ejercicio 6:

    El volumen de producción en tres plantas diferentes de una fábrica es de 500 unidades en la primera,1000 unidades en la segunda y 2000 en la tercera. Sabiendo que el porcentaje de unidadesdefectuosas producidas en cada planta es del 1%, 0.8% y 2%, respectivamente, calcula la

     probabilidad de que al seleccionar una unidad al azar sea defectuosa.

    Ejercicio 7:

    El 20% de los empleados de una empresa son ingenieros y otro 20% son economistas. El 75% de losingenieros ocupan un puesto directivo y el 50% de los economistas también, mientras que de los noingenieros y no economistas solamente el 20% ocupan un puesto directivo. ¿Cuál es la probabilidadde que un empleado directivo elegido al azar sea ingeniero?

  • 8/20/2019 Modulometodosestadisticos USS

    57/141

     

    VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS

    DISTRIBUCIONES DE PROBABILIDADES

    Semana 8

    En el cálculo de probabilidades, generalmente, es mássencillo identificar los eventos numéricamente, y no conla simple descripción del suceso que pueda ocurrir, esmás, en muchas ocasiones no podemos registrar todos lossucesos inmersos en el espacio muestral del experimento.

    Debemos recurrir a cuantificar esos símbolos iniciales en

    números reales que se puedan operar matemáticamente.

    Variable Aleatoria

    Definición: Una variable aleatoria es una función definida sobre un espacio muestral a losnúmeros reales. Si ese espacio muestral especificado como dominio es numerable, decimosque la variable es de tipo discreto, en caso contrario diremos que es de tipo continuo.

    En el experimento de lanzar una moneda, una vez, definimos la variable aleatoria X: elnúmero de sellos obtenido.

    En la tirada de dos dados si X es la suma obtenida:

  • 8/20/2019 Modulometodosestadisticos USS

    58/141

     

    FUNCIÓN DE PROBABILIDADLas variables aleatorias, transforman eventos del espacio muestral en eventos numéricos, loscuales desde luego, tienen asociada una probabilidad de ocurrencia.

    1. Función de Probabilidad f(x)=p(X=x): Es una función definida sobre una variable aleatoria a losreales en el intervalo [0,1] que cumple con los axiomas de la teoría de la probabilidad.

    2. Función de Distribución F(x)=p(X=x)Es la acumulada de una función de probabilidad.

    - : Limite inferior de la variable X

  • 8/20/2019 Modulometodosestadisticos USS

    59/141

     

    Ejemplo:En el Lanzamiento de una Moneda,X: Número de Sellos

    Ejemplo:X es la Suma Obtenida en el Lanzamiento de dos Dados:

    Ejemplo: ¿ Cuál es la probabilidad que un disparo impacte a menos de 15 cm del centro? ¿ a más de9 centímetros? ¿Entre 7 y 14 centímetros? 

  • 8/20/2019 Modulometodosestadisticos USS

    60/141

     

    CUESTIONARIO Y EJERCICIOS PROPUESTOS

    1. Defina: Variable aleatoria, variable aleatoria discreta, variable aleatoria continua, funciónde probabilidad y función de distribución.2. En el ejercicio de la ficha de dominó, si X representa la diferencia absoluta entre los dosnúmeros, representar y calcular la probabilidad de ocurrencia de los siguientes eventos:2.1 La diferencia sea menor o igual a 52.2 La diferencia sea mayor que 22.3 La diferencia sea mayor que 2 pero menor o igual 52.4 La diferencia sea mayor que 5 ó menor que 3 

  • 8/20/2019 Modulometodosestadisticos USS

    61/141

     

    DISTRIBUCIÓN BINOMIAL

     

  • 8/20/2019 Modulometodosestadisticos USS

    62/141

     

  • 8/20/2019 Modulometodosestadisticos USS

    63/141

     

  • 8/20/2019 Modulometodosestadisticos USS

    64/141

     

    DISTRIBUCIÓN DE POISSON

    La distribución de Poisson es de gran utilidad cuando tenemos variables distribuidas a través deltiempo ó del espacio. Es el caso del número de llamadas que entran a una central telefónica en unaunidad de tiempo, la cantidad de personas que atiende un cajero en una hora, los baches porkilómetro en una autopista, los artículos defectuosos que hay en un lote de producción; amén de suutilización como aproximación binomial cuando p es muy cercano a cero, o n superior a 30. ( p30).

    La función de probabilidad de Poisson es: 

  • 8/20/2019 Modulometodosestadisticos USS

    65/141

     

    Ejemplo:Un cajero de un banco atiende en promedio 7 personas por hora, cual es la probabilidad de que ununa hora determinada:1. Atienda menos de 5 personas2. Atienda más de 8 personas3. Atienda más de 5 pero menos de 8 personas4. Atienda exactamente 7 personas

    Consultando la tabla para la distribución de Poisson:

    Ejemplo:En cierto núcleo poblacional, el 0.5% es portador del V.I.H. En una muestra de 80 personas, cual esla probabilidad:1. De que haya alguna persona portadora.2. No haya personas portadoras.

    Solución:

  • 8/20/2019 Modulometodosestadisticos USS

    66/141

     

    DISTRIBUCIÓN NORMAL

    Dada la caracterización propia de este modelo continuo, donde coinciden las medidas de tendenciacentral, media, moda y mediana; la simetría respecto a estos parámetros y la facilidad de suaplicación hacen de la distribución normal, una herramienta de uso común, máxime que la mayoríade las variables económicas y sociales se ajustan a una función normal.

    La distribución normal, también es útil como aproximación de los modelos binomial y poissonexpuestos anteriormente, y yendo un poco más adelante, sustentados en el teorema del “límitecentral” podemos afirmar que, cuando el tamaño de la muestra es lo  suficientemente grande,

     podemos asumir el supuesto de normalidad para una suma de variables.

    La forma acampanada de la variable normal, resalta la perfección de esta curva definida por los

     parámetros

    Sin embargo, existen infinitas distribuciones normales, ya que por cada media aritmética ó

    varianza diferente se describe una función también diferente:

  • 8/20/2019 Modulometodosestadisticos USS

    67/141

     

    Normal Diferente Media Igual Varianza

    Normal Diferente Varianza Igual Media

  • 8/20/2019 Modulometodosestadisticos USS

    68/141

     

    Las gráficas de este tipo son muy corrientes: Hay pocos individuos en losextremos y un aumento paulatino hasta llegar a la parte central delrecorrido, donde está la mayoría de ellos.

     

  • 8/20/2019 Modulometodosestadisticos USS

    69/141

     

    DEFINICIÓN :

    Es la distribución más importante en la estadística.

    Es una distribución simétrica con respecto a su promedio, teniendo la media,

    mediana y moda el mismo valor. El valor máximo ocurre cuando

    U = Me = Mo

     x y σ ,

    En el caso de laDistribución normal de

    parámetros

    dicha función viene dada

    por:

     

    =

     

  • 8/20/2019 Modulometodosestadisticos USS

    70/141

     

    Z = x  – u

    δ

    Casos:

    I. P [x≤x] = P [ Z ≤ x – u ]

    δ

    II. P [x≥x] = 1 – P[x ≤ x] = 1 – P[ Z ≤ x – u ]

    δ

    III. P[a ≤ x ≤ b] = P[x ≤ b] – P[x ≤ a]

    = P[Z ≤ b – u ] – P[Z ≤ a – u ]

    δ δ

     

    a) Tenga un contenido mayor a 1020 cm3u = promedio = 1000 cm3σ = 30 cm3 

    P [x > 1020]

    = 1 –  P[ x ≤ 1020] = 1 –  P[ z ≤ 1020 –  1000 ]

    30= 1 –  P [ z≤ 0,67] Buscar en tablas 0,67

    = 1 –  0,74857 = 025143 ó 25.14%

     b) Tenga un contenido menor a 975 cm3P[ x < 975 ]

    P [ z ≤ 975 –  1000 ]30

    P [ z ≤ -0.833] = 0,20327 ó 20.33% 

    c) Contenga entre 980 y 1030 cm3

    P [980 ≤ x ≤ 1030]P [ z≤ 1030 –  1000 ] –  P[z ≤ 980 –  1000 ]

    30 30

    P [ z≤ 1 ] –  P [z ≤ -0.666 ] ……………………….. Ver en tablas

    0.84134 - 0.2