Top Banner
INSTITUTO TECNOLOGICO DE ACAPULCO UNIDAD I: INTRODUCCION A LA ESTADISTICA INFERENCIAL INGENIERIA EN GESTION EMPRESARIAL PROFESOR: ANTONIO CANUL PEREZ EQUIPO: MACEDO CASTRO VICTOR ALFONSO ORTEGA FLORES YANELI PRUDENTE CATANA MAYRA IRIS AULA:105 30/06/2015
35

Unidad 1 Introduccion Ala Estadística Inferencial

Dec 14, 2015

Download

Documents

sg
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Unidad 1 Introduccion Ala Estadística Inferencial

INSTITUTO TECNOLOGICO DE ACAPULCO

INGENIERIA EN GESTION EMPRESARIALPROFESOR: ANTONIO CANUL PEREZ

EQUIPO:

ORTEGA FLORES YANELIPRUDENTE CATANA MAYRA IRIS

AULA:105

Page 2: Unidad 1 Introduccion Ala Estadística Inferencial

ESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

ÍNDICE

Introducción…………………………………………………………………………….…..………3

1.1 Breve historia de la estadística.......................................................................................4

1.2 Concepto de estadística..................................................................................................7

1.3 Estadística descriptiva....................................................................................................8

1.4 Estadistica inferencial...................................................................................................10

1.5 Breve introducción a la inferencia estadística...............................................................11

1.6 Teoría de decisión en estadística.................................................................................12

1.7 Componentes de una investigacion estadistica............................................................14

1.8 Recoleccion de datos....................................................................................................17

1.9 Estadistica parametrica (poblacion y muestrea aleatoria)............................................18

1.10 Aplicaciones................................................................................................................25

INTRODUCCION

Este tema delimita los contenidos del primer cuatrimestre de los contenidos del segundo cuatrimestre. También diferencia los dos núcleos temáticos más importantes de la materia: Descriptivo e inferencial. La validez de las conclusiones obtenidas con procedimientos descriptivos se limita al conjunto de individuos de los que se ha obtenido los datos, pero no incluye a los individuos que no han formado parte de la investigación, y generalmente estamos interesados en generalizar los resultados y conclusiones obtenidos con unos (pocos) individuos a la población.

Dicho de otra forma, la finalidad de la Inferencia estadística es obtener información sobre características desconocidas de las poblaciones (generalmente cuantificadas por

22

Page 3: Unidad 1 Introduccion Ala Estadística Inferencial

ESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

parámetros) a partir de características conocidas de las muestras (generalmente cuantificadas por estadísticos). Incluir poblaciones completas de individuos en la investigación suele ser impracticable, y por ello se suele trabajar con grupos pequeños generalizando los resultados mediante las técnicas de Estadística Inferencial. Como ejemplo, supongamos que deseamos probar la eficacia de un tratamiento para un trastorno del comportamiento, para lo cual comparamos su efecto en un grupo de pacientes con el de otro tratamiento en otro grupo de pacientes.

El análisis descriptivo de los resultados obtenidos solo es válido para los individuos de los grupos comparados, y si queremos saber si el nuevo tratamiento es mejor para cualquier paciente, no solo para los que han intervenido en la prueba, hay que utilizar procedimientos inferenciales.

UNIDAD 1

INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

1.1 BREVE HISTORIA DE LA ESTADÍSTICA

Los comienzos de la estadística pueden ser hallados en el antiguo Egipto, cuyos faraones lograron recopilar, hacia el año 3050 antes de Cristo, prolijos datos relativos a la población y la riqueza del país. De acuerdo al historiador griego Heródoto, dicho registro de riqueza y población se hizo con el objetivo de preparar la construcción de las pirámides. En el mismo Egipto, Ramsés II hizo un censo de las tierras con el objeto de verificar un nuevo reparto.

33

Page 4: Unidad 1 Introduccion Ala Estadística Inferencial

ESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

En el antiguo Israel la Biblia da referencias, en el libro de los Números, de los datos estadísticos obtenidos en dos recuentos de la población hebrea. El rey David por otra parte, ordenó a Joab, general del ejército hacer un censo de Israel con la finalidad de conocer el número de la población.

También los chinos efectuaron censos hace más de cuarenta siglos. Los griegos efectuaron censos periódicamente con fines tributarios, sociales (división de tierras) y militares (cálculo de recursos y hombres disponibles). La investigación histórica revela que se realizaron 69 censos para calcular los impuestos, determinar los derechos de voto y ponderar la potencia guerrera.

Pero fueron los romanos, maestros de la organización política, quienes mejor supieron emplear los recursos de la estadística. Cada cinco años realizaban un censo de la población y sus funcionarios públicos tenían la obligación de anotar nacimientos, defunciones y matrimonios, sin olvidar los recuentos periódicos del ganado y de las riquezas contenidas en las tierras conquistadas. Para el nacimiento de Cristo sucedía uno de estos empadronamientos de la población bajo la autoridad del imperio.

Durante los mil años siguientes a la caída del imperio Romano se realizaron muy pocas operaciones Estadísticas, con la notable excepción de las relaciones de tierras pertenecientes a la Iglesia, compiladas por Pipino el Breve en el 758 y por Carlomagno en el 762 DC. Durante el siglo IX se realizaron en Francia algunos censos parciales de siervos. En Inglaterra, Guillermo el Conquistador recopiló el Domesda y Book o libro del Gran Catastro para el año 1086, un documento de la propiedad, extensión y valor de las tierras de Inglaterra. Esa obra fue el primer compendio estadístico de Inglaterra.

Aunque Carlomagno, en Francia; y Guillermo el Conquistador, en Inglaterra, trataron de revivir la técnica romana, los métodos estadísticos permanecieron casi olvidados durante la Edad Media.

Durante los siglos XV, XVI, y XVII, hombres como Leonardo de Vinci, Nicolás Copérnico, Galileo, Neper, William Harvey, Sir Francis Bacon y René Descartes, hicieron grandes operaciones al método científico, de tal forma que cuando se crearon los Estados Nacionales y surgió como fuerza el comercio internacional existía ya un método capaz de aplicarse a los datos económicos.

Para el año 1532 empezaron a registrarse en Inglaterra las defunciones debido al temor que Enrique VII tenía por la peste. Más o menos por la misma época, en Francia la ley exigió a los clérigos registrar los bautismos, fallecimientos y matrimonios. Durante un brote de peste que apareció a fines de la década de 1500, el gobierno inglés comenzó a publicar estadística semanal de los decesos. Esa costumbre continuó muchos años, y en 1632 estos Bills of Mortality (Cuentas de Mortalidad) contenían los nacimientos y fallecimientos por sexo. En 1662, el capitán John Graunt usó documentos que abarcaban treinta años y efectuó predicciones sobre el número de personas que morirían de varias enfermedades y sobre las proporciones de nacimientos de varones y mujeres que cabría

44

Page 5: Unidad 1 Introduccion Ala Estadística Inferencial

ESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

esperar. El trabajo de Graunt, condensado en su obra Natural and Political Observations...Made upon the Bills of Mortality (Observaciones Políticas y Naturales... Hechas a partir de las Cuentas de Mortalidad), fue un esfuerzo innovador en el análisis estadístico.

Por el año 1540 el alemán Sebastián Muster realizó una compilación estadística de los recursos nacionales, comprensiva de datos sobre organización política, instrucciones sociales, comercio y poderío militar. Durante el siglo XVII aportó indicaciones más concretas de métodos de observación y análisis cuantitativo y amplió los campos de la inferencia y la teoría Estadística.

Los eruditos del siglo XVII demostraron especial interés por la Estadística Demográfica como resultado de la especulación sobre si la población aumentaba, decrecía o permanecía estática.

En los tiempos modernos tales métodos fueron resucitados por algunos reyes que necesitaban conocer las riquezas monetarias y el potencial humano de sus respectivos países. El primer empleo de los datos estadísticos para fines ajenos a la política tuvo lugar en 1691 y estuvo a cargo de Gaspar Neumann, un profesor alemán que vivía en Breslau. Este investigador se propuso destruir la antigua creencia popular de que en los años terminados en siete moría más gente que en los restantes, y para lograrlo hurgó pacientemente en los archivos parroquiales de la ciudad. Después de revisar miles de partidas de defunción pudo demostrar que en tales años no fallecían más personas que en los demás. Los procedimientos de Neumann fueron conocidos por el astrónomo inglés Halley, descubridor del cometa que lleva su nombre, quien los aplicó al estudio de la vida humana. Sus cálculos sirvieron de base para las tablas de mortalidad que hoy utilizan todas las compañías de seguros.

Durante el siglo XVII y principios del XVIII, matemáticos como Bernoulli, Francis Maseres, Lagrange y Laplace desarrollaron la teoría de probabilidades. No obstante durante cierto tiempo, la teoría de las probabilidades limitó su aplicación a los juegos de azar y hasta el siglo XVIII no comenzó a aplicarse a los grandes problemas científicos.

Godofredo Achenwall, profesor de la Universidad de Gotinga, acuñó en 1760 la palabra estadística, que extrajo del término italiano statista (estadista). Creía, y con sobrada razón, que los datos de la nueva ciencia serían el aliado más eficaz del gobernante consciente. La raíz remota de la palabra se halla, por otra parte, en el término latino status, que significa estado o situación; Esta etimología aumenta el valor intrínseco de la palabra, por cuanto la estadística revela el sentido cuantitativo de las más variadas situaciones.

Jacques Quételect es quien aplica las Estadísticas a las ciencias sociales. Este interpretó la teoría de la probabilidad para su uso en las ciencias sociales y resolver la aplicación del principio de promedios y de la variabilidad a los fenómenos sociales. Quételect fue el

55

Page 6: Unidad 1 Introduccion Ala Estadística Inferencial

ESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

primero en realizar la aplicación práctica de todo el método Estadístico, entonces conocido, a las diversas ramas de la ciencia.

Entretanto, en el período del 1800 al 1820 se desarrollaron dos conceptos matemáticos fundamentales para la teoría Estadística; la teoría de los errores de observación, aportada por La place y Gauss; y la teoría de los mínimos cuadrados desarrollada por Laplace, Gauss y Legendre. A finales del siglo XIX, Sir Francis Gaston ideó el método conocido por Correlación, que tenía por objeto medir la influencia relativa de los factores sobre las variables. De aquí partió el desarrollo del coeficiente de correlación creado por Karl Pearson y otros cultivadores de la ciencia biométrica como J. Pease Norton, R. H. Hooker y G. Udny Yule, que efectuaron amplios estudios sobre la medida de las relaciones.

Los progresos más recientes en el campo de la Estadística se refieren al ulterior desarrollo del cálculo de probabilidades, particularmente en la rama denominada indeterminismo o relatividad, se ha demostrado que el determinismo fue reconocido en la Física como resultado de las investigaciones atómicas y que este principio se juzga aplicable tanto a las ciencias sociales como a las físicas.

1.2 CONCEPTO DE ESTADÍSTICA

La Estadística es la ciencia cuyo objetivo es reunir una información cuantitativa concerniente a individuos, grupos, series de hechos, etc. y deducir de ello gracias al análisis de estos datos unos significados precisos o unas previsiones para el futuro.

La estadística, en general, es la ciencia que trata de la recopilación, organización presentación, análisis e interpretación de datos numéricos con el fin de realizar una toma de decisión más efectiva.

Otros autores tienen definiciones de la Estadística semejantes a las anteriores, y algunos otros no tan semejantes. Para Chacón esta se define como “la ciencia que tiene por objeto el estudio cuantitativo de los colectivos”; otros la definen como la expresión cuantitativa del conocimiento dispuesta en forma adecuada para el escrutinio y análisis. La más aceptada, sin embargo, es la de Mínguez, que define la Estadística como “La ciencia que tiene por objeto aplicar las leyes de la cantidad a los hechos sociales para medir su intensidad, deducir las leyes que los rigen y hacer su predicción próxima”.

Los estudiantes confunden comúnmente los demás términos asociados con las Estadísticas, una confusión que es conveniente aclarar debido a que esta palabra tiene tres significados: la palabra estadística, en primer término se usa para referirse a la información estadística; también se utiliza para referirse al conjunto de técnicas y métodos

66

Page 7: Unidad 1 Introduccion Ala Estadística Inferencial

ESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

que se utilizan para analizar la información estadística; y el término estadístico, en singular y en masculino, se refiere a una medida derivada de una muestra.

1.3 ESTADÍSTICA DESCRIPTIVA

La estadística descriptiva es la rama de las Matemáticas que recolecta, presenta y caracteriza un conjunto de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc.) con el fin de describir apropiadamente las diversas características de ese conjunto. Al conjunto de los distintos valores numéricos que adopta un carácter cuantitativo se llama variable estadística.

Al conjunto de los distintos valores numéricos que adopta un carácter cuantitativo se llama variable estadística.

Las variables pueden ser de dos tipos:

• Variables cualitativas o categóricas: no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo).

• Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales).

Las variables también se pueden clasificar en:

• Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de los alumnos de una clase).

• Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase).

• Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase). Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:

• Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podrá ser 3.45).

77

Page 8: Unidad 1 Introduccion Ala Estadística Inferencial

ESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

• Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 90.4 km/h, 94.57 km/h...etc.

Cuando se estudia el comportamiento de una variable hay que distinguir los siguientes conceptos:

• Individuo: cualquier elemento que porte información sobre el fenómeno que se estudia. Así, si estudiamos la altura de los niños de una clase, cada alumno es un individuo; si se estudia el precio de la vivienda, cada vivienda es un individuo.

• Población: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeno que se estudia. Por ejemplo, si se estudia el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad.

• Muestra: subconjunto que seleccionado de una población. Por ejemplo, si se estudia el precio de la vivienda de una ciudad, lo normal será no recoger información sobre todas las viviendas de la ciudad (sería una labor muy compleja), sino que se suele seleccionar un subgrupo (muestra) que se entienda que es suficientemente representativo.

1.4 ESTADISTICA INFERENCIAL

El origen de la Estadística descriptiva puede relacionarse con el interés por mantener registros gubernamentales hacia fines de la Edad Media. Cuando los estados nacionalistas empezaron a surgir durante ese período, se volvió necesario obtener información acerca de los territorios bajo la jurisdicción de cada nación. Esta necesidad de información numérica acerca de los ciudadanos y recursos lleva al desarrollo de técnicos para obtener y organizar datos numéricos.

Hacia fines del siglo XVII, ya existían investigaciones semejantes a nuestros censos modernos. Al mismo tiempo, las compañías de seguros empezaban a recopilar tablas de mortalidad para determinar las primas de seguros de vida. En las primeras etapas de desarrollo, la estadística incluía poco más que la obtención, clasificación y presentación de datos numéricos. Aún hoy en día, estas actividades siguen siendo una parte importante de la Estadística.

La Estadística inferencial o Inferencia estadística estudia cómo sacar conclusiones generales para toda la población a partir del estudio de una muestra, y el grado de fiabilidad o significación de los resultados obtenidos.

1.5 BREVE INTRODUCCIÓN A LA INFERENCIA ESTADÍSTICA

88

Page 9: Unidad 1 Introduccion Ala Estadística Inferencial

ESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

El principal objetivo de la Estadística es inferir o estimar características de una población que no es completamente observable (o no interesa observarla en su totalidad) a través del análisis de una parte de ella a la que llamamos muestra. Las razones por las que generalmente se trabaja con muestras son principalmente:

- Económicas.

- Tiempo: si la población es muy grande llevaría tanto tiempo analizarla que incluso la característica de interés podría variar en ese período. Por ejemplo, la tasa de paro.

- Destrucción: la medición de cierta característica podría llevar a la destrucción del individuo. Por ejemplo, al estudiar la supervivencia de ciertos animales a un tratamiento.

Lo que se hace entonces es analizar la muestra y extrapolar conclusiones desde la muestra a la población. Ahora bien, para considerar válidas en la población las conclusiones obtenidas en la muestra, ésta ha de representar bien a la población (representativa). Por lo tanto, la selección de la muestra es de suma importancia, y para ello hay diversos métodos (métodos de muestreo). Cuando se intuye que la característica en estudio puede presentar valores homogéneos en la población, una forma de obtener una muestra representativa es eligiéndola al azar. A este método de selección de la muestra se le llama muestreo aleatorio simple y es el más sencillo.

La Inferencia Estadística se puede clasificar en inferencia paramétrica e inferencia no paramétrica. La inferencia paramétrica tiene lugar cuando se conoce la distribución de la variable de estudio en la población, y el interés recae sobre los parámetros desconocidos de la misma. La inferencia no paramétrica tiene lugar si no se conoce la distribución y sólo se suponen propiedades generales de la misma. Nosotros nos centramos en la inferencia paramétrica, y nuestro objetivo será inferir o estimar parámetros poblacionales a partir de la información que nos proporciona una muestra.

Supongamos que estudiamos una variable X en una población y sabemos que presenta una distribución Fθ, donde θ es el parámetro de la distribución y es desconocido. Los problemas de inferencia que pueden darse son: de estimación, en los que se busca un valor (estimación puntual) para θ o un conjunto de valores posibles para el mismo (estimación por intervalos de confianza), y de contraste, cuyo objetivo es comprobar si es cierta o falsa cierta hipótesis formulada sobre el parámetro θ. En el Tema 7 se estudia la estimación puntual y por intervalos de confianza, y en Tema 8 estudiaremos problemas de contraste de hipótesis. Ejemplo: Supongamos que queremos estudiar el tiempo de fallo de una población de cierto tipo de componentes. Intuimos (por estudios anteriores por ejemplo) que el tiempo de fallo X sigue una distribución Exponencial, X → Exp(λ), con λ desconocido, ya que no observamos el tiempo de fallo de todos los componentes de la población.

1.6 TEORÍA DE DECISIÓN EN ESTADÍSTICA

99

Page 10: Unidad 1 Introduccion Ala Estadística Inferencial

ESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

El problema de la Decisión, motivado por la existencia de ciertos estados de ambigüedad que constan de proposiciones verdaderas (conocidas o desconocidas), es tan antiguo como la vida misma. Podemos afirmar que todos los seres vivientes, aun los más simples, se enfrentan con problemas de decisión. Así, un organismo unicelular asimila partículas de su medio ambiente, unas nutritivas y otras nocivas para él. La composición biológica del organismo y las leyes físicas y químicas determinan qué partículas serán asimiladas y cuáles serán rechazadas.

Conforme aumenta la complejidad del ser vivo, aumenta también la complejidad de sus decisiones y la forma en que éstas se toman. Así, pasamos de una toma de decisiones guiada instintivamente, a procesos de toma de decisiones que deben estar guiados por un pensamiento racional en el ser humano. La Teoría de la Decisión tratará, por tanto, el estudio de los procesos de toma de decisiones desde una perspectiva racional.

CARACTERÍSTICAS Y FASES DEL PROCESO DE DECISIÓN

Un proceso de decisión presenta las siguientes características principales:

Existen al menos dos posibles formas de actuar, que llamaremos alternativas o acciones, excluyentes entre sí, de manera que la actuación según una de ellas imposibilita cualquiera de las restantes.

Mediante un proceso de decisión se elige una alternativa, que es la que se lleva a cabo.

La elección de una alternativa ha de realizarse de modo que cumpla un fin determinado.

El proceso de decisión consta de las siguientes fases fundamentales:

Predicción de las consecuencias de cada actuación. Esta predicción deberá basarse en la experiencia y se obtiene por inducción sobre un conjunto de datos. La recopilación de este conjunto de datos y su utilización entran dentro del campo de la Estadística.

Valoración de las consecuencias de acuerdo con una escala de bondad o deseabilidad. Esta escala de valor dará lugar a un sistema de preferencias.

1010

Page 11: Unidad 1 Introduccion Ala Estadística Inferencial

ESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

Elección de la alternativa mediante un criterio de decisión adecuado. Este punto lleva a su vez asociado el problema de elección del criterio más adecuado para nuestra decisión, cuestión que no siempre es fácil de resolver de un modo totalmente satisfactorio.

CLASIFICACIÓN DE LOS PROCESOS DE DECISIÓN

Los procesos de decisión se clasifican de acuerdo según el grado de conocimiento que se tenga sobre el conjunto de factores o variables no controladas por el decisor y que pueden tener influencia sobre el resultado final (esto es lo que se conoce como ambiente o contexto). Así, se dirá que:

El ambiente es de certidumbre cuando se conoce con certeza su estado, es decir, cada acción conduce invariablemente a un resultado bien definido.

El ambiente de riesgo cuando cada decisión puede dar lugar a una serie de consecuencias a las que puede asignarse una distribución de probabilidad conocida.

El ambiente es de incertidumbre cuando cada decisión puede dar lugar a una serie de consecuencias a las que no puede asignarse una distribución de probabilidad, bien porque sea desconocida o porque no tenga sentido hablar de ella.

Según sea el contexto, diremos que el proceso de decisión (o la toma de decisiones) se realiza bajo certidumbre, bajo riesgo o bajo incertidumbre, respectivamente.

ELEMENTOS DE UN PROBLEMA DE DECISIÓN

En todo problema de decisión pueden distinguirse una serie de elementos característicos:

El decisor, encargado de realizar la elección de la mejor forma de actuar de acuerdo con sus intereses.

Las alternativas o acciones, que son las diferentes formas de actuar posibles, de entre las cuales se seleccionará una. Deben ser excluyentes entre sí.

Los posibles estados de la naturaleza, término mediante el cual se designan a todos aquellos eventos futuros que escapan al control del decisor y que influyen en el proceso.

Las consecuencias o resultados que se obtienen al seleccionar las diferentes alternativas bajo cada uno de los posibles estados de la naturaleza.

La regla de decisión o criterio, que es la especificación de un procedimiento para identificar la mejor alternativa en un problema de decisión.

1.7 COMPONENTES DE UNA INVESTIGACION ESTADISTICA 1111

Page 12: Unidad 1 Introduccion Ala Estadística Inferencial

ESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

1.9 ESTADISTICA PARAMETRICA (POBLACION Y MUESTREA ALEATORIA)

LA MUESTRA ALEATORIA

Una población en estadística es el conjunto de todas las observaciones en las que estamos interesados. Se llama tamaño de la población al número de individuos que la componen, siendo cada posible observación un individuo; así pues, las poblaciones pueden ser finitas e infinitas.

Cada observación en una población es un valor de una variable aleatoria X con una función de probabilidad o densidad determinada f(x) Normalmente, se denomina a las poblaciones con el nombre de la distribución de la variable; es decir, hablaremos de poblaciones normales, binomiales, etc.

Para estudiar una población existen dos posibilidades. Una de ellas consiste en estudiar todos sus elementos y sacar conclusiones; la otra consiste en estudiar sólo una parte de ellos, una muestra, elegidos de tal forma que nos digan algo sobre la totalidad de las observaciones de la población. El mejor método ser el primero, cuando es posible, lo cual sólo ocurre en las poblaciones finitas y razonablemente pequeñas; en el caso de poblaciones muy grandes o infinitas será muy difícil o imposible realizar un estudio total. En este caso necesitaremos tomar una muestra y nos surgirá el problema de cómo hacer para que la muestra nos diga algo sobre el conjunto de la población.

La condición más obvia que se le puede pedir a una muestra es que sea representativa de la población. Está claro que si no conocemos la población no podemos saber si la muestra es representativa o no. La única forma de tener cierta garantía de que esto ocurra es tomar nuestra muestra de forma que cada individuo de la población y cada subgrupo posible de la población tengan igual probabilidad de ser elegidos. A este tipo de muestras se les llama muestras aleatorias o muestras al azar.

Una muestra aleatoria de tamaño n es un conjunto de n individuos tomado de tal manera que cada subconjunto de tamaño n de la población tenga la misma probabilidad de ser elegido como muestra; es decir, si la población tiene tamaño N, cada una de las combinaciones posibles de n elementos debe ser equiprobable.

Los sistemas de muestreo se basan normalmente en la asignación de un número a cada uno de los individuos de la población y la posterior obtención de una muestra de n números aleatorios que se obtendrá por sorteo utilizando bolas numeradas, ordenadores, etc.

Otra variante del muestreo es cuando se divide la población en n grupos, que no correspondan con ninguna clasificación relacionada con el problema en estudio, que se ordenan. Por sorteo se elige un elemento del primer grupo y a continuación los elementos correspondientes de los demás grupos. Este tipo de muestra se denomina muestra al azar sistemático.

1212

Page 13: Unidad 1 Introduccion Ala Estadística Inferencial

ESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

Si la población está subdividida en grupos podemos tomar otro tipo de muestra en la que cada grupo de la población está representado por un porcentaje de individuos igual al porcentaje de individuos de la población integrados en ese grupo. Este tipo se llama muestra al azar estratificado.

PARÁMETROS Y ESTADÍSTICOS

Parámetros poblacionales

Se llama parámetros poblacionales a cantidades que se obtienen a partir de las observaciones de la variable y sus probabilidades y que determinan perfectamente la distribución de esta, así como las características de la población, por ejemplo: La media, μ, la varianza σ2, la proporción de determinados sucesos, P.

Los Parámetros poblacionales son números reales, constantes y únicos.

Parámetros muéstrales

Los Parámetros muéstrales son resúmenes de la información de la muestra que nos "determinan" la estructura de la muestra.

Los Parámetros muéstrales no son constantes sino variables aleatorias pues sus valores dependen de la estructura de la muestra que no es siempre la misma como consecuencia del muestreo aleatorio. A estas variables se les suele llamar estadísticos.

Los estadísticos se transforman en dos tipos: estadísticos de centralidad y estadísticos de dispersión.

Estadísticos de centralidad:

Son medidas de la tendencia central de la variable. los más conocidos son:

1)     La media aritmética

Es el valor esperado de las observaciones de la muestra calculado como si la muestra fuera una variable completa, es decir, multiplicando observaciones por frecuencias y sumando.

Si x1, x2,.., xn representan una muestra de tamaño n de la población, la media aritmética se calcula como:

1313

Page 14: Unidad 1 Introduccion Ala Estadística Inferencial

ESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

La media aritmética es la medida de la tendencia central que posee menor varianza. Engloba en ella toda la información de la muestra; esto, con ser una ventaja, supone una cierta desventaja pues los valores muy extremos, en muestras pequeñas afectan mucho a la media.

La media de la media aritmética es igual a la de las observaciones (μ) y su varianza es igual a la de las observaciones partidas por n. En poblaciones normales, la distribución de la media es normal,

Si la población no es normal, pero la muestra es grande (n ≥ 30), por el teorema central del límite la distribución de la media será asintóticamente normal.

2) La mediana

En una variable se define como el punto para el cual la función de distribución alcance el valor 0.5; en una muestra la mediana es el valor central.

Para calcularla se ordenan las observaciones de menor a mayor. Si n es impar, la mediana es la observación central

Si n es par, la mediana se define como la media de las dos observaciones centrales

En resumen, podríamos decir que la mediana es el valor que es mayor o igual que el 50% de las observaciones de la muestra y menor o igual que el otro 50%.

No tiene por qué ser igual a una de las observaciones de la muestra.

Es más fácil de calcular que la media aritmética y apenas se afecta por observaciones extremas; sin embargo tiene mayor varianza que X y sólo toma en cuenta la información de los valores centrales de la muestra.

1414

Page 15: Unidad 1 Introduccion Ala Estadística Inferencial

ESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

3) La moda

Es el valor más frecuente.

Su cálculo es el más simple de los tres correspondientes a estadísticos de centralidad pero la moda es el estadístico de mayor varianza.

La moda puede no existir y cuando existe no es necesariamente única. No tiene sentido en muestras pequeñas en las que la aparición de coincidencias en los valores es con gran frecuencia más producto del azar que de otra cosa.

La media es el estadístico de centralidad más usado cuando uno espera que la población tenga una distribución más o menos simétrica, sin estar clasificada en grupos claramente diferenciados.

En el caso de distribuciones muy asimétricas, con una cola muy larga, la mediana es, normalmente, el valor de elección dado que la media suele estar desplazada respecto al núcleo principal de observaciones de la variable. En estos casos, la mediana es el valor que mejor expresa el punto donde se acumulan mayoritariamente las observaciones de la variable.

En el caso de poblaciones o muestras subdivididas en grupos claramente definidos la media y la mediana carecen, normalmente, de sentido y los valores que más claramente reflejan el comportamiento de las observaciones de la variable son las modas.

Otros estadísticos de centralidad son los cuantiles.

Los cuan-tiles o percentiles

Un percentil X, PX, es un valor de la distribución muestral o poblacional de la variable que es mayor o igual que el X% de las observaciones de la variable P(Y ≤ PX) = X%.

Existe un tipo especial de cuantiles llamados cuartiles.

Los cuartiles son tres valores que dividen la distribución en cuatro partes equivalentes porcentualmente.

El primer cuartil es el valor que es mayor o igual que el 25% de las observaciones de la muestra y menor o igual que el 75%.

El segundo cuartil es la mediana.

El tercer cuartil es mayor o igual que el 75% de las observaciones de la muestra y menor o igual que el 25%.

1515

Page 16: Unidad 1 Introduccion Ala Estadística Inferencial

ESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

Estadísticos de dispersión

Los estadísticos de dispersión son parámetros muestrales que expresan la dispersión de los valores de la variable respecto al punto central, es decir, su posición relativa. Los más importantes son:

El rango

Es la diferencia entre las dos observaciones extremas, la máxima menos la mínima. Expresa cuantas unidades de diferencia podemos esperar, como máximo, entre dos valores de la variable.

El rango estima el campo de variación de la variable.

Se afecta mucho por observaciones extremas y utiliza únicamente una pequeña parte de la información.

La varianza

Es la desviación cuadrática media de las observaciones a la media muestral.

Su concepto es análogo al de la varianza poblacional. No obstante esta expresión de cálculo de la varianza muestral no se utiliza mucho pues sus valores tienden a ser menores que el de la auténtica varianza de la variable (debido a que la propia media muestral tiene una varianza que vale un enésimo de la de las observaciones) Para compensar esta deficiencia y obtener valores que no subestimen la varianza poblacional (cuando estamos interesados en ella y no en la varianza muestral) utilizaremos una expresión, esencialmente igual que la anterior salvo que el denominador está disminuido en una unidad.

Normalmente, estaremos interesados en saber cosas acerca de la varianza poblacional y no de la varianza muestral. Por tanto, en adelante, cuando hablemos de varianza

1616

Page 17: Unidad 1 Introduccion Ala Estadística Inferencial

ESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

muestral, salvo indicación expresa, nos referiremos a la segunda.

Es el estadístico de dispersión más usado por las propiedades de su distribución. Si la población de la que procede la muestra es normal:

Con n-1 grados de libertad.

Además, utiliza toda la información de la muestra.

Su mayor inconveniente consiste en que se expresa en unidades cuadráticas. Por ello, para muchos propósitos se utiliza otro estadístico de dispersión que la desviación típica.

Si no disponemos de una calculadora, el cálculo de la varianza puede ser complicado porque, habitualmente, los valores de las desviaciones de las observaciones a la media resultan ser números con varias cifras decimales. Por ello, se suele utilizar una ecuación que deriva directamente de la anterior:

O, alternativamente,  la equivalente a aquella de "la media de los cuadrados menos el cuadrado de la media".

La desviación típica

Es la raíz cuadrada positiva de la varianza y, por tanto, se expresa en las unidades de medida de la variable.

Su concepto es análogo al de la desviación típica poblacional.

1717

Page 18: Unidad 1 Introduccion Ala Estadística Inferencial

ESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

Coeficiente de variación

Es el cociente entre la desviación típica y la media aritmética muestrales y expresa la variabilidad de la variable en tanto por uno, sin dimensiones.

Permite comparar muestras de variables de distinta naturaleza o muestras de la misma variable en poblaciones en las que el orden de magnitud de las observaciones sea muy diferente.

1818

Page 19: Unidad 1 Introduccion Ala Estadística Inferencial

ESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

10.1 APLICACIONES

C=19.1 LI=94.9

95.0 99.6 101.0 103.6 105.6 110.0 116.1 120.0 125.6 140.0 148.2 150.4 155.2 158.9 165.2 170.6 176.0 180.0 190.3 195.9

95.1 99.6 101.0 103.8 105.6 110.2 116.3 120.3 125.9 140.0 148.2 150.5 155.2 159.6 165.2 170.7 178.1 181.4 191.6 195.9

95.1 99.6 101.2 103.8 105.8 110.6 116.3 120.8 125.9 140.1 148.2 150.5 155.3 159.6 165.3 170.8 178.3 181.4 191.6 196.0

97.2 99.9 101.2 103.9 106.0 110.6 116.3 123.0 126.0 140.1 148.2 150.5 155.4 159.8 165.4 171.2 178.4 182.3 191.6 196.0

97.8 100.0 101.3 104.1 106.0 110.6 116.3 123.6 126.0 141.2 148.3 151.6 155.5 159.8 165.5 171.6 178.6 184.2 191.7 196.0

98.3 100.1 101.3 104.6 106.1 110.7 116.9 123.6 126.1 141.3 148.3 152.9 155.6 159.9 165.5 171.3 178.6 184.5 191.7 196.2

98.5 100.1 101.4 104.9 106.3 110.8 118.0 123.7 128.6 141.3 148.5 152.9 155.7 160.0 165.6 172.3 178.7 184.6 192.3 196.2

98.5 100.5 101.6 105.0 106.3 110.9 118.9 123.8 128.9 141.5 148.6 153.2 155.7 161.3 165.6 172.3 178.9 184.6 192.3 196.3

98.5 100.6 101.8 105.1 106.4 111.0 118.9 124.0 130.2 141.6 148.7 154.0 155.7 161.3 165.7 172.3 178.9 185.0 192.6 197.8

99.0 100.6 101.9 105.1 106.4 114.3 118.9 124.0 130.2 141.7 148.8 154.3 155.8 161.4 165.8 174.5 179.0 186.3 193.6 199.8

99.0 100.7 101.9 105.2 106.5 114.6 119.0 124.3 130.5 141.8 149.9 154.4 155.9 161.5 165.9 175.0 179.0 186.9 193.7 199.8

99.1 100.8 102.0 105.4 106.9 114.6 119.1 124.8 130.6 143.0 149.9 154.4 158.0 161.5 170.0 175.1 179.1 188.7 193.8 199.9

99.2 100.9 102.0 105.4 108.3 115.6 119.1 124.8 130.6 143.2 149.9 155.0 158.1 164.3 170.1 175.6 179.3 188.9 193.8 199.9

99.4 100.9 102.1 105.5 108.7 115.9 119.1 125.0 130.6 144.2 149.9 155.1 158.1 164.4 170.3 175.6 179.4 188.9 194.0 200.0

99.6 100.9 103.0 105.6 109.0 115.9 119.1 125.1 130.9 145.0 150.0 155.1 158.2 164.4 170.5 175.7 179.4 188.9 194.1 200.0

1919

Page 20: Unidad 1 Introduccion Ala Estadística Inferencial

ESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

L.R.I L.I L.S L.R.S F X FX D FD U FU U^2 F(U^2)

lx-xl Flx-xl

(x-x)^2 F(x-x)^2

> <

94.85 94.9 113.9 113.9584 104.4 8769.6 -38.23

-3210.9 -2 -168 4 336 38.85 3263.79 1509.69 157611.13 300 0

113.95 114.0 133.0 133.05 51 123.5 6299.8 -19.10 -974.1 -1 -51 1 51 19.73 1006.21 389.26 48083.31 216 84

133.05 133.1 152.1 152.15 35 142.6 4991.9 0.00 0.0 0 0 0 0 0.63 22.04 0.40 13.88 165 135

152.15 152.2 171.2 171.25 60 161.7 9703.5 19.10 1146.0 1 60 1 60 18.47 1108.22 341.15 20469.19 130 170

171.25 171.3 190.3 190.35 41 180.8 7413.8 38 1566 2 82 4 164 37.57 1540.38 1411.5299 57872.73 70 230

190.35 190.4 209.4 209.45 29 199.9 5797.8 57.30 1661.7 3 87 9 261 56.67 1643.44 3211.53 93134.27 29 271

209.45 0 300

300 42976.4 57.3 188.90 10 872 8584.09 377184.51

2020

Page 21: Unidad 1 Introduccion Ala Estadística Inferencial

ESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

MEDIA

METODOLARGO :X=ΣFXN

= 42976.4300

=¿143.25

METODOCORTO :X=A+ ΣFDN

=142.6+188.90300

=142.6+0.63=¿ 143.23

METODOCLAVE :X=A+C( ΣFUN )=142.6+19.1( 10300 )=¿143.24

MEDIANA

MEDIANA :medLRI+C [ N2 −ΣFI

Fmed ]=133.05+19.1[ 3002 −135

35 ]=¿138.51

MODA

MODA :medLRI+C [ Δ1Δ1+Δ2 ]=94.85+19 .1[ 8 4

84+33 ]=94.85+19 .1 (0.71 )=¿108.56

Δ1=84−0=84 Δ2=84−51=33

DESVIACIÓN MEDIA

DM :Σ F ( X−X )

N=8584.09300

=¿28.61

DESVIACIÓN TÍPICA

S :√ΣF ¿¿¿35.52

S :C√ ΣFU 2

N−¿¿32.56

2121

Page 22: Unidad 1 Introduccion Ala Estadística Inferencial

ESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

2222

Page 23: Unidad 1 Introduccion Ala Estadística Inferencial

ESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIALESTADISTICA INFERENCIAL I INTRODUCCIÓN A LA ESTADÍSTICA INFERENCIAL

2323

94.85 113.95 133.05 152.15 171.25 190.35 209.450

50

100

150

200

250

300

350

Mayor queMenor que