20 ARGUETA LÓPEZ ALEJANDRA BELEN UNIDAD TEMÁTICA 1: ESTADÍSTICA DESCRIPTIVA 1.1 Recopilación de datos Uso de técnicas y herramientas que pueden ser utilizadas para desarrollar sistemas de información, los cuales pueden ser la entrevistas, la encuesta, el cuestionario, la observación, el diagrama de flujo y el diccionario de datos. 1.1.1 Datos no agrupados Es el conjunto de datos obtenidos en una recopilación que no han sido clasificados en clases o categorías, pues no es necesario clasificar dichos datos. Cuando la muestra contiene pocos elementos los datos pueden ser analizados sin necesidad de formar clases con ellos; a esto se le denomina “tratamiento de datos no agrupados”. Es aquella distribución que indica las frecuencias con que aparecen los datos estadísticos, desde el menor de ellos hasta el mayor de ese conjunto sin que se haya hecho ninguna modificación al tamaño de las unidades originales. En estas distribuciones cada dato mantiene su propia identidad después que la distribución de frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han sido solamente reagrupados, siguiendo un orden lógico con sus respectivas frecuencias. EJEMPLO 1.1
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
ARGUETA LÓPEZ ALEJANDRA BELEN
UNIDAD TEMÁTICA 1: ESTADÍSTICA DESCRIPTIVA
1.1 Recopilación de datos
Uso de técnicas y herramientas que pueden ser utilizadas para desarrollar sistemas de
información, los cuales pueden ser la entrevistas, la encuesta, el cuestionario, la
observación, el diagrama de flujo y el diccionario de datos.
1.1.1 Datos no agrupados
Es el conjunto de datos obtenidos en una recopilación que no han sido clasificados en
clases o categorías, pues no es necesario clasificar dichos datos. Cuando la muestra
contiene pocos elementos los datos pueden ser analizados sin necesidad de formar
clases con ellos; a esto se le denomina “tratamiento de datos no agrupados”.
Es aquella distribución que indica las frecuencias con que aparecen los datos
estadísticos, desde el menor de ellos hasta el mayor de ese conjunto sin que se haya
hecho ninguna modificación al tamaño de las unidades originales. En estas
distribuciones cada dato mantiene su propia identidad después que la distribución de
frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han
sido solamente reagrupados, siguiendo un orden lógico con sus respectivas
frecuencias.
EJEMPLO 1.1
Datos agrupados
Es el conjunto de datos obtenidos en una recopilación que han sido organizados en
varias clases o categorías. El fin de agruparlos es resumir la información adquirida;
generalmente, los elementos son de gran tamaño, por lo cual requieren ser agrupados,
1
ARGUETA LÓPEZ ALEJANDRA BELEN
esto implica: ordenar, clasificar y expresarlos en una tabla de frecuencias; para que los
datos puedan clasificarse se debe de verificar que éstos sean significativos, esto es,
que la información sea “repetitiva” y una vez hecha dicha clasificación verificar que
tenga coherencia y lógica.
Es aquella distribución en la que la disposición tabular de los datos estadísticos se
encuentra ordenados en clases y con la frecuencia de clase; es decir, los datos
originales de varios valores adyacentes del conjunto se combinan para formar un
intervalo de clase. No existen normas establecidas para determinar cuándo es
apropiado utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que
cuando el número total de datos (N) es igual o superior a 50 y además el rango o
recorrido de la serie de datos es mayor de 20, entonces, se utilizara la distribución de
frecuencia para datos agrupados, también se utilizara este tipo de distribución cuando
se requiera elaborar gráficos lineales como el histograma, el polígono de frecuencia o la
gráfica ojiva.
La razón fundamental para utilizar la distribución de frecuencia de clases es
proporcionar mejor comunicación acerca del patrón establecido en los datos y facilitar la
manipulación de los mismos. Los datos se agrupan en clases con el fin de sintetizar,
resumir, condensar o hacer que la información obtenida de una investigación sea
manejable con mayor facilidad.
Los datos agrupados se refieren al hecho de que estén ordenados, clasificados y
contados.
EJEMPLO 1.1.1
2
ARGUETA LÓPEZ ALEJANDRA BELEN
1.2 Ordenación y clasificación
Cuando los datos contienen una gran cantidad de elementos, para facilitar los cálculos
es necesario agruparlos.
1.2.1 N° de intervalos de clase
Número de Intervalos de Clase (ni).- No debe ser menor de 5 y mayor de 12, ya que un
número mayor o menor de clases podría oscurecer el comportamiento de los datos.
Para calcular el número de intervalos se aplica la regla de Sturges:
Siendo n el tamaño de la muestra.
1.2.2 Tamaño de intervalo
El Ancho del Intervalo (i).- Se obtiene dividiendo el Rango para el número de intervalos
Cuando el valor de i no es exacto, se debe redondear al valor superior más cercano.
Esto altera el valor de rango por lo que es necesario efectuar un ajuste.
Permite medir el grado de la agudeza de una distribución, es decir, para saber cuán
agudo o plano es un polígono de frecuencias.
Observemos los tipos de curtosis, en las siguientes
gráficas:
En la figura A se observa que ambas curvas son simétricas y tienen la misma
media, mientras que una de las curvas es más cúrtica. La figura B se le denomina
mesocúrtica (intermedio con punta). La figura C se le denomina leptocúrtica (delgada
con punta) y la figura D se le denomina platicúrtica (aplanado con punta).
El coeficiente de curtosis de un grupo de datos, es una medida del
apuntamiento o aplastamiento de su polígono de frecuencias, se define como:
En donde C75 es el percentil 75, etc.
Cuando el coeficiente de curtosis tiende a 0,5; esto es, si las diferencias C75–C25 y
C90-C10, son aproximadamente iguales, la curva se llama leptocúrtica.
Si el coeficiente de curtosis tiende a 0, esto es, cuando la diferencia C75–C25 es
pequeña, respecto de C90-C10, la curva se llama platicúrtica.
Si el coeficiente de curtosis es aproximadamente 0,25; esto es, si C90-C10
es aproximadamente el doble de C75–C25 , la curva se llama mesocúrtica.
17
ARGUETA LÓPEZ ALEJANDRA BELEN
1.4 Graficas.
Un gráfico o representación gráfica es un tipo de representación de datos,
generalmente numéricos, mediante recursos
gráficos (líneas, vectores, superficies o símbolos), para que se manifieste visualmente
la relación matemática o correlación estadística que guardan entre sí.
Para datos no agrupados:
Escalonada: Altamente utilizados en distribuciones para variable con frecuencia discreta. Este tipo de diagramas presentan un perfil escalonado, produciéndose un salto en cada uno de los valores definidos de la variable aleatoria. Es continua por la derecha, pero no por la izquierda. La cuantía de cada salto es precisamente la probabilidad en ese punto, la función de cuantía.