Actividad 6, Trabajo colaborativo 1. Estadística descriptiva Universidad Abierta y a Distancia UNAD. ESTADISTICA DESCRIPTIVA Trabajo Colaborativo 1 TUTOR …………………Francisco Cabrera Días………… INTEGRANTES. Jaime Fernando Rodríguez Javier Antonio Moreno Silva Juan Carlos Moreno Ortiz ……………………………… UNIVERSIDAD NACIONAL ABIERTA Y ADISTANCIA UNAD 2014-04-11
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Actividad 6, Trabajo colaborativo 1.
Estadí stica descriptiva
Universidad Abierta y a Distancia UNAD.
ESTADISTICA DESCRIPTIVA
Trabajo Colaborativo 1
TUTOR
…………………Francisco Cabrera Días…………
INTEGRANTES.
Jaime Fernando Rodríguez
Javier Antonio Moreno Silva
Juan Carlos Moreno Ortiz
………………………………
UNIVERSIDAD NACIONAL ABIERTA Y ADISTANCIA UNAD
2014-04-11
UNAD Trabajo colaborativo 1 Estadística descriptiva.
2
2
Introducción.
La estadística descriptiva tiene como objetivo recolectar, organizar y sobretodo analizar un
conjunto de datos que pertenezcan a un estudio estadístico determinado. Esto se hace
teniendo en cuenta que los datos son generalmente imperfectos en el sentido que aún cuando
posean información útil no permiten realizar un análisis a simple vista.
En el siguiente trabajo tomará una base de datos del seguimiento a un proceso de
potabilización de agua en una planta de tratamiento compacta, se mostrarán gráficos y tablas
con el objetivo de realizar un análisis de las variables del proceso.
Para el estudio, se tomaron variables cuantitativas continuas como lo son la dosis o
concentración de cloro que se adiciona en el proceso de cloración, variables cuantitativas
discretas como lo es el flujo del coagulante utilizado en el proceso inicial de tratamiento y
para variables cualitativas se tomaron los resultados los valores de cloro residual presentes en
el agua potabilizada para dar apreciaciones de SI o NO cumple la norma 1575 para tratamiento
de aguas potables teniendo en cuenta que debe ser un valor entre 0,3 y 2 ppm ( Partes por
millón).
UNAD Trabajo colaborativo 1 Estadística descriptiva.
3
3
Justificación
El agua potable es imprescindible para el mantenimiento de la vida. Mientras que las personas
pueden pasar incluso meses sin comer, tan sólo pueden pasar algunos días sin beber agua. Por
tanto, el hombre se sirve del agua existente en la naturaleza para consumirla y utilizarla, pero
es evidente que debido a determinadas características químicas, físicas y biológicas del agua,
ésta no puede ser utilizada de forma directa, y es por eso que dicha agua requerirá de una
serie de correcciones y tratamientos que eliminen aquellas partículas o sustancias perjudiciales
para el hombre. Lo anteriormente dicho hace necesario que se lleve controlado el proceso de
potabilización. Una de las formas de llevar a cabo el control es inspeccionar las diferentes
variables del proceso como lo son las adiciones de coagulante y floculante para la clarificación
y de cloro para el proceso de cloración. En este orden de ideas, se escoge una base de datos de
un proceso de potabilización del acueducto del Parque Industrial Malambo S.A (PIMSA)
ubicado en el municipio de Malambo en el departamento del Atlántico.
Objetivos
Verificar los avances conceptuales y procedimentales acerca de la fundamentación estadística.
Por medio de un trabajo investigativo y práctico.
Base de datos.
Población: datos mensuales de seguimiento de proceso de potabilización de agua. Tales datos
corresponden a Dosis de cloro gaseoso adicionado, Flujo de policloruro de aluminio (PAC),
Concentración de cloro residual en el agua tratada para determinar si se encuentra de los
parámetros permitidos según la resolución 1575 de 2007.
Muestra: datos tomados de los meses de febrero y marzo de 2013.
Variables: Dosis de cloro gaseoso, Flujo de policloruro de aluminio (PAC), Concentración de
cloro residual.
Unidad estadística: Variables de proceso de potabilización de agua.
Ubicación espacio temporal: Febrero y Marzo de 2014, Acueducto parque Industrial Malambo.
Día febrero (mañana)
Flujo bomba PAC (mL/s)
Dosis cloro (PPM)
Cloro residual (PPM)
Cumple Decreto 1575 para Cloro residual
1
2 22 2,258 1,26 si
3 22 2,392 1,49 si
4 20 2,024 2,1 no
5 19 2,631 1,11 si
6 9 2,506 1,95 si
7 18 1,827 2 si
8 14 2,364 1,85 si
9 15 2,740 2 si
UNAD Trabajo colaborativo 1 Estadística descriptiva.
4
4
10 10 1,949 2,2 no
11 15 2,740 2,01 no
12 14 3,043 1,57 si
13 16 3,635 1,63 si
14 17 3,742 2 si
15 14 2,258 1,56 si
16 12 2,619 2,2 no
17 12 3,387 2 si
18 12 2,728 1,59 si
19 12 2,923 2,2 no
20 12 3,508 1,77 si
21 11 3,508 1,37 si
22 11 3,508 1,32 si
23 12 2,631 1,4 si
24 12 2,631 1,24 si
25 15 2,476 1,29 si
26 17 1,827 1,72 si
27 13 2,631 1,26 si
28 21 2,506 1,76 si
Día Febrero (tarde)
Flujo bomba PAC (mL/s)
Dosis cloro (PPM)
Cloro residual (PPM)
Cumple Decreto 1575 para Cloro residual
1
2 14 2,631 1,31 si
3 13 2,631 1 si
4 13 2,631 2,31 no
5 14 2,506 1,71 si
6 13 2,506 1,2 si
7 19 2,740 1,41 si
8 10 2,506 1,6 si
9 20 1,879 1,47 si
10 20 2,526 0,8 si
11 10 1,879 1,23 si
12 14 3,157 1,57 si
13 14 2,506 1,21 si
14 16 3,934 0,37 si
15 15 2,819 1,26 si
16 13 2,192 2,2 no
17 13 2,722 0,69 si
18 15 2,819 1,45 si
19 16 3,013 2,07 no
20 12 3,946 1,32 si
21 12 3,946 1,38 si
22 12 3,946 1,31 si
23 16 3,954 1,75 si
24 12 2,894 1,21 si
25 12 3,157 1,42 si
UNAD Trabajo colaborativo 1 Estadística descriptiva.
5
5
26 12 2,850 1,63 si
27 16 2,526 1,25 si
28 16 4,024 1,74 si
Día marzo(mañana)
Flujo bomba PAC (mL/s)
Dosis cloro (PPM)
Cloro residual (PPM)
Cumple Decreto 1575 para Cloro residual
1 12 2,745 1,96 si
2 10 3,323 1,63 si
3 12 4,420 1,51 si
4 18 3,417 1,62 si
5 12 3,788 1,49 si
6 12 3,999 1,21 si
7 12 3,587 1,39 si
8 12 3,758 1,63 si
9 12 3,288 2,05 no
10 12 3,157 1,34 si
11 12 2,526 1,49 si
12 12 3,007 1,36 si
13 12 3,447 1,41 si
14 12 3,703 1,55 si
15 13 3,578 1,46 si
16 12 2,288 2 si
17 12 3,999 1,56 si
18 30 2,631 1,34 si
19 16 2,105 1,38 si
20 13 4,209 1,22 si
21 13 3,897 1,85 si
22 31 2,806 1,36 si
23 13 4,560 1,39 si
24 31 3,367 1,46 si
25 12 2,288 1,39 si
26 30 2,923 1,31 si
27 30 1,840 0,85 si
28 12 2,745 2,2 si
29 10 3,323 1,77 si
30 12 4,420 1,68 si
31 18 3,417 1,46 si
Día marzo(tarde)
Flujo bomba PAC (mL/s)
Dosis cloro (PPM)
Cloro residual (PPM)
Cumple Decreto 1575 para Cloro residual
1 10 3,431 1,39 si
2 12 2,631 1,31 si
3 12 3,157 0,85 si
4 12 3,431 2,2 no
UNAD Trabajo colaborativo 1 Estadística descriptiva.
6
6
5 25 2,338 1,77 si
6 10 2,506 1,68 si
7 11 3,800 1,46 si
8 10 3,267 1,3 si
9 9 2,870 1,39 no
10 10 4,575 1,26 si
11 12 2,226 1,68 si
12 12 2,105 1,62 si
13 12 2,080 1,68 si
14 12 2,037 1,82 si
15 12 3,007 1,49 si
16 15 2,631 1,51 si
17 18 2,631 1,19 si
18 16 2,631 1,75 si
19 13 2,631 1,41 si
20 30 2,288 1,75 si
21 30 2,516 1,7 si
22 10 3,367 1,68 si
23 11 3,508 1,33 si
24 30 1,827 1,33 si
25 28 2,631 1,46 si
26 30 3,431 1,41 si
27 29 2,631 2,02 no
28 17 3,157 1,87 si
29 15 3,431 1,36 si
30 12 2,338 1,39 si
31 12 2,506 1,31 si
Graficando los datos de todos los meses, es decir en los 116 días, obtendremos los siguientes
gráficos para la variable cuantitativa discreta:
Ilustración 1 Flujo de PAC
0
10
20
30
40
1 8
15
22
29
36
43
50
57
64
71
78
85
92
99
10
6
11
3
mL/
min
Días
Flujo Bomba PAC
UNAD Trabajo colaborativo 1 Estadística descriptiva.
7
7
Ilustración 2 Dosis Cloro gaseoso
Tabla 1 tabla de frecuencia variable cualitativa
Cumplimiento decreto 1575 para cloro residual
Variable Frecuencia
si 104
no 12
Ilustración 3 Variable cualitativa
Como se puede ver en el gráfico anterior, existe una moda claro de la variable cualitativa “SI”,
que indica que se cumple con la norma 1575 para cloro residual, para el cual el cloro debe
estar entre 0,3 ppm y 2 ppm en una corriente agua potabilizada.
A continuación se muestra la tabla de frecuencias para la variable discreta, que corresponde al
flujo de PAC utilizado a lo largo de los 116 días.
Tabla 2 Frecuencias variable discreta
Xi fi hi Fi Hi %
9 2 0,0172 2 0,0172 1,72413793
0
1
2
3
4
5
1 8
15
22
29
36
43
50
57
64
71
78
85
92
99
10
6
11
3
pp
m
Días
Dosis cloro gaseoso
0
20
40
60
80
100
120
Variable
Cumplimiento norma 1575 cloro residual
Si
NO
UNAD Trabajo colaborativo 1 Estadística descriptiva.
8
8
10 10 0,0862 12 0,1034 8,62068966
11 4 0,0345 16 0,1379 3,44827586
12 39 0,3362 55 0,4741 33,6206897
13 12 0,1034 67 0,5776 10,3448276
14 7 0,0603 74 0,6379 6,03448276
15 6 0,0517 80 0,6897 5,17241379
16 7 0,0603 87 0,7500 6,03448276
17 3 0,0259 90 0,7759 2,5862069
18 4 0,0345 94 0,8103 3,44827586
19 2 0,0172 96 0,8276 1,72413793
20 4 0,0345 100 0,8621 3,44827586
21 1 0,0086 101 0,8707 0,86206897
22 2 0,0172 103 0,8879 1,72413793
25 1 0,0086 104 0,8966 0,86206897
29 2 0,0172 106 0,9138 1,72413793
30 7 0,0603 113 0,9741 6,03448276
31 3 0,0259 116 1,0000 2,5862069
Total 116 1,0000
Media (X).
X=15,15
Lo que quiere decir que en promedio, se utilizan 15,15 mL/seg de coagulante para el proceso
de clarificado del agua cruda (no tratada).
Mediana (Me).
Me=13
Este valor de la mediana, nos deja el 50% de los datos por encima de su valor y el otro 50% por
debajo de su valor.
Moda (Mo).
Mo= 12
Que quiere decir que es caudal de coagulante que más se ha utilizado en estos 2 meses para
clarificación de agua es de 12 mL/s
Cuartiles.
Q1 =12 que supera el 25% de los datos
Q2 =13 que supera el 50% de los datos y coincide con la mediana.
UNAD Trabajo colaborativo 1 Estadística descriptiva.
9
9
Q3 =16 Que supera el 75% de los datos
En términos de la variable cuantitativa continua, la tabla de frecuencia para datos no
agrupados, será:
Tabla 3 Tabla frecuencia relativa datos no agrupados
Intervalo fi F1 hi %
1,5-2 7 7 0,06034483 6,03448276
2-2,5 14 21 0,12068966 12,0689655
2,5-3 42 63 0,36206897 36,2068966
3-3,5 23 86 0,19827586 19,8275862
3,5-4 21 107 0,18103448 18,1034483
4-4,5 9 116 0,07758621 7,75862069
116 1 100
Media (X).
X=2,948
Lo que quiere decir que en promedio, la dosis utilizada de cloro es 2,948 ppm para el proceso
de cloración de cloro.
Mediana (Me).
Me= 2,745
Este valor de la mediana, nos deja el 50% de los datos por encima de su valor y el otro 50% por
debajo de su valor.
Moda (Mo).
Mo= 2,631
Que quiere decir que la dosis de cloro que más se ha utilizado en estos 2 meses para la
cloración de agua es de 2,631 ppm.
Cuartiles.
Q1 =2,506 que supera el 25% de los datos
Q2 =2,745 que supera el 50% de los datos y coincide con la mediana.
Q3 =3,431 Que supera el 75% de los datos
Percentil p40
UNAD Trabajo colaborativo 1 Estadística descriptiva.
10
10
Donde Li es el límite inferior de la clase donde se encuentra el percentil, N es la suma de
todas las frecuencias absolutas, Fi-1 es la frecuencia acumulada anterior a la clase del
percentil.ai es la amplitud de la clase.
Por lo tanto:
El 40 % de la muestra son valores menores que él y el 100-40 % restante son mayores.
A continuación de muestra el polígono de frecuencia y la ojiva para la variable continúa:
Ilustración 4 Polígono de frecuencia.
Ilustración 5 Ojiva variable continua
0
20
40
60
1,5-2 2-2,5 2,5-3 3-3,5 3,5-4 4-4,5
Fre
cuan
cia
Polígono de frecuencias
0
50
100
150
1,5-2 2-2,5 2,5-3 3-3,5 3,5-4 4-4,5
Fre
cue
nci
a ac
um
ula
da
Ojiva
UNAD Trabajo colaborativo 1 Estadística descriptiva.
11
11
Glosario
VARIABLES CUALITATIVAS
Una variable es cualitativa si en la característica que se va a estudiar se busca conocer
gustos, preferencias u opiniones.
VARIABLES CUANTITATIVAS
Una variable es cuantitativa si la característica que se va a estudiar se pude medir en una
escala numérica.
MODA
La moda es el dato que tiene mayor frecuencia, es decir, el dato que mas se repite.
Pictogramas
Es una forma de representar los datos por medio de símbolos o dibujos donde cada uno
representa la misma información con un valor fijo.
MEDIA ARITMÉTICA
Se define como la suma de los valores de una cantidad dada de números dividido entre la
cantidad de números.
MEDIANA Se define como el valor que divide una distribución de datos ordenados en dos mitades, es
decir, se encuentra en el centro de la distribución.
RANGO O RECORRIDO
Se trata de la diferencia entre el límite superior y el límite inferior de un conjunto de datos.
VARIANZA Y DESVIACIÓN ESTÁNDAR
La desviación típica o estándar. Se define como la media aritmética de los cuadrados de las
desviaciones respecto a la media aritmética.
Desviación típica o estándar
Esta medida se obtiene extrayendo la raíz cuadrada de la varianza, tomando siempre el valor positivo.
UNAD Trabajo colaborativo 1 Estadística descriptiva.
12
12
Conclusiones
Mediante el estudio estadístico de datos para las variables de procesos de un proceso de
potabilización, se pudo observar una tendencia al uso de no muy variable en las dosificaciones
de un coagulante para la parte de clarificación y de cloro gaseoso para la parte de cloración; lo
cual es muy importante desde el punto de vista del control de procesos puesto que ayuda a
mantener una calidad de agua constante a lo largo de tiempo.
Se pudo observar de igual manera que la planta de tratamiento de agua de PIMSA, cumple con
el decreto 1575 desde el punto de vista de la cantidad de cloro residual presente en el agua
potable, lo cual es un referente a la hora de hablar de la calidad de agua. Por último, se pudo
demostrar la importancia del tratamiento estadístico de datos, puesto que así como se dijo al
principio del trabajo los datos son imperfectos en el sentido que aún cuando posean
información útil no permiten realizar un análisis a simple vista.