1. ASPECTOS GENERALES:
HISTORIA DE LA ESTADISTICA
Los comienzos de la estadstica pueden ser hallados en el antiguo
Egipto, cuyos faraones lograron recopilar, hacia el ao 3050 antes
de Cristo, prolijos datos relativos a la poblacin y la riqueza del
pas. De acuerdo al historiador griego Herdoto, dicho registro de
riqueza y poblacin se hizo con el objetivo de preparar la
construccin de las pirmides. En el mismo Egipto, Ramss II hizo un
censo de las tierras con el objeto de verificar un nuevo
reparto.Tambin los chinos efectuaron censos hace ms de cuarenta
siglos. Los griegos efectuaron censos peridicamente con fines
tributarios, sociales (divisin de tierras) y militares (clculo de
recursos y hombres disponibles). La investigacin histrica revela
que se realizaron 69 censos para calcular los impuestos, determinar
los derechos de voto y ponderar la potencia guerrera. Pero fueron
los romanos, maestros de la organizacin poltica, quienes mejor
supieron emplear los recursos de la estadstica. Cada cinco aos
realizaban un censo de la poblacin y sus funcionarios pblicos tenan
la obligacin de anotar nacimientos, defunciones y matrimonios, sin
olvidar los recuentos peridicos del ganado y de las riquezas
contenidas en las tierras conquistadas. Para el nacimiento de
Cristo suceda uno de estos empadronamientos de la poblacin bajo la
autoridad del imperio.Durante el siglo XVII y principios del XVIII,
matemticos como Bernoulli, Francis Maseres, Lagrange y Laplace
desarrollaron la teora de probabilidades. No obstante durante
cierto tiempo, la teora de las probabilidades limit su aplicacin a
los juegos de azar y hasta el siglo XVIII no comenz a aplicarse a
los grandes problemas cientficos. Godofredo Achenwall, profesor de
la Universidad de Gotinga, acu en 1760 la palabra estadstica, que
extrajo del trmino italiano statista (estadista). Crea, y con
sobrada razn, que los datos de la nueva ciencia seran el aliado ms
eficaz del gobernante consciente. La raz remota de la palabra se
halla, por otra parte, en el trmino latino status, que significa
estado o situacin; Esta etimologa aumenta el valor intrnseco de la
palabra, por cuanto la estadstica revela el sentido cuantitativo de
las ms variadas situaciones. Jacques Qutelect es quien aplica las
Estadsticas a las ciencias sociales. Este interpret la teora de la
probabilidad para su uso en las ciencias sociales y resolver la
aplicacin del principio de promedios y de la variabilidad a los
fenmenos sociales. Qutelect fue el primero en realizar la aplicacin
prctica de todo el mtodo Estadstico, entonces conocido, a las
diversas ramas de la ciencia.
CONCEPTOS DE LA ESTADISTICA
Estadstica: es un campo del conocimiento que permite al
investigador deducir y evaluar conclusiones acerca de una poblacin
a partir de informacin proporcionada por una muestra.
Especficamente, la estadstica trata de teoremas, herramientas,
mtodos y tcnicas que se pueden usar en:
a. Recoleccin, seleccin y clasificacin de datos. b.
Interpretacin y anlisis de datos. c. Deduccin y evolucin de
conclusiones y de su confiabilidad, basada en datos mustrales. Los
mtodos de la estadstica fueron desarrollados para el anlisis de
datos muestreados, as como para propsitos de inferencia sobre la
poblacin de la que se selecciono la muestra.
La estadstica como ciencia, cubre un extenso campo donde poder
aplicarla.
Se agrupa en 2 grandes reas: estadstica descriptiva y estadstica
inferencial, que desempean funciones distintivas, pero
complementarias en el anlisis.
Es importante que todo profesional que utilice la estadstica
como herramienta auxiliar de trabajo, posea un mnimo de
conocimientos y habilidades prcticas en aquellas tcnicas que le
facilitarn el buen desarrollo de esta actividad.
Estadstica descriptiva. La estadstica descriptiva comprende las
tcnicas que se emplean para resumir y describir datos numricos. Son
sencillas desde el punto de vista matemtico y su anlisis se limita
a los datos coleccionados sin inferir en un grupo mayor. El estudio
de los datos se realiza con representaciones grficas, tablas,
medidas de posicin y dispersin.
Estadstica inferencial. El problema crucial de la estadstica
inferencial es llegar a proposiciones acerca de la poblacin a
partir de la observacin efectuada en muestras bajo condiciones de
incertidumbre. sta comprende las tcnicas que aplicadas en una
muestra sometida a observacin, permiten la toman de decisiones
sobre una poblacin o proceso estadstico. En otras palabras, es el
proceso de hacer predicciones acerca de un todo basado en la
informacin de una muestra. La inferencia se preocupa de la precisin
de los estadgrafos descriptivos ya que estos se vinculan
inductivamente con el valor poblacional.
CONCEPTOS BASICOSPoblacinEs el conjunto de todos los elementos
que presentan una caracterstica comn determinada, observable y
medible. Por ejemplo, si el elemento es una persona, se puede
estudiar las caractersticas edad, peso, nacionalidad, sexo, etc.
Los elementos que integran una poblacin pueden corresponder a
personas, objetos o grupos (por ejemplo, familias, fbricas,
empresas, etc). Las caractersticas de la poblacin se resumen en
valores llamados parmetros.
MuestraUna muestra es un conjunto representativo de la poblacin
de referencia, el nmero de individuos de una muestra es menor que
el de la poblacin.La mayora de los estudios estadsticos, se
realizan no sobre la poblacin, sino sobre un subconjunto o una
parte de ella, llamado muestra, partiendo del supuesto de que este
subconjunto presenta el mismo comportamiento y caractersticas que
la poblacin. En general el tamao de la muestra es mucho menor al
tamao de la poblacin. Los valores o ndices que se concluyen de una
muestra se llaman estadgrafos y estos mediante mtodos inferenciales
o probabilsticos, se aproximan a los parmetros poblacionales.
VariableSe llama variable a una caracterstica que se observa en
una poblacin o muestra, y a la cual se desea estudiar. La variable
puede tomar diferentes valores dependiendo de cada individuo. Una
variable se puede clasificar de la siguiente manera.
a) Variable cuantitativa: es aquella que toma valores numricos.
Dentro de ella, se subdividen en:
Continua: son valores reales. Pueden tomar cualquier valor
dentro de un intervalo. Ej. Peso, estatura, sueldos.
Discreta: toma valores enteros. Ej. N de hijos de una familia, n
de alumnos de un curso.
b) Variable cualitativa: es aquella que describe cualidades. No
son numricas y se subdividen en:
Nominal: son cualidades sin orden. Ej. Estado civil, preferencia
por una marca, sexo, lugar de residencia.
Ordinal: son cualidades que representan un orden y jerarqua. Ej.
Nivel educacional, das de la semana, calidad de la atencin, nivel
socioeconmico.
IndividuoUn individuo o unidad estadstica es cada uno de los
elementos que componen la poblacin.
MuestreoEl muestreo es la reunin de datos que se desea estudiar,
obtenidos de una proporcin reducida y representativa de la
poblacin.
ValorUn valor es cada uno de los distintos resultados que se
pueden obtener en un estudio estadstico. Si lanzamos una moneda al
aire 5 veces obtenemos dos valores: cara y cruz.
DatoUn dato es cada uno de los valores que se ha obtenido al
realizar un estudio estadstico. Si lanzamos una moneda al aire 5
veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.
METODOS ESTADISTICOS
ETAPAS DEL MTODO ESTADSTICO El mtodo estadstico, parte de la
observacin de un fenmeno, y como no puede siempre mantener las
mismas condiciones predeterminadas o a voluntad del investigador,
deja que acten libremente, pero se registran las diferentes
observaciones y se analizan sus variaciones. Para el planeamiento
de una investigacin, por norma general, se siguen las siguientes
etapas:
1. Planteamiento del problema.2. Fijacin de los objetivos.3.
Formulacin de la hiptesis.4. Definicin de la unidad de observacin y
de la unidad de medida.5. Determinacin de la poblacin y de la
muestra.6. La recoleccin. 7. Crtica, clasificacin y ordenacin. 8.
Tabulacin. 9. Presentacin. 10. Anlisis. 11. Publicacin.
1. PLANTEAMIENTO DEL PROBLEMA Al abordar una investigacin se
debe tener bien definido qu se va a investigar y por qu se pretende
estudiar algo. Es decir, se debe establecer una delimitacin clara,
concreta e inteligible sobre el o los fenmenos que se pretenden
estudiar, para lo cual se deben tener en cuenta, entre otras cosas,
la revisin bibliogrfica del tema, para ver su accesibilidad y
consultar los resultados obtenidos por investigaciones similares,
someter nuestras proposiciones bsicas a un anlisis lgico; es decir,
se debe hacer una ubicacin histrica y terica del problema.
2. FIJACIN DE LOS OBJETIVOS Luego de tener claro lo que se
pretende investigar, Debemos presupuestar hasta dnde queremos
llegar; en otras palabras, debemos fijar cules son nuestras metas y
objetivos. Estos deben plantearse de tal forma que no haya lugar a
confusiones o ambigedades y debe, adems, establecerse diferenciacin
entre lo de corto, mediano y largo plazo, as como entre los
objetivos generales y los especficos.
3. FORMULACIN DE LAS HIPTESIS Una hiptesis es ante todo, una
explicacin provisional de los hechos objeto de estudio, y su
formulacin depende del conocimiento que el investigador posea sobre
la poblacin investigada. Una hiptesis estadstica debe ser
susceptible de docimar, esto es, debe poderse probar para su
aceptacin o rechazo. Una hiptesis que se formula acerca de un
parmetro (media, proporcin, varianza, etc.), con el propsito de
rechazarla, se llama Hiptesis de Nulidad y se representa por Ho; a
su hiptesis contraria se le llama Hiptesis Alternativa (H1).
4. DEFINICIN DE LA UNIDAD DE OBSERVACIN Y DE LA UNIDAD DE MEDIDA
La Unidad de Observacin, entendida como cada uno de los elementos
constituyentes de la poblacin estudiada, debe definirse
previamente, resaltando todas sus caractersticas; pues, al fin de
cuentas, es a ellas a las que se les har la medicin. La unidad de
observacin puede estar constituida por uno o varios individuos u
objetos y denominarse respectivamente simple o compleja. El
criterio sobre la unidad de medicin debe ser previamente definido y
unificado por todo el equipo de investigacin. Si se trata de
medidas de longitud, volumen, peso, etc., debe establecerse bajo qu
unidad se tomarn las observaciones ya sea en metros, pulgadas,
libras, kilogramos, etc. Asociado a la unidad de medida, deben
establecerse los criterios sobre las condiciones en las cuales se
ha de efectuar la toma de la informacin.
5. DETERMINACIN DE LA POBLACIN Y DE LA MUESTRA Estadsticamente,
la poblacin se define como un conjunto de individuos o de objetos
que poseen una o varias caractersticas comunes. No se refiere esta
definicin nicamente a los seres vivientes; una poblacin puede estar
constituida por los habitantes de un pas o por los peces de un
estanque, as como por los establecimientos comerciales de un barrio
o las unidades de vivienda de una ciudad. Existen desde el punto de
vista de su manejabilidad poblaciones finitas e infinitas. Aqu el
trmino infinito no est siendo tomado con el rigor semntico de la
palabra; por ejemplo, los peces dentro de un estanque son un
conjunto finito; sin embargo, en trminos estadsticos, puede ser
considerado como infinito.
Muestra es un subconjunto de la poblacin a la cual se le efecta
la medicin con el fin de estudiar las propiedades del conjunto del
cual es obtenida. En la prctica, estudiar todos y cada uno de los
elementos que conforman la poblacin no es aconsejable, ya sea por
la poca disponibilidad de recursos, por la homogeneidad de sus
elementos, porque a veces es necesario destruir lo que se est
midiendo, por ser demasiado grande el nmero de sus componentes o no
se pueden controlar; por eso se recurre al anlisis de los elementos
de una muestra con el fin de hacer inferencias respecto al total de
la poblacin. Existen diversos mtodos para calcular el tamao de la
muestra y tambin para tomar los elementos que la conforman, pero no
es el objetivo de este curso estudiarlos. Diremos solamente que la
muestra debe ser representativa de la poblacin y sus elementos
escogidos al azar para asegurar la objetividad de la investigacin.
.. 6. LA RECOLECCIN Una de las etapas ms importantes de la
investigacin es la recoleccin de la informacin, la cual ha de
partir, a menos que se tenga experiencia con muestras anlogo, de
una o varias muestras piloto en las cuales se pondrn a prueba los
cuestionarios y se obtendr una aproximacin de la variabilidad de la
poblacin, con el fin de calcular el tamao exacto de la muestra que
conduzca a una estimacin de los parmetros con la precisin
establecida. El establecimiento de las fuentes y cauces de
informacin, as como la cantidad y complejidad de las preguntas, de
acuerdo con los objetivos de la investigacin son decisiones que se
han de tomar teniendo en cuenta la disponibilidad de los recursos
financieros, humanos y de tiempo y las limitaciones que se tengan
en la zona geogrfica, el grado de desarrollo, la ausencia de
tcnica, etc. Es, entonces, descubrir dnde est la informacin y cmo y
a qu "costo" se puede conseguir; es determinar si la encuesta se
debe aplicar por telfono, por correo, o si se necesitan agentes
directos que recojan la informacin; establecer su nmero ptimo y
preparar su entrenamiento adecuado.
7. CRITICA, CLASIFICACIN Y ORDENACIN Despus de haber reunido
toda la informacin pertinente, se necesita la depuracin de los
datos recogidos. Para hacer la crtica de una informacin, es
fundamental el conocimiento de la poblacin por parte de quien
depura para poder detectar falsedades en las respuestas,
incomprensin a las preguntas, respuestas al margen, amn de todas
las posibles causas de nulidad de una pregunta o nulidad de todo un
cuestionario.
Separado el material de "desecho" con la informacin depurada se
procede a establecer las clasificaciones respectivas y con la ayuda
de hojas de trabajo, en las que se establecen los cruces necesarios
entre las preguntas, se ordenan las respuestas y se preparan los
modelos de tabulacin de las diferentes variables que intervienen en
la investigacin. El avance tecnolgico y la popularizacin de los
computadores hacen que estas tareas, manualmente dispendiosas,
puedan ser realizadas en corto tiempo.
8. LA TABULACIN Una tabla es un resumen de informacin respecto a
una o ms variables, que ofrece claridad al lector sobre lo que se
pretende describir; para su fcil interpretacin una tabla debe tener
por lo menos: Un ttulodddd adecuado el cual debe ser claro y
conciso. La Tabla propiamente dicha con los correspondientes
subttulos internos y la cuantificacin de los diferentes tems de las
variables, y las notas de pie de cuadro que hagan claridad sobre
situaciones especiales de la tabla, u otorguen los crditos a la
fuente de la informacin.
9. LA PRESENTACIN Una informacin estadstica adquiere ms claridad
cuando se presenta en la forma adecuada. Los cuadros, tablas y
grficos facilitan el anlisis, pero se debe tener cuidado con las
variables que se van a presentar y la forma de hacerlo. No es
aconsejable saturar un informe con tablas y grficos redundantes
que, antes que claridad, crean confusin. Adems la eleccin de
determinada tabla o grfico para mostrar los resultados, debe
hacerse no slo en funcin de las variables que relaciona, sino del
lector a quien va dirigido el informe.
10. EL ANLISIS La tcnica estadstica ofrece mtodos y
procedimientos objetivos que convierten las especulaciones de
primera mano en aseveraciones cuya confiabilidad puede ser evaluada
y ofrecer una premisa medible en la toma de una decisin. Es el
anlisis donde se cristaliza la investigacin. Esta es la fase de la
determinacin de los parmetros y estadsticos muestrales para las
estimaciones e inferencias respecto a la poblacin, el ajuste de
modelos y las pruebas de las hiptesis planteadas, con el fin de
establecer y redactar las conclusiones definitivas.
11. PUBLICACIN Toda conclusin es digna de ser comunicada a un
auditorio. Es ms, hay otros estudiosos del mismo problema a quienes
se les puede aportar informacin, conocimientos y otros puntos de
vista acerca de l.
FUNCIONES DE LA ESTADISTICA
As pues, la Estadstica puede aportar una primera aproximacin al
campo de estudio a partir de los datos que facilita al
investigador, con posterioridad se pueden aplicar los principios
derivados de la Estadstica, entendida como ciencia, para la
resolucin de problemas o para la toma de decisiones. Por ejemplo,
puede realizarse una recopilacin de datos sociodemogrficos de una
determinada zona residencial, para prever la construccin de
escuelas infantiles a corto plazo. Esta informacin puede ser til
para las autoridades administrativas.Downie y Heath (1983) sealan
que los profesionales de la pedagoga, sociologa, psicologa, en sus
trabajos de estudio e investigacin, suelen disponer de muchos y
variados datos que necesitan ser analizados e interpretados, algo
que no sera posible sin un conocimiento de la Estadstica, as
podemos sealar que nos ofrece las siguientes posibilidades:
Permite calcular las medias aritmticas de los grupos, para
comparar niveles de dominio de las variables. Establece el grado de
dispersin o variabilidad de las observaciones y datos. Representa
grficamente, mediante tablas y figuras, los grupos o los sujetos
individuales. Ayuda en la transformacin de datos para compararlos
(centiles, puntuaciones tpicas). Establece relaciones entre
variables y calcula el grado de relacin entre las mismas.Facilita
el clculo de la fiabilidad y la validez de los instrumentos de
recogida de datos y de medida. Recurre a diversas mediciones o
combinacin de variables para predecir el comportamiento futuro.
Permite extrapolar los resultados de muestras representativas a
grupos ms amplios (poblaciones). Compara las actuaciones de dos o
ms grupos y establece la existencia o no de diferencias
significativas, lo que permite comprobar qu procedimiento de
trabajo ofrece mejores resultados.
De forma sinttica, las principales funciones de la Estadstica se
pueden agrupar en torno a tres grandes apartados:
a) Facilitar el manejo de datos amplios y dispersos: se trata de
una funcin eminentemente simplificadora y descriptiva, pues se
pretenden reducir a ndices o estadsticos (media, mediana, desviacin
tpica, correlacin) las caractersticas que identifican a un conjunto
de datos. As se procede a la ordenacin, la categorizacin, posicin,
variabilidad, simetra y asimetra, representaciones grficas y
estudios de relaciones entre variables.
b) Inferir desde la muestra a la poblacin: este proceso consiste
en el anlisis que sigue el investigador para extrapolar los
resultados obtenidos en las muestras a las poblaciones de las que
se extrajeron. Estamos hablando de la generalizacin de los
resultados de muestras, cuando stas cumplen los requisitos de
suficiencia y representatividad.Es decir, desde los estadsticos
(proceden de muestras) se pueden estimar los parmetros (medidas de
poblacin).
c) Ayudar en la toma de decisiones: tanto desde los meros
anlisis descriptivos de grupos como el anlisis de los valores
crticos que ponen de relieve la existencia de diferencias
significativas entre los grupos de tratamiento. En ambos supuestos
se trata de incorporar cambios en las actuaciones educativas que
redunden en mejoras de las formas de actuacin en el campo
socioeducativo.
ABUSOS DE LA ESTADSTICA
Se puede definir de dos diferentes maneras:
Como coleccin de datos numricos: Dichos datos numricos son
presentados de manera ordenada y sistemtica. Una informacin numrica
puede no constituir una estadstica, para merecer este apelativo los
datos se deben de construir como un conjunto coherente establecido
de forma sistemtica y siguiendo un criterio de ordenacin. Como
ciencia: Estudia el comportamiento de masas buscando las
caractersticas generales de un colectivo y preside de las
particulares de cada elemento. Por ejemplo: al investigar el sexo
de los nacimientos despus obtener la proporcin del sexo masculino o
del sexo femenino.
1. USOS Y ABUSOS
Uso:Conocer el porcentaje de la poblacin que necesita agua.
Conocer el porcentaje de poblacin que tiene diabetes. Conocer el
porcentaje de personas que utilizan tomate para preparar sus
comidas Conocer el porcentaje de personas guatemaltecas que
consumen tortilla.
Abuso:Aprovechar dicho resultado para el aumento de precio.
Aprovechar el resultado para el aumento del precio de las
medicinas. Conocer el resultado de dicho estudio y aumentarles el
precio. Conocer el resultado de dicho y aumentar el precio.
2. ASPECTOS FUNDAMENTALES:
TECNICAS DE MUESTREO
Como se ha puesto de manifiesto, gran parte del trabajo de un
estadstico profesional se hace con muestras. Estas son necesarias
porque las poblaciones son casi siempre demasiado grandes para
estudiarlas en su totalidad. Exigira demasiado tiempo y dinero
estudiar la poblacin entera, y tenemos que seleccionar una muestra
de la misma, calcular el estadstico de esa muestra y utilizarlo
para estimar el parmetro correspondiente de la poblacin. La
obtencin de la informacin se puede realizar por diversos medios.
Una forma es a travs de una encuesta a un grupo de individuos,
donde a cada uno se le hacen las mismas preguntas. Otra forma es a
travs de experimentos donde la respuesta a la variable es el
resultado del experimento. Puede tambin recolectarse los datos en
forma directa, es decir, la informacin se extrae de alguna base de
datos seleccionando una muestra de ellos. En cualquiera de estos
casos contamos con una seleccin de informacin llamada muestra y que
se procede a analizar. Existen diferentes tcnicas para realizar el
muestreo y que depender cada caso, cual usar. Algunas de ellas
son:
1. Muestreo aleatorio simple: todos los elementos de la poblacin
tiene igual posibilidad de ser escogido y se eligen al azar.
2. Muestreo sistemtico: los elementos se seleccionan a un
intervalo uniforme en una lista ordenada. Una preocupacin del
muestreo sistemtico es la existencia de factores cclicos en el
listado que pudieran dar lugar a un error.
3. Muestreo estratificado: los elementos de la poblacin son
primeramente clasificados en grupos o estratos segn una
caracterstica importante. Luego, de cada estrato se extrae una
muestra aleatoria simple.
4. Muestreo por conglomerado: los elementos de la poblacin estn
subdivididos en grupos y se extraen aleatoriamente algunos de estos
grupos completos
ESCALAS DE MEDICION, VARIABLE, TIPOS Y VALORESSi hubiese una
escala para medir la amistad, nos daramos cuenta que amigos hay muy
pocos Le ThierreComo sabemos las caractersticas personales como
estatura , edad, gnero, habilidades, tamaos de un determinado grupo
se los conoce como variables, sabemos que existe una gama muy
diferenciada de variables de las cuales se pude extrapolar
diferentes escalas para ser medibles, la aplicacin de la
bioestadstica para medir caracterstica y valores tanto cualitativos
como cuantitativos a travs de la utilizacin de escalas que permitan
medir de mejor manera un resultado obtenido.MEDICION DE VARIABLES
Antes que una variable sea tratada estadsticamente debe ser
observada/medida para un conjunto de unidades observacionales, las
unidades observacionales son aquellos entidades que se observan,
cuando las observaciones se cuantifican (es decir se expresan
numricamente) se dice que los nmeros son medibles, una medicin es
una observacin que se expresa fsicamente en forma numrica, es decir
cuando se le otorga un valor determinado segn su magnitud.De lo
anteriormente mencionado podemos deducir que existen diferentes
formas de medir variables, algunas se las puede medir directamente
por ejemplo la temperatura, la tensin arterial, la inteligencia, y
otros en forma indirecta, como el grado de aprovechamiento de una
determinada asignatura, la eficiencia, eficacia, el amor , ser
romntico, ser buen mal estudiante, etc.Algunos de esos mtodos de
evaluacin de medicin de variables (escalas) podran arrojar datos
numricos u otros podran ser expresados en palabras, de esto depende
la credibilidad de la investigacin basada en la exactitud,
conveniencia, y significado de las mediciones que podran ser el
origen de las conclusiones, recomendaciones y acciones, fruto de la
resolucin del fenmeno problema. Una vez que agrupamos estas
caractersticas de los individuos de los elementos observados (
variables) en categoras en grupos clases, esta agrupacin de
caracterstica comunes similares nos permite clasificarlas en
:CLASIFICACION DE LAS ESCALASLas Escalas al igual que las variables
se clasifican en cualitativas y cuantitativas, al mismo tiempo se
sub dividen en: Cualitativas : 1. Escala nominal clasificatoria1.
Escala ordinal Cuantitativas: 1. Escala discreta discontinua1.
Escala concreta continua Otras escalas:1. Escala cronolgica1.
Escala intervalar1. Escala de razn ESCALA NOMINAL
CLASIFICATORIAEste tipo de variables no presentan un ordenamiento
previo, ms al contrario es arbitraria, de ah que se haya ideado
tres parmetros para entender mejor este tipo de escala; variable,
escala y diferencia, por ejemplo1. Variable : PROFESION1. Escala :
INGENIEROMEDICOABOGADOENFERMEROODONTOLOGO1. Diferencia : No existe
diferencia entre los profesionales, Otros ejemplos: Variable:
DEPARTAMENTOS DE BOLIVIAEscala: La
pazCochabambaOruroPotosTarijaBeniDiferencia: Ninguna . Variable:
SexoEscala: MasculinoFemeninoDiferencia: Ninguna Variable: Estado
civilEscala: SolteroCasadoDivorciadoViudoUnin estableDiferencia:
Ninguna. ESCALA ORDINALLas variables susceptibles de ser medidas
siguiendo un ordenamiento (orden), formada por una clase mutuamente
excluyentes, que se agrupan de acuerdo a un orden pre asignado. Por
ejemplo1. Variable : GRADO DE INSTRUCCION1. Escala :
PRIMARIASSECUNDARIASUPERIORPOST SUPERIOR1. Diferencia: Existe
diferencia entre diferentes niveles de la escala entre los
estudiantes de grado primario con los de nivel superior existe no
solo aos de experiencia, sino conocimiento. ,Otros ejemplos:1.
Variable: GRADO DE MILITAR y/o POLICIALEscala:
SOLDADOSARGENTOSUBOFICIALOFICIALGENERALDiferencia: Existe
diferencia entre los grados jerrquicos no solo en aos de
experiencia sino en aos de estudio. Variable: JERARQUIA FAMILIAR
Escala: HIJO MENORHIJO MEDIOHIJO MAYOR MADRE PADREPADRE
MADREDiferencia: Existe diferencia entre los grados jerrquicos de
la familia no solo en aos de experiencia sino en edad.ESCALA
DISCRETA DISCONTINUASe dice que si la variable medida es
susceptible a ser contada, se puede construir una escala discreta,
formada por nmeros ENTEROS con incrementos fijos, donde las
fracciones no son consideradas, para esto, se debe considerar la
magnitud de los nmeros expuestos. Por ejemplo:1. Variable : NUMERO
DE HIJOSEscala: 1 HIJO2 HIJOS3 HIJOS4 HIJOS1. Amplitud: Entre 4 y 1
hijos , existe una amplitud de 3 hijosOtros ejemplos: Variable:
NUMERO DE VISITASEscala: De 1 a 3 visitasDe 4 a 6 visitasDe 7 a 9
visitasDe 10 a 12 visitasAmplitud: Entre 1 y 3, existe una amplitud
de 2 Variable: NUMERO DE CARIES DENTAL Escala: De 1 a 3 cariesDe 4
a 6 cariesDe 7 a 9 cariesAmplitud: Entre 1 y 3 caries, existe una
amplitud de 2 cariesESCALA CONCRETA CONTINUACuando uno cuenta con
variables de tipo cuantitativo continuo o concreto se pude utilizar
este tipo de escala, cuyo requisito es l de poder presentar nmeros
relativos racionales (fraccionados, porcentuales y/o decimales)
siendo esta medicin aproximada. Por ejemplo:Variable: ESTATURA
Escala: 1,65 m.1,66 m.1,67 m.1,68 m.1,69 m.Amplitud: Entre 1,65 y
1,69 m., existe una amplitud de 0,5mOtros ejemplos: Variable: PESO
EN GRAMOSEscala: 6,5 Kg 7,5 Kg8,5 Kg9,5 KgAmplitud: Entre 6,5 y 9,5
kg, existe una amplitud de 4,0 kg. Variable: TIEMPO EN HORAS
Escala: 1,10 hrs.2,10 hrs.3,10 hrs.4,10 hrs.Amplitud: Entre 1,10 y
4,10 horas, existe una amplitud de 4 horas.ESCALA DICOTOMICA Es
aquella escala que presenta tan solo dos opciones para medir la
variable, siendo esta variable de tipo cualitativo cuantitativo
dependiendo de la informacin resultado que se busque, por ejemplo:
1. Variable preferencia por un equipo de Futbol (football) 1.
Escala de medicin: Bolvar y Wilsterman1. Respuesta : Bolvar
Wilsterman Otro ejemplo:1. Variable. sexo de un estudiante de
UDABOL 1. Escala de medicin: Masculino femenino 1. Respuesta:
Masculino femenino
ESCALA CRONOLGICAEs un tipo de escala cuantitativa continua, se
la utiliza para estudiar algunos fenmenos en funcin al tiempo,
algunos autores la tratan como si fuera una escala de variable
independiente, permite conocer un determinado fenmeno a travs del
tiempo , es decir permite un seguimiento temporalizado (en el
pasado, en el presente en el futuro).1. Variable. Cambios fsico de
Mara Gordales 1. Escala de medicin : al 1 ao5 aos25 aos50 aos75 aos
100 aos 1. Respuesta: descripcin de las alteraciones fsicas durante
su vida Otro ejemplo:El seguimiento de un determinada enfermedad
por ejemplo el SIDA EL SIDNA, donde se podra realizar un
seguimiento por memorizado de las patologas que se producen a raz
de este fenmeno.ESCALA INTERVALARLas categoras se ordenan en
unidades igualmente espaciadas, siendo posible medir las
diferencias relativas en cada punto de la escala, no EXISTE EL CERO
ABSOLUTO, tenemos como ejemplo: 1. Variable : Medicin de la
temperatura corporal, 1. Escala : Grados centgrado Celsius (37) 1.
Diferencia : La hace los nmero mayores menores de 37 ESCALA DE RAZN
En esta escala SI EXISTE EL CERO ABSOLUTO y la magnitud de
diferencia entre los valores numricos entre s por ejemplo
:Variable: RELACIN ENTRE LAS EDADESEscala: Juan recin nacido (0
aos)Jos 9 aos ( 9aos ms )Joaqun 18 aos (9 aos que Jos y 18 aos ms
que Juan)
3. ORGANIZACIN DE DATOS:
RECOPILACION DE DATOS
En un estudio estadstico los mtodos que se aplican son:A)
Recopilacin: De acuerdo con la localizacin de la informacin los
datos estadsticos pueden ser internos y externos.Los internos son
los registros obtenidos dentro de la organizacin que hace un
estudio estadstico,Los externos se obtienen de datos publicados y
encuestas.B) Organizacin: En la organizacin de los datos
recopilados, el primer paso es corregir cada uno de los elementos
recopilados.C) Representacin: Hay 3 maneras de presentar un
conjunto de datos mediante enunciados, tablas estadsticas y grficas
estadsticas.D) Anlisis: Despus de los datos anteriores los datos
estadsticos estn listos para hacer analizados, para lo cual
frecuentemente se emplean operaciones matemticas durante el proceso
de anlisis.METODO PARA LA RECOLECCION DE DATOS
En estadstica se emplean una variedad de mtodos distintos para
obtener informacin de los que se desea investigar. Discutiremos aqu
los mtodos ms importantes, incluyendo las ventajas y limitaciones
de estos.La entrevista personal: los datos estadsticos necesarios
para una investigacin, se renen frecuentemente mediante un proceso
que consiste en enviar un entrevistador o agente, directamente a la
persona investigada. El investigador efectuar a esta persona una
serie de preguntas previamente escritas en un cuestionario o
boleta, donde anotar las respuestas correspondientes. Este
procedimiento que se conoce con el nombre de entrevista personal,
permite obtener una informacin ms veraz y completa que la que
proporcionan otros mtodos, debido a que al tener contacto directo
con la persona entrevistada, el entrevistador podr aclarar
cualquier duda que se presente sobre el cuestionario o
investigacin.Otra ventaja es la posibilidad que tienen los
entrevistadores de adaptar el lenguaje de las preguntas al nivel
intelectual de las personas entrevistadas.Una de las desventajas de
este mtodo se debe a que si el entrevistador no obra de buena f o
no tiene un entrenamiento adecuado, puede alterar las respuestas
por las personas entrevistadas.Otra desventaja es su alto costo, ya
que resulta bastante oneroso el entrenamiento de los agentes o
entrenadores y los supervisores de estos, sobre todo si se trata de
una investigacin extensa.Cuestionarios por correo: consiste en
enviar por correo el cuestionario acompaado por el instructivo
necesario, dando en este no solo las instrucciones pertinentes para
cada una de las preguntas, sino tambin una breve explicacin del
objeto de la encuesta con el fin de evitar interpretaciones
errneas.Una de las ventajas es que tienen un costo muy inferior al
anterior procedimiento, puesto que no hay que incluir gastos de
entrenamiento de personal, el nico gasto sera el de franqueo
postal.Dentro de las desventajas de este procedimiento podemos
sealar que solo un porcentaje bastante bajo de estos es devuelto,
en algunos casos no estamos seguros de que los formularios hayan
sido recibidos por sus destinatarios y que hayan sido respondido
por ellos mismos. Lo que trae como consecuencia que la informacin
se obtenga con una serie de errores difciles de precisar por el
investigador.Entrevista por telfono: como lo indica su nombre, este
mtodo consiste en telefonear a la persona a entrevistar y hacerle
una serie de preguntas. Este mtodo es bastante simple y econmico,
ya que el entrenamiento y supervisin de las personas encargadas de
efectuar las preguntas es siempre fcil.Entre las limitaciones que
presenta este mtodo podemos sealar el nmero de preguntas que pueden
formularse es relativamente limitado; adems las investigaciones
efectuadas por este mtodo tienen un carcter selectivo, debido a que
muchas de las personas que potencialmente podran ser investigadas
no posee servicio telefnico, por lo que quedan sin la posibilidad
de ser entrevistados.
INSTRUMENTOS PARA LA RECOLECCION DE DATOS
Cuestionarios:Cualquiera que sea el mtodo por el que se decida
el investigador para recabar informacin, es necesario elaborar un
estudio de preguntas.Los cuestionarios en general, constan de las
siguientes partes:a. La identificacin del cuestionario: nombre del
patrocinante de la encuesta, (oficial o privada), nombre de la
encuesta, nmero del cuestionario, nombre del encuestador, lugar y
fecha de la entrevista. b. Datos de identificacin y de carcter
social del encuestado: apellidos, nombres, cdula de identidad,
nacionalidad, sexo, edad o fecha de nacimiento, estado civil, grado
de instruccin, ocupacin actual, ingresos, etc. c. Datos propios de
la investigacin, son los datos que interesa conocer para construir
el propsito de la investigacin. Como es natural, estas partes, as
como las preguntas, varan de acuerdo a la finalidad de la encuesta.
En algunos tipos de investigacin, la parte referente a los datos
personales es eliminada por no tener ningn tipo de inters para el
estudio.
Consideraciones que debemos tomar en cuenta: El cuestionario
debe ser conciso; tratar en los posible de que con el menor nmero
de preguntas, se obtenga la mejor informacin. Claridad de la
redaccin; evitar preguntas ambiguas o que sugieran respuestas
incorrectas, por lo que deben estar formuladas las preguntas de la
forma ms sencilla. Discrecin: un cuestionario hecho a conciencia,
no debe tener preguntas indiscretas o curiosas, sobre datos
personales que puedan ofender al entrevistado. Facilidad de
contestacin: se deben evitar, en lo posible, las preguntas de
respuestas libres o abiertas y tambin la formulacin de preguntas
que requieran clculos numricos por parte del entrevistado. Orden de
las preguntas: estas deben tener una secuencia y un orden lgico,
agruparlas procurando que se relacionen unas con otras. Series o
distribuciones estadsticas:Anteriormente hemos sealado que la
estadstica, no se encarga del estudio de un hecho aislado, sino que
tienen por objeto de los colectivos. Pues bien cuando se realiza
una investigacin se obtiene una masa de datos que deben ser
organizados para disponerlos en un orden, arreglo o secuencia
lgica, con el fin de facilitar el anlisis de los mismos esta
coleccin de datos numricos obtenidos de la observacin, que se
clasifican y ordenan segn un determinado criterio, se denominan
"series estadsticas", tambin conocidas como "distribucin
estadstica".Clasificacin de las series estadsticas:1.
Ejemplo:Produccin nacional de madera en Rola en mRollizos (periodo
1993 1998)AosProduccin (m rollizos)
19931.161.061,454
1994981.668,626
19951.087.926,142
19961.440.306,250
19971.618.075,000
19981.027.177,876
Fuente: MARN D.G.S Recurso Forestal. 1999CVG PROFORCAEs
importante resaltar que cuando se trata de series temporales o
cronolgicas, se debe especificar el instante o el periodo de tiempo
a los que se refieren los caracteres en estudio.Cuando nos
referimos a instantes de tiempo, por el hecho de que la observacin
se hace en un momento especfico de tiempo.Ejemplo:Plantaciones
forestales ejecutadas a nivel nacional, al 31 de diciembre de cada
ao entre 1997 2001.2. Series temporales o cronolgicas; estas se
definen como una masa o conjunto de datos producto de la observacin
de un fenmeno individual o colectivo, cuantificable en sucesivos
instantes o periodos de tiempo. 3. Series atemporales; cuando las
observaciones de un fenmeno se hacen referidas al mismo instante o
intervalo de tiempo, nos encontramos ente una serie atemporal. Aqu
el tiempo no va incluido a cada observacin, puesto que es el mismo
tiempo para todas ellas. Este tipo de observacin proporciona una
"visin instantnea" de los fenmenos o caracteres de los componentes
del colectivo en estudio. Ejemplo:Las notas de las participantes en
la materia de estadstica I en el periodo acadmico que termin en
septiembre del 2001.2.1) series de frecuencia; cuando realizamos un
estudio de cada uno de los elementos que componen la poblacin o
muestra bajo anlisis, observamos que en general, hay un nmero de
veces en que aparece repetido un mismo valor de una variable, o
bien repeticiones de la misma modalidad de un atributo. Este nmero
de repeticiones de un resultado, recibe el nombre de frecuencia
absoluta o simplemente frecuencia.El procedimiento mediante el cual
se realiza el conteo, para as determinar el nmero de veces que cada
dato se repite, recibe el nombre de tabulacin.Ejemplo:Consideremos
las edades de 20 nios, pertenecientes al Preescolar Blanca de Prez,
ubicado en la urbanizacin Monseor Padilla56543
63454
34653
43646
Tabulando los datos tenemosNios distribuidos por edades: Edad
(variable)N de nios (Frecuencia)
35
46
54
65
Total =20
Al agrupar los resultados de las observaciones en trmino de las
veces que stos se repiten, da lugar a las llamadas "series de
frecuencias" o distribuciones de frecuencias; las cuales se dividen
a su vez en series de frecuencia cualitativas y cuantitativas, segn
que los caracteres de estudio se refieran a atributos o variables
respectivamente.2.2.1) Series de frecuencia acumulativa: son
comnmente llamadas series de frecuencia de atributos o caracteres
cualitativos y las formas de representar un atributo recibe el
nombre de modalidades.Cuando se observan y se obtienen los
elementos que deseamos estudiar con respecto a un carcter de tipo
cualitativo y se procede a agruparlos segn las distintas
modalidades que toma el atributo, "frecuencia
cualitativa".Ejemplo:Agrupamos los resultados obtenidos al observar
los 35 estudiantes de la materia estadstica I, respecto a su estado
civil.Estudiantes de la materia Estadsticas I, clasificados por su
estado civil.Estado civilN de Estudiantes (frecuencia)
Solteros18
Casados12
Viudos1
Divorciados4
2.1.2) Series de frecuencias cualitativas: es el resultado del
agrupamiento de los valores que se repiten (frecuencia) al ser
observada una variable.Ejemplo:Tomamos nuevamente los 35
estudiantes de la materia estadstica I, respecto a su edad.Edad (en
aos)N de estudiantes (frecuencia)
1912
202
258
286
324
423
Total =35
2.2) series especiales o geogrficas: es aquella que est formada
por los valores que toman una variable en funcin del espacio
geogrfico.
TABULACION DE DATOS
La tabulacin consiste en presentar los datos estadsticos en
forma de tablas o cuadros.
Forma de tabular
VARIABLES CUALITATIVAS
Pueden representarse:_ La frecuencia absoluta (smbolo: f n), que
es el n de veces que aparece cada modalidad (resultado del
recuento). La frecuencia total, de todas las modalidades juntas, se
representa por N.
_ La frecuencia relativa (fr) o proporcin se obtiene dividiendo
la frecuencia de cada modalidad entre el total de datos. fr = f / N
. Los valores posibles oscilan entre 0 y 1.Suele expresarse con 3
decimales. La suma de todas las fr tiene que dar 1 un nmero muy
cercano al 1, si ha habido redondeos.
_ El porcentaje (P o %), que es la frecuencia relativa
multiplicada por 100. P = fr * 100 % = (f*100)/N. Suele expresarse
con 3 dgitos. La suma de todos los porcentajes debe dar 100 o un
nmero muy prximo, si ha habido redondeos.
_ Las frecuencia acumuladas (S f Sn) que se obtienen sumando la
frecuencia de cada modalidad a las frecuencias ya acumuladas
anteriormente. En la primera modalidad no hay nada acumulado de
antes y por tanto su frecuencia acumulada ser su misma
frecuencia.
La ltima modalidad tiene que dar una frecuencia acumulada igual
a N.
_ Las frecuencias relativas acumuladas y los porcentajes
acumulados se obtienen de forma similar
_ En las variables nominales las modalidades pueden ponerse en
el orden que se quiera, pero en las ordinales hay que respetar el
orden lgico.
Ejemplo:
Residencia Sanitaria S. S. de Ciudad Vieja, GuatemalaIngresos en
Pediatra. Marzo 1990
Seccinffr%ffr%
Neonatologa250.12512.5250.12512.5
Lactantes950.47547.51200.660
Preescolares800.400402001100
Total2001100
En la tabla definitiva no se presentan todos estos parmetros,
sino los ms adecuados en cada caso concreto. Casi siempre f y/o %.
Slo el porcentaje, sin que conste N, no es correcto. En este
ejemplo bastara con f y %.
VARIABLES CUANTITATIVAS
Los datos se agrupan segn la frecuencia de los valores. Es lo
que se denomina Distribucin de frecuencias. La forma de tabular
depende del n de datos.
----Si son pocos (la mayora de autores pone el tope en 30), se
hace una tabla simple de forma similar a lo visto para las
variables CL. Cada dato equivale a una modalidad. Al final nos
quedaremos con la f de cada nmero y si se prefiere tambin con el %.
Los nmeros se ordenan de menor a mayor o de mayor a menor. La tabla
puede hacerse en sentido vertical u horizontal.
Ejemplo: Si x = ( 4 , 1 , 7 , 2 , 2 , 9 , 7 , 2 , 2 , 9 , 7 , 1
, 4)
x12479
f24232
O bien,
xf
12
24
42
73
92
---Si son muchos se agrupan en clases, que son intervalos
sucesivos de valores. Los datos se asignan a la clase que les
corresponde y se cuentan los datos de cada clase, que est
representada por el punto medio o centro de clase (pm c).
Esta agrupacin es arbitraria con dos condiciones esenciales: que
las clases sean mutuamente excluyentes y que todos los datos puedan
se asignados a una clase. Ahora bien, la experiencia ha ido
introduciendo una serie de normas, que permiten hacer esta
agrupacin de la forma ms racional posible.
Yo recomendara los siguientes pasos:
1) calcular el RECORRIDO (R), (a veces mal llamado Rango)
= (lmite real superior del dato mayor lmite real inferior del
dato menor)O si se prefiere: = (valor tabulado mximo valor tabulado
mnimo) + 1
2) calcular el N DE CLASES (NC).
Es funcin de N (tamao de la muestra) y no hay reglas fijas.En
general: entre 4 y 20.Ayudas: NC = 1+ 3,32*logN 1+1,44*lnN
O la siguiente tabla: N 8 16 32 64 128 256
etc.------------------------------------------------NC 4 5 6 7 8 9
etc.
De entrada nos quedamos con 2 3 opciones
3) calcular la AMPLITUD de las clases INTERVALO (i) : i = R /
NCSi i no es nmero entero, se redondea al nmero entero superior
para que NC*i _ R y as queden englobados todos los datosComo
probamos con 2 3 opciones, conviene elegir una i que sea impar,
pues as el punto medio de la clase (pm c) tendr una cifra menos.En
principio todas las clases deben tener la misma amplitud.
4) Ver si hay SOBRAS, que son la diferencia entre NC*i y R. Se
reparten lo mejor posible entre ambos extremos de la distribucin
fijando as los lmites definitivos de la tabla.
5) Construir el esquema de la tabla, poniendo columnas de:
_ CLASES LMITES TABULADOS_ LIMITES REALES_ PUNTO MEDIO (pm c)_
FRECUENCIA ( f n)_ FRECUENCIA RELATIVA ( fr)_ PORCENTAJE (P o %)_
FRECUENCIAS ACUMULADAS ( _f _n)_ FRECUENCIAS RELATIVAS ACUMULADAS
(_fr)_ PORCENTAJES ACUMULADOS (_%)
6) Hacer el RECUENTO de datos y rellenar las casillas
correspondientes
7) Escribir la TABLA DEFINITIVA. Son obligadas las clases y la
frecuencia absoluta, pudiendo aadir otros parmetros, si se
considera que mejoran la informacin. Una tabla excesivamente
prolija resulta ms difcil de leer. Por tanto la norma es: poner
todo lo necesario, pero no ms de lo necesario.
Es recomendable probar con al menos 2 tablas y elegir la que
quede mejor
EJEMPLO 1:
Tabular los 70 valores siguientes:
DATOS ORIGINALES (N = 70)
40 55 19 51 62 15 20 44 60 60 45 15 21 31 13 44 41 43 51 35 50
33 25 16 6114 14 59 59 59 20 23 25 29 29 59 58 54 50 49 39 27 37 23
24 58 27 28 57 3232 34 57 56 35 35 54 36 43 46 52 50 49 42 43 46 40
39 31 48
PASOS DE LA TABULACION
-dato mayor: 62, cuyo LRS es 62,5
-dato menor: 13, cuyo LRI es 12,5
-recorrido (R): 62,5-12,5 = 50 (62-13)+1 = 50
-n de clases (NC): 7 u 8
-amplitud (i):-si NC = 7 , i = 50/7 = 7,1 8 (par)-si NC = 8 , i
= 50/8 = 6,2 7 (impar)
-nos quedamos pues con NC = 8 de amplitud 7, que es impar
-sobras: (8*7) 50 = 6 , que repartimos as: 3 abajo y 3
arriba
la 1 clase empezar en 10 (13-3) la ltima terminar con el 65
(62+3)
--ya se puede construir el esquema de la tabla (clases, LR y
punto medio) y proceder al recuento de los datos que corresponden a
cada clase, para completar las otras columnas
Clases(Lmites tabulados)
Lmites realespunto medio c
ffr%ffr%
10 169,5 16,51360,098,5760,098,57
17 2316,5 23,52060,098,57120,1717,1
24 3023,5 30,52780,1111,4200,2928,6
31 3730,5 37,534110,1615,7310,4444,3
38 4437,5 44,541110,1615,7420,6060,0
45 5144,5 51,548110,1615,7530,7675,7
52 5851,5 58,55590,1312,9620,8988,6
59 - 6558,5 65,56280,1111,4701,00100
Suma701,0199,94
***Esta no es la nica tabla posible, aunque probablemente sea la
mejor.Podramos hacerla con 7 clases de amplitud 8; sobras: 6.
Clases: 10 17; 18 25; ...; 58 - 65O bien 6 clases de amplitud 9.
Sobras: 4. Clases: 11- 19; 20 28; ...; 56 - 64o bien 10 clases de
amplitud 5 . Sin sobras. Clases: 13 22; 23 32 ; .... ; 53 - 62
El primer paso de cualquier estudio estadstico es recoger los
datos. Normalmente se suele llevar a cabo a travs de encuestas o
entrevistas, segn la poblacin a estudiar, su tamao, el tiempo de
que dispongamos,Una vez que tenemos los datos recogidos, pasamos a
hacer el recuento: contando el nmero de veces que aparece cada
valor de la variable a estudiar.
Ejemplo 2.- Preguntamos a 20 alumnos el nmero de miembros de su
familia, y sus respuestas fueron:3, 5, 4, 3, 5, 6, 8, 3, 3, 5, 7,
5, 6, 5, 4, 4, 7, 4, 5, 3
Miembros por familia
Frecuencia
35
44
56
62
72
81
Los valores de las variables estadsticas continuas se agrupan
por intervalos o clases. Adems, si la variable es discreta y toma
muchos valores, tambin se suele agrupar por intervalos o clases.El
valor medio de cada clase o intervalo se llama marca de clase y se
calcula como la semisuma de los extremos del intervalo.El recorrido
de la variable es la diferencia entre el valor ms grande y el ms
pequeo. La amplitud de cada intervalo se calcula dividiendo el
recorrido de la variable entre el nmero total de intervalos.
Ejemplo 3.- A los 100 empleados de una empresa de piezas de
precisin, se les ha realizado una prueba de habilidad manual. En
una escala de 0 a 100 se han obtenido las siguientes
puntuaciones:
27, 66, 32, 55, 46, 37, 75, 81, 18, 33, 47, 74, 37, 52, 47, 66,
80, 87, 37, 29,46, 15, 29, 90, 76, 67, 23, 35, 94, 23, 25, 56, 73,
78, 17, 28, 76, 58, 45, 36,55, 60, 17, 56, 23, 82, 64, 50, 51, 45,
37, 65, 62, 26, 69, 36, 54, 42, 40, 54,27, 62, 28, 65, 46, 92, 36,
33, 23, 66, 18, 82, 47, 49, 59, 45, 73, 43, 47, 83,78, 65, 39, 36,
53, 91, 38, 35, 68, 78, 91, 23, 34, 43, 55, 56, 74, 56, 62, 38.
Observamos que los valores extremos son 15 y 94. La amplitud
total entre los datos es de 80 puntos, ya que ambas puntuaciones
estn incluidas.
Agruparemos los datos en 8 intervalos de amplitud 10:
, , , . Realizando el recuento con atencin, se obtiene la tabla
que sigue:
Habilidad manualMarca de clase
Frecuencias
1910
2912
3917
4918
5913
6913
7911
896
Para construir una tabla estadstica completa tenemos que
calcular:
Frecuencia absoluta () de cada valor : es el nmero total de
veces que aparece el dato .
Frecuencia absoluta acumulada () de cada valor : es la suma de
todas las frecuencias absolutas correspondientes a los valores
anteriores a y a la suya propia. No tiene sentido para variables
cualitativas.
Frecuencia relativa (fr) de cada valor : se calcula dividiendo
la frecuencia absoluta correspondiente entre el nmero total de
datos N.
Frecuencia relativa acumulada () de cada valor : es la suma de
todas las frecuencias relativas correspondientes a los valores
anteriores a y a la suya propia. No tiene sentido para variables
cualitativas.
Ejemplo 4.- Preguntamos a 20 alumnos el nmero de miembros de su
familia, y sus respuestas fueron:3, 5, 4, 3, 5, 6, 8, 3, 3, 5, 7,
5, 6, 5, 4, 4, 7, 4, 5, 3
Miembros por familia
Frecuenciaabsoluta
Frecuencia absolutaacumulada
Frecuenciarelativa
Frecuencia relativaacumulada
3550,250,25
4490,20,45
56150,30,75
62170,10,85
72190,10,95
81200,051
4. PRESENTACION DE DATOS ESTADISTICOS:
TRABAJO DE INVESTIGACION
5. MEDIDAS DE TENDENCIA CENTRAL:
MEDIDAS DESCRIPTIVAS
Las medidas descriptivas son valores numricos calculados a
partir de la muestra y que nos resumen la informacin contenida en
ella
MEDIDAS POSICION
Los cuantiles son valores de la distribucin que la dividen en
partes iguales, es decir, en intervalos, que comprenden el mismo
nmero de valores. Los ms usados son los cuartiles, los deciles y
los percentiles.PERCENTILES: son 99 valores que dividen en cien
partes iguales el conjunto de datos ordenados. Ejemplo, el
percentil de orden 15 deja por debajo al 15% de las observaciones,
y por encima queda el 85%CUARTILES: son los tres valores que
dividen al conjunto de datos ordenados en cuatro partes iguales,
son un caso particular de los percentiles:- El primer cuartil Q 1
es el menor valor que es mayor que una cuarta parte de los datos-
El segundo cuartil Q 2 (la mediana), es el menor valor que es mayor
que la mitad de los datos- El tercer cuartil Q 3 es el menor valor
que es mayor que tres cuartas partes de los datos
DECILES: son los nueve valores que dividen al conjunto de datos
ordenados en diez partes iguales, son tambin un caso particular de
los percentiles. Ejemplo: Dada la siguiente distribucin en el nmero
de hijos (Xi) de cien familias, calcular sus cuartiles. xiniNi
01414
11024
21539
32665
42085
515100
n=100
Solucin: 1. Primer cuartil:
2. Segundo cuartil:
3. Tercer cuartil:
MEDIDAS DE TENDENCIA CENTRAL Nos dan un centro de la distribucin
de frecuencias, es un valor que se puede tomar como representativo
de todos los datos. Hay diferentes modos para definir el "centro"
de las observaciones en un conjunto de datos. Por orden de
importancia, son:MEDIA : (media aritmtica o simplemente media). es
el promedio aritmtico de las observaciones, es decir, el cociente
entre la suma de todos los datos y el numero de ellos. Si xi es el
valor de la variable y ni su frecuencia, tenemos que:
Si los datos estn agrupados utilizamos las marcas de clase, es
decir ci en vez de xi.MEDIANA (Me):es el valor que separa por la
mitad las observaciones ordenadas de menor a mayor, de tal forma
que el 50% de estas son menores que la mediana y el otro 50% son
mayores. Si el nmero de datos es impar la mediana ser el valor
central, si es par tomaremos como mediana la media aritmtica de los
dos valores centrales.
MODA (M0): es el valor de la variable que ms veces se repite, es
decir, aquella cuya frecuencia absoluta es mayor. No tiene porque
ser nica.
MEDIDAS DE DISPERSION O ASIMETRIA Las medidas de tendencia
central tienen como objetivo el sintetizar los datos en un valor
representativo, las medidas de dispersin nos dicen hasta que punto
estas medidas de tendencia central son representativas como sntesis
de la informacin. Las medidas de dispersin cuantifican la
separacin, la dispersin, la variabilidad de los valores de la
distribucin respecto al valor central. Distinguimos entre medidas
de dispersin absolutas, que no son comparables entre diferentes
muestras y las relativas que nos permitirn comparar varias
muestras.MEDIDAS DE DISPERSIN ABSOLUTASVARIANZA ( s2 ): es el
promedio del cuadrado de las distancias entre cada observacin y la
media aritmtica del conjunto de observaciones. Haciendo operaciones
en la frmula anterior obtenemos otra frmula para calcular la
varianza:
Si los datos estn agrupados utilizamos las marcas de clase en
lugar de Xi.DESVIACIN TPICA (S): La varianza viene dada por las
mismas unidades que la variable pero al cuadrado, para evitar este
problema podemos usar como medida de dispersin la desviacin tpica
que se define como la raz cuadrada positiva de la varianza
Para estimar la desviacin tpica de una poblacin a partir de los
datos de una muestra se utiliza la frmula (cuasi desviacin
tpica):
RECORRIDO O RANGO MUESTRAL (Re). Es la diferencia entre el valor
de las observaciones mayor y el menor. Re = xmax - xminMEDIDAS DE
DISPERSIN RELATIVASCOEFICIENTE DE VARIACIN DE PEARSON: Cuando se
quiere comparar el grado de dispersin de dos distribuciones que no
vienen dadas en las mismas unidades o que las medias no son iguales
se utiliza el coeficiente de variacin de Pearson que se define como
el cociente entre la desviacin tpica y el valor absoluto de la
media aritmtica
CV representa el nmero de veces que la desviacin tpica contiene
a la media aritmtica y por lo tanto cuanto mayor es CV mayor es la
dispersin y menor la representatividad de la media.MEDIDAS DE FORMA
Comparan la forma que tiene la representacin grfica, bien sea el
histograma o el diagrama de barras de la distribucin, con la
distribucin normal.MEDIDA DE ASIMETRADiremos que una distribucin es
simtrica cuando su mediana, su moda y su media aritmtica
coinciden.Diremos que una distribucin es asimtrica a la derecha si
las frecuencias (absolutas o relativas) descienden ms lentamente
por la derecha que por la izquierda. Si las frecuencias descienden
ms lentamente por la izquierda que por la derecha diremos que la
distribucin es asimtrica a la izquierda. Existen varias medidas de
la asimetra de una distribucin de frecuencias. Una de ellas es el
Coeficiente de Asimetra de Pearson:
Su valor es cero cuando la distribucin es simtrica, positivo
cuando existe asimetra a la derecha y negativo cuando existe
asimetra a la izquierda.MEDIDA DE APUNTAMIENTO O CURTOSIS Miden la
mayor o menor cantidad de datos que se agrupan en torno a la moda.
Se definen 3 tipos de distribuciones segn su grado de curtosis:
Distribucin mesocrtica: presenta un grado de concentracin medio
alrededor de los valores centrales de la variable (el mismo que
presenta una distribucin normal). Distribucin leptocrtica: presenta
un elevado grado de concentracin alrededor de los valores centrales
de la variable. Distribucin platicrtica: presenta un reducido grado
de concentracin alrededor de los valores centrales de la
variable.
EJEMPLO 1
El nmero de dis necesarios por 10 equipos de trabajadores para
terminar 10 instalaciones de iguales caractersticas han sido: 21,
32, 15, 59, 60, 61, 64, 60, 71, y 80 das. Calcular la media,
mediana, moda, varianza y desviacin tpica. SOLUCIN: La media: suma
de todos los valores de una variable dividida entre el nmero total
de datos de los que se dispone:
La mediana: es el valor que deja a la mitad de los datos por
encima de dicho valor y a la otra mitad por debajo. Si ordenamos
los datos de mayor a menor observamos la secuencia:15, 21, 32, 59,
60, 60,61, 64, 71, 80.Como quiera que en este ejemplo el nmero de
observaciones es par (10 individuos), los dos valores que se
encuentran en el medio son 60 y 60. Si realizamos el clculo de la
media de estos dos valores nos dar a su vez 60, que es el valor de
la mediana.La moda: el valor de la variable que presenta una mayor
frecuencia es 60La varianza S2: Es la media de los cuadrados de las
diferencias entre cada valor de la variable y la media aritmtica de
la distribucin.
Sx2=
La desviacin tpica S: es la raz cuadrada de la varianza.
S = 427,61 = 20.67El rango: diferencia entre el valor de las
observaciones mayor y el menor80 - 15 = 65 dasEl coeficiente de
variacin: cociente entre la desviacin tpica y el valor absoluto de
la media aritmticaCV = 20,67/52,3 = 0,39COVARIANZA
La covarianza de una variable bidimensional es la media
aritmtica de los productos de las desviaciones de cada una de las
variables respecto a sus medias respectivas.La covarianza se
representa por sxy o xy.
La covarianza indica el sentido de la correlacin entre las
variablesSi xy > 0 la correlacin es directa.Si xy < 0 la
correlacin es inversa.La covarianza presenta como inconveniente, el
hecho de que su valor depende de la escala elegida para los ejes.Es
decir, la covarianza variar si expresamos la altura en metros o en
centmetros. Tambin variar si el dinero lo expresamos en euros o en
dlares.EjemplosLas notas de 12 alumnos de una clase en Matemticas y
Fsica son las siguientes:Matemticas23445667781010
Fsica1324446467910
Hallar la covarianza de la distribucin.xiyixi yi
212
339
428
4416
5420
6424
6636
7428
7642
8756
10990
1010100
7260431
Despus de tabular los datos hallamos las medias aritmticas:
Los valores de dos variables X e Y se distribuyen segn la tabla
siguiente:Y/X024
1213
2142
3250
Hallar la covarianza de la distribucin.En primer lugar
convertimos la tabla de doble entrada en tabla simple y calculamos
las medias aritmticas.xiyifixi fiyi fixi yi fi
012020
021020
032060
211212
2248816
235101530
41312312
4228416
20404176
CORRELACION
La correlacin trata de establecer la relacin o dependencia que
existe entre las dos variables que intervienen en una distribucin
bidimensional.Es decir, determinar si los cambios en una de las
variables influyen en los cambios de la otra. En caso de que
suceda, diremos que las variables estn correlacionadas o que hay
correlacin entre ellas.
Tipos de correlacin1 Correlacin directaLa correlacin directa se
da cuando al aumentar una de las variables la otra aumenta.La recta
correspondiente a la nube de puntos de la distribucin es una recta
creciente.
2 Correlacin inversaLa correlacin inversa se da cuando al
aumentar una de las variables la otra disminuye. La recta
correspondiente a la nube de puntos de la distribucin es una recta
decreciente.
3 Correlacin nulaLa correlacin nula se da cuando no hay
dependencia de ningn tipo entre las variables.En este caso se dice
que las variables son incorreladas y la nube de puntos tiene una
forma redondeada.
Grado de correlacinEl grado de correlacin indica la proximidad
que hay entre los puntos de la nube de puntos. Se pueden dar tres
tipos:1. Correlacin fuerteLa correlacin ser fuerte cuanto ms cerca
estn los puntos de la recta.
2. Correlacin dbilLa correlacin ser dbil cuanto ms separados
estn los puntos de la recta.
3. Correlacin nula
COEFICIENTE DE CORRELACION LINEAL
El coeficiente de correlacin lineal es el cociente entre la
covarianza y el producto de las desviaciones tpicas de ambas
variables.El coeficiente de correlacin lineal se expresa mediante
la letra r.
Propiedades del coeficiente de correlacin1. El coeficiente de
correlacin no vara al hacerlo la escala de medicin. Es decir, si
expresamos la altura en metros o en centmetros el coeficiente de
correlacin no vara.2. El signo del coeficiente de correlacin es el
mismo que el de la covarianza.Si la covarianza es positiva, la
correlacin es directa.Si la covarianza es negativa, la correlacin
es inversa.Si la covarianza es nula, no existe correlacin.3. El
coeficiente de correlacin lineal es un nmero real comprendido entre
1 y 1.1 r 14. Si el coeficiente de correlacin lineal toma valores
cercanos a 1 la correlacin es fuerte e inversa, y ser tanto ms
fuerte cuanto ms se aproxime r a 1.5. Si el coeficiente de
correlacin lineal toma valores cercanos a 1 la correlacin es fuerte
y directa, y ser tanto ms fuerte cuanto ms se aproxime r a 1.6. Si
el coeficiente de correlacin lineal toma valores cercanos a 0, la
correlacin es dbil.7. Si r = 1 1, los puntos de la nube estn sobre
la recta creciente o decreciente. Entre ambas variables hay
dependencia funcional.
EjemplosLas notas de 12 alumnos de una clase en Matemticas y
Fsica son las siguientes:Matemticas23445667781010
Fsica1324446467910
Hallar el coeficiente de correlacin de la distribucin e
interpretarlo.xiyixi yixi2yi2
21241
33999
428164
44161616
54202516
64243616
66363636
74284916
76424936
87566449
1099010081
1010100100100
7260431504380
1 Hallamos las medias aritmticas.
2 Calculamos la covarianza.
3 Calculamos las desviaciones tpicas.
4 Aplicamos la frmula del coeficiente de correlacin lineal.
Al ser el coeficiente de correlacin positivo, la correlacin es
directa. Como coeficiente de correlacin est muy prximo a 1 la
correlacin es muy fuerte.
Los valores de dos variables X e Y se distribuyen segn la tabla
siguiente:Y/X024
1213
2142
3250
Determinar el coeficiente de correlacin.Convertimos la tabla de
doble entrada en tabla simple.xiyifixi fixi2 fiyi fiyi2 fixi yi
fi
01200220
02100240
032006180
21124112
22481681616
2351020154530
41312483312
4228324816
2040120419776
Al ser el coeficiente de correlacin negativo, la correlacin es
inversa. Como coeficiente de correlacin est muy prximo a 0 la
correlacin es muy dbil.
coeficiente de PearsonEl ndice numrico ms comn usado para medir
una correlacin es el coeficiente de Pearson. El coeficiente de
Pearson (tambin llamado coeficiente de correlacin del
producto-momento), se representa con el smbolo r y proporciona una
medida numrica de la correlacin entre dos variables. Es til
reconocer la frmula usada para calcular el coeficiente de Pearson
(es posible que vea documentos en que se haga referencia a ella).
Le entregamos la frmula en una nota al pie de esta pgina. No deje
que la frmula lo intimide. No necesita comprender la frmula para
comprender el concepto de correlacin. Aunque si hace un esfuerzo va
a comprender la frmula en poco tiempo y con claridad. Recuerde que
al describir la relacin entre dos variables, necesitamos responder
al menos cuatro preguntas: (1) Estn relacionadas las variables
entre s? Si los cambios en el valor de una de las variables van
acompaados de cambios en el valor de la otra, las variables parecen
estar relacionadas. (2) Si las variables parecen estar
relacionadas, qu tan fuerte es la relacin entre las variables? En
otras palabras, estn estrechamente o slo levemente relacionadas?
(3) La relacin entre las variables es positiva o negativa? (4) Cul
es la relacin causal entre las variables? El coeficiente de Pearson
no entrega respuestas a tres de estas cuatro preguntas: (1) sobre
la pregunta uno, nos indica si dos variables parecen estar
correlacionadas o no; (2) con respecto a la pregunta dos, el
coeficiente de Pearson indica la fuerza de la aparente relacin; y
(3) el coeficiente, por ltimo, nos indica si la aparente relacin es
positiva o negativa. Como ya sabemos, el anlisis de correlacin no
puede responder a la ltima pregunta.
El coeficiente de correlacin de Pearson (r) se mide en una
escala de 0 a 1, tanto en direccin positiva como negativa. Un valor
de 0 indica que no hay relacin lineal entre las variables. Un valor
de 1 o 1 indica, respectivamente, una correlacin positiva perfecta
o negativa perfecta entre dos variables. Normalmente, el valor de
se ubicar en alguna parte entre 0 y 1 o entre 0 y 1. En las
ciencias sociales en general y en educacin en particular, donde la
mayora de las variables son simultneamente afectadas por una gran
multitud factores, una correlacin positiva de 0,7 o una correlacin
negativa de 0,7 se considera muy fuerte. (Por ltimo, tenga en mente
el coeficiente de Pearson mide slo relaciones lineales entre
variables, y no es til para medir relaciones que no son
lineales.)Cuadro 15. El coeficiente de Pearson de correlacin.Valor
delCoeficiente de PearsonGrado de Correlacinentre las Variables
r = 0Ninguna correlacin
r = 1Correlacin positiva perfecta
0 < r < 1Correlacin positiva
r = -1Correlacin negativa perfecta
-1 < r < 0Correlacin negativa
Ntese que una correlacin negativa no es menos fuerte que una
correlacin positiva. As, por ejemplo, un de 0,5 es tan grande o
fuerte como un de 0,5. Los signos positivos y negativos slo indican
si el valor de una variable aumenta o disminuye, respectivamente,
con el aumento en el valor de la otra variable. Como usted sabe,
cuando los aumentos (disminuciones) de una variable producen
aumentos (disminuciones) en la otra, la relacin es positiva. Es
negativa cuando los aumentos (disminuciones) de una variable
producen disminuciones (aumentos) en la otra.
Segn su opinin, las calificaciones profesionales de los maestros
estn correlacionadas en forma positiva o negativa con el
rendimiento de los estudiantes? Qu sucede con el tamao de la clase?
Y el gasto en educacin?