-
Glosario
A
Acumulada
(Frecuencia, proporcin o porcentaje) En toda distribucin de
frecuencia se puede obtener la
frecuencia acumulada (o proporcin acumulada o porcentaje
acumulado). Para obtener los
valores, simplemente hay que ir acumulando (sumando), desde la
categora de menor valor de la
variable a la de mayor valor, las frecuencias absolutas (ver
frecuencia absoluta), proporciones o
porcentajes, de cada categora de respuesta. Por ejemplo,
la frecuencia absoluta acumulada del grado "moderado" de
preocupacin por la situacin poltica es 108, resultado de
sumar las frecuencias de los grados anteriores (18 + 42 =
60) y la suya propia (60 + 48 = 108), indicando que 108
personas presentan una preocupacin moderada o menos
por las cuestiones polticas. Con el mismo procedimiento
se obtendran las proporciones y porcentajes acumulados.
Amplitud del
intervalo
Es la diferencia entre el lmite exacto superior y el lmite
exacto inferior, o entre el lmite
aparente superior y el lmite aparente inferior ms la unidad de
medida.
Amplitud
intercuartil
Es la diferencia entre el tercer cuartil (o percentil 75) y el
primer cuartil (o percentil 25) y
representa el rango de valores que contiene a la mitad central
de los datos (el 50%)
Amplitud o rango Es la diferencia entre el valor mximo y mnimo
del conjunto de datos
Amplitud semi-
intercuartil
Es la mitad de la diferencia entre el tercer cuartil (o
percentil 75) y el primer cuartil (o percentil 25)
y se utiliza para cuantificar la variabilidad de un conjunto de
datos medidos con escala ordinal o de
una distribucin de una variable cuantitativa marcadamente
asimtrica.
Anlisis de datos El Anlisis de datos en Psicologa es una
herramienta metodolgica necesaria, de carcter
fundamentalmente estadstico, para la investigacin en
Psicologa.
Anlisis
exploratorio de
datos
(AED) Es tanto una tcnica de anlisis de datos como una manera de
pensar que ensea a la
persona que investiga tendencias en los datos que no esperaba
encontrar. Entre las tcnicas de AED
destacan las tcnicas grficas (diagrama de tallo y hojas) que
permiten una rpida inspeccin de las
propiedades de la distribucin de los datos: posicin central,
variabilidad y forma. Tambin
dispone de ndices estadsticos resistentes a los datos extremos
de la distribucin, por lo que se les
suele denominar tambin estadsticos robustos.
Apuntamiento ver Curtosis
Asimetra Una distribucin asimtrica es una distribucin no
simtrica por lo que los datos se distribuyen de forma
desigual en los extremos de la distribucin. Cuando hay
muchos datos con valores bajos y pocos datos con
valores altos la distribucin es asimtrica positiva. Por
ejp, el n de horas de sueo diario de 0 a 40 aos. Por el
contrario, cuando hay pocos datos con valores bajos y
muchos datos con valores altos, la distribucin es
asimtrica negativa. Por ejlo, edad de fallecim> en los
pases desarrollados.
Para su clculo se dispone de varios ndices. Si el coeficiente de
asimetra es As0 la distribucin
es simtrica positiva.
AZAR Casualidad. Caso fortuito. Fenmeno que no sigue una regla,
un orden, una ley conocida. En
Estadstica se contrastan las probabilidades a favor de las
hiptesis del investigador en cuanto al
efecto de las variables independientes sobre las dependientes
contra la probabilidad de que los
resultados sean debidos al azar, a la pura casualidad.
BAREMO Tabla elaborada como regla para atribuir valor a las
puntuaciones individuales o de grupo. Las
puntuaciones del grupo inicial, una muestra que debe ser
representativa de la poblacin, sirven de
regla para interpretar las puntuaciones de otros sujetos o
grupos que renan las mismas
caractersticas. Es frecuente que a cada puntuacin individual del
grupo original se le asigne la
correspondiente trasformacin a puntuaciones como cuantiles
(cuartiles, deciles o percentiles),
puntuaciones tpicas, C.I., etc. En adelante, a cualquier
puntuacin de un nuevo sujeto se le
atribuye la correspondiente puntuacin (cuantil) del baremo.
-
C
Caja y bigotes La caja representa el 50% de las observaciones
centrales, es decir, las observaciones
comprendidas entre el percentil 25 (o primer cuartil) y el
percentil 75 (o tercer cuartil). La lnea
en el centro de la caja representa la mediana o percentil 50.
Los bigotes son lneas que se
extienden fuera de la caja hasta una distancia de 1,5 veces la
longitud de la caja de tal forma
que los datos que quedan fuera de estos bigotes corresponden a
las observaciones atpicas,
llamadas tambin "outliers".
Caracterstica Una caracterstica es una propiedad de los
individuos de una poblacin. Uno de los objetivos
de la investigacin psicolgica es determinar las propiedades de
una determinada poblacin,
propiedades que estarn presentes en todos y cada uno de los
individuos que la conforman. Sin
embargo, aunque todos los elementos tengan esa propiedad no
todos la tienen en el mismo
grado. Por ejemplo, una propiedad de los mamferos es el sexo,
que presenta dos alternativas:
macho y hembra; una propiedad de los seres humanos es el estado
civil, con sus diferentes
alternativas: soltero, casado, separado, viudo, etc.; otra puede
ser las creencias religiosas:
cristianos, mahometanos, budistas... agnsticos o ateos. En estos
ejemplos se ve que las
propiedades de los individuos de una poblacin pueden adoptar
diversas variedades. En trminos
estadsticos, a la propiedad de los individuos de una poblacin se
le denomina caracterstica,
mientras que a las diferentes variedades de esa caracterstica se
le denomina modalidad.
Causalidad El coeficiente de correlacin no permite por tanto una
interpretacin en trminos de causa-
efecto. Si se obtiene un valor alto y positivo, indica que
cuando una de las variables aumenta
su valor en la escala, la otra, en promedio, tambin lo hace,
mientras que cuando el valor es
bajo y negativo indica justamente lo contrario, es decir, que
cuando una de las variables
aumenta de valor, la otra, en promedio, disminuye. Por ltimo,
los valores prximos a cero
indican ausencia de relacin, o lo que es lo mismo que cuando una
de las variables va
aumentando de valor, la otra, en promedio, a veces aumenta y a
veces disminuye. En ningn
caso se debe caer en el error de pensar que una variable es
causa de la otra. A partir de una simple estudio correlacional, es
imprudente establecer ese nexo de causalidad sin acudir a un
enfoque experimental que pudiera determinar sin en verdad existe
dicho nexo de causalidad o
no. Incluso en estudios de variables en que se pueda llegar a
pensar que una es causa de la otra,
como, por ejemplo, la relacin que pueda darse en los alumnos de
secundaria entre la ansiedad
ante una prueba de conocimientos de estadstica y el rendimiento
en dicha prueba. Se podra
pensar que un alto grado de ansiedad determina el mal
rendimiento en la prueba, y que un bajo
nivel determina un alto rendimiento. Quiere esto decir que la
ansiedad es la causa del
rendimiento en esa prueba? Pero tambin podra ser que la prueba
de conocimientos de
estadstica provoca una reaccin de ansiedad, de tal modo que los
alumnos poco preparados
reaccionan con un aumento de la ansiedad mientras que los
mejores preparados se manejan con
cierta tranquilidad en dicha prueba.
Chi-cuadrado
(prueba)
Prueba estadstica para determinar, a partir de los datos
recogidos en una muestra, si dos
variables cualitativas estn relacionadas.
Chi-square
(distribucin)
Trmino que se refiere a una distribucin de probabilidad de una
variable continua
Coeficiente chi-
cuadrado
Es un ndice para determinar, a partir de los datos recogidos en
una muestra, si dos variables
cualitativas estn relacionadas. De este ndice se derivan el
coeficiente de contigencia y el
coeficiente fi.
Coeficiente de
contingencia
Es un ndice de la relacin entre dos variables cualitativas y
que, al igual que el coeficiente fi,
deriva de Chi cuadrado. Su expresin es la siguiente: Tericamente
toma valores
comprendidos entre 0 y 1, aunque no siempre alcanza el valor 1,
incluso cuando las variables
estn completamente asociadas. En tablas cuadradas, cuando ambas
variables tienen el mismo
nmero de categoras (es decir, I = J), su mximo valor es
-
Coeficiente de
correlacin
Es un ndice numrico que representa la intensidad con que dos
variables se relacionan. Si dos
variables son independientes, es decir, si no existe relacin
entre ellas, el coeficiente de
correlacin es cero. Dosvariables, X e Y, estn relacionadas
cuando cambios en una variable
producecambios en la otra variable. Si se observa que cuando
aumentan los valores en una
variable tambin aumentan o disminuyen-, en promedio, los valores
en la otra, se puede sospechar que hay correlacin entre ellas. Para
cuantificar la intensidad de la relacin entre dos
variables se dispone de distintos ndices de correlacin
dependiendo de la naturaleza de las
variables. El siguiente cuadro es un resumen de los ndices que
se estudiarn:
Variable Variable Coeficiente
Cualitativa Cualitativa Correlacin Fi
chi-cuadrado
Coeficiente de contingencia
Cualitativa dicotmica Cuantitativa Correlacin
Biserial-puntual
Cuantitativa Cuantitativa Correlacin de Pearson
Ordinal Ordinal Correlacin de Spearman.
Coeficiente de
correlacin de
Pearson
Un inconveniente de la covarianza, como medida de variacin
conjunta o relacin entre dos
variables es que depende de las unidades de medida en que se
expresen las variables de inters
y que no tiene un valor mximo y mnimo, lo que dificulta
enormemente su interpretacin. Por
ello, se acude al coeficiente de correlacin de Pearson que es la
covarianza entre dos variables,
X e Y,calculada a partir de sus puntuaciones tpicas.Es decir:
rxy = cov(zx,zy)
Se representa con la letra r y el subndice xy, (rxy), para
representar la relacin lineal entre dos
variables X e Y. Indica la relacin lineal entre dos variables
cuantitativas y es un nmero sin
unidad de medida comprendido entre -1 y +1. Un valor de 0 indica
que no existe relacin lineal
entre las dos variables. Los valores positivos indican que
valores altos de X se asocian con
valores altos de Y, y valores de r negativos indican que valores
altos de X se asocian con
valores bajos de Y. Existen diferentes expresiones para obtener
la correlacin entre dos
variables cuantitativas segn el tipo de puntuaciones que estemos
empleando. (Ver puntuacin
directa, puntuacin diferencial o puntuacin tpica).
Datos con coeficiente de correlacin prxima a +1.
Datos con coeficiente de correlacin prxima a -1. Datos con
coeficiente de correlacin prximo a 0.
Coeficiente de
determinacin
Es el coeficiente de correlacin de Pearson al cuadrado y toma
cualquier valor positivo
comprendido entre 0 y 1. Se interpreta como proporcin de
varianza explicada, es decir, de
toda la variabilidad de la variable Y una determinada proporcin
se debe a la variabilidad de la
variable X.Por ejemplo, imagine que entre las variables, X:
puntuacin en un test de habilidad
numrica e Y: nota en esta asignatura existe una correlacin de
0,7. Entonces el coeficiente de
determinacin vale 0,49 que significa que el 49% de la
variabilidad de las notas obtenidas por
todos los alumnos en la asignatura, es explicada o se debe- a la
habilidad numrica. El 51% restante de la variabilidad de las notas
se deber a otras variables no incluidas en la regresin
(por ejemplo, la motivacin, el esfuerzo, el tiempo dedicado al
estudio, etc.)Con otras palabras,
indica el grado en que una variable es capaz de predecir otra
con la que est relacionada.
-
Coeficiente de
variacin
Es un ndice de variabilidad especialmente til para comparar
variabilidades de caractersticas
de diferente naturaleza, o de la misma naturaleza en diferentes
grupos y es igual al cociente
entre la desviacin tpica y la media. El resultado de este
cociente es un nmero abstracto que
indica el nmero de veces que el numerador (la desviacin tpica)
contiene al denominador (la
media), con independencia de la unidad en que haya sido medida
la variable. A este ndice as
obtenido se le denomina coeficiente de variacin o coeficiente de
variabilidad relativa y se
expresa as:
Combinatoria Es una rama de las matemticas que estudia las
diferentes formas de agrupamiento y
combinacin de un conjunto de elementos y establece las
propiedades y leyes de formacin de
las agrupamientos resultantes. Conocer estas diferentes formas
de agrupamiento nos permitir dar respuesta a preguntas como las
siguientes: De cuantas formas distintas pueden sentarse tres nios y
dos nias en la primera fila
de una clase?.Con un banco de 100 preguntas tipo test cuntas
pruebas diferentes de 25 preguntas puedo construir?,
o de cuntas formas diferentes se pueden asignar cinco empleados
de un comercio a tres secciones distintas?
Conocimiento cientfico Es el conocimiento adquirido utilizando
el mtodo cientfico.
Constante En contraste con la definicin ofrecida de variable,
cuando una caracterstica presenta una sola
modalidad, o cuando los objetos presentan la misma magnitud de
una determinada
caracterstica, decimos que se trata de una constante, y los
objetos o entidades estudiadas
tendrn todos el mismo valor numrico.
CONTRASTE DE
HIPTESIS
Proceso sistemtico que concluye tomando una decisin sobre la
hiptesis nula (H0): rechazo o
no rechazo, con la consiguiente aceptacin o no de la hiptesis
alternativa (H1) asumiendo un
riesgo de error tipo I = a .
CONTROL
El mtodo cientfico pretende establecer relaciones causales entre
las variables relacionadas en
su hiptesis. Lograr una meta tan elevada como este exige del
investigador el dominio de la
situacin, de forma que, teniendo bajo su dominio la variable
independiente, controle el
conjunto de circunstancias, hechos, personas que, adems de dicha
variable, puedan influir en la dependiente. Si no fuera as, quedara
la duda de si la relacin encontrada se debe a la
variable independiente, a alguna de esas otras variables
convertidas en extraas, esto es, en hiptesis rivales a la suya- o
la la interaccin entre unas y otras.
CORRELACIN
Entendemos por correlacin la relacin existente entre dos o ms
variables. La correlacin
puede ser perfecta, positiva o negativa (valor de 1), nula
(valor de 0), o imperfecta, que
incluye toda la gama de valores que van de 0 a 1, tanto
positivos como negativos. La
correlacin es positiva cuando los valores de las variables
aumentan o disminuyen en la misma
direccin, y negativa en caso contrario. El ndice de correlacin
coeficiente de correlacin- ms conocido es el de Pearson,
representado por rxy.
Correlacin biserial-
puntual
Es el coeficiente de correlacin que se aplica cuando se trata de
cuantificar la relacin que
existe entre una variable dicotmica por esencia (p.e., sexo), o
dicotomizada por conveniencia
con otra variable cuantitativa. Su expresin es la siguiente:
donde: es la media de las
puntuaciones de la variable cuantitativa X cuando la variable
dicotmica (o dicotomizada) Y
tiene valor 1. es la media de las puntuaciones de la variable
cuantitativa X cuando la variable
dicotmica (o dicotomizada) Y tiene valor 0. SX es la desviacin
tpica de la variable
cuantitativa X. p es la proporcin de observaciones cuyo valor en
Y es 1. q es la proporcin de
observaciones cuyo valor en Y es 0. El rango en valor absoluto
que se puede obtener con el
coeficiente de correlacin biserial puntual est entre 0, cuando
las medias de la variable
cuantitativa para cada categora de la variable cualitativa son
iguales hasta 1. El signo en este
ndice depender de cul de las dos medias se siten en el numerador
de la expresin. Si la
media de X cuando Y=1 es mayor que la media de X cuando Y=0,
entonces la correlacin
saldr positiva indicando relacin directa entre la variable X y
el valor 1 de Y. Por el contrario,
si la media de X cuando Y=1 es menor que la media de X cuando
Y=0, entonces la correlacin
saldr negativa indicando relacin directa entre la variable X y
el valor 0 de Y.
Correlacin de
Spearman
Cuando queremos analizar la relacin entre variables ordinales,
se aplica el coeficiente de
correlacin de rangos de Spearman. Para ello, se asignan rangos u
rdenes a cada valor de la
variable y se calcula el cuadrado de las diferencias (di) de
rangos entre las dos variables. Se
suman estos cuadrados, , y por ltimo se obtiene el coeficiente
con la siguiente expresin: donde
n es el tamao de la muestra o nmero total de observaciones. Los
valores del coeficiente de
correlacin de Spearman oscilan entre -1, cuando hay una perfecta
relacin inversa entre los
rdenes de las dos variables, 0, cuando no hay relacin entre
ambas variables, y +1, cuando hay
una relacin perfecta directa entre las rdenes de ambas
variables.
-
Correlacin espuria Cuando se observa un coeficiente de
correlacin lineal alto entre dos variables, lo nico que se
puede concluir es que estn relacionados entre s, pero no siempre
se puede establecer un nexo
de causalidad de una variable respecto de otra. Hay muchas
variables que presentan una alta
correlacin entre s, pero ello se debe a la presencia de una
tercera variable que tiene una fuerte
relacin entre ellas. Este tipo de correlaciones se denominan
correlaciones espurias. Hay
muchos casos que ilustran este tipo de correlaciones, por
ejemplo, la alta correlacin que se da
entre el nmero de matrimonios celebrados y la temperatura media
mensual. En ningn caso se
debe caer en el error de pensar que una variable es causa de la
otra, el sentido comn nos lleva a pensar que la relacin es
meramente fortuita o producida por alguna otra variable que
no hemos contemplado y que pudiera estar relacionada con las dos
variables que presentan una
alta correlacin entre s (la mayor parte de las parejas suelen
aprovechar los periodos veraniegos para contraer matrimonio, y son
precisamente esos perodos en los que la temperatura es mayor).
Correlacin phi El coeficiente de correlacin fi (o phi) es vlido
para establecer la asociacin existente entre dos
variables cualitativas con cualquier n de categoras de las
variables. Su expresin es: El valor
mnimo de este ndice es 0, que se obtiene cuando el valor de Chi
cuadrado es cero. En cuanto al
valor mximo, el ndice phi puede alcanzar valores mayores a 1
cuando el valor de chi cuadrado
sea superior al n de observaciones de la muestra. Hay, sin
embargo, un tipo de variables
cualitativas, las denominadas variables dicotmicas, que slo
tienen dos categoras posibles
(sexo, x ej). Para este tipo de variables, el coeficiente de
correlacin puede ser tambin el siguien:
Con variables dicotmicas el coeficiente phi slo puede obtener
valores absolutos entre 0 y 1, y
adems ser positivo o negativo dependiendo de cual de los
productos del numerador sea mayor.
Por ello, para su interpretacin hay que considerar la
distribucin de las frecuencias en la tabla.
Covarianza ndice que evala el grado con que dos variables
cuantitativas
varan conjuntamente. Puede tomar cualquier valor positivo o
negativo. Un valor positivo indica que aumentos en una variable
se
corresponden con aumentos en la otra. Un valor negativo indica
que aumentos en una variable
se corresponden con decrementos o disminuciones en la otra. Si
las dos variables son
independientes, la covarianza es cero. Cuando se dice que una
variable aumenta o disminuye
en promedio, se quiere resaltar que lo que va aumentando o
disminuyendo son las medias de
una variable condicionada a los valores de la otra, mas que los
valores concretos en s. (Ver
Media condicionada). Se obtiene calculando la media de los
productos de las desviaciones
respecto a la media de las dos series de puntuaciones.
Cuartil Los cuartiles son las puntuaciones que dividen la
distribucin en cuatro partes iguales con el
25% de los datos en cada una de ellas. Hay, por tanto, tres
cuartiles: el primer cuartil
corresponde con el percentil 25 y deja por debajo el 25% de los
datos. El segundo cuartil
corresponde con el percentil 50 y la mediana y el tercer cuartil
corresponde con el percentil 75.
Entre dos cuartiles consecutivos se encuentra el 25% de los
datos.
Cuasi-varianza Es un ndice de variabilidad que se obtiene
sumando los cuadrados de las
diferencias de todas las puntuaciones respecto a la media y
dividiendo entre (n-
1). Su utilidad estriba en que es el mejor estimador de la
varianza poblacional,
frente a la varianza de la muestra que estima con error la
varianza de la
poblacin. Por esta razn, se la conoce tambien con el nombre de
varianza insesgada. Cuando
las muestras son grandes la varianza y la cuasi-varianza
prctica> coinciden ya que apenas se
producen diferencias al dividir la suma de los cuadrados de las
desviaciones entre n o entre n-1.
Curtosis Se refiere al grado de apuntamiento de la distribucin
de
frecuencias. Cuando es muy apuntada, se dice que es
leptocrtica, si es muy aplastada, se dice que es
platicrtica.
Un grado intermedio entre estos grados de apuntamiento es
la distribucin mesocrtica, que es la distribucin normal o
de referencia para establecer el grado de apuntamiento.
CURVA NORMAL
(DE
PROBABILIDADES)
Se trata del modelo estadstico al que tienden con ms frecuencia
los datos empricos. Cuando
estos se acomodan razonablemente al modelo, podemos aplicarles
sus propiedades. Las
caractersticas fundamentales de la curva normal de
probabilidades son: a) Tener como valor
mximo el de la ordenada de la media b) Ser simtrica con respecto
a la ordenada de la media.
c) Presentar dos puntos de inflexin, uno para el valor de la
Media ms una desviacin tpica
(media + s) y otro para la Media menos una desviacin tpica
(media s) d) La curva es asinttica con respecto al eje de abscisas:
por mucho que se prolongue a derecha e izq nunca
llega a cortarlo. Por ello, nunca encontraremos una probabilidad
= 1, que sera un suceso seguro.
-
D
Decil Los deciles son las puntuaciones que dividen la
distribucin en diez partes iguales con el
10% de los datos en cada una de ellas.
Desviacin media Es la media de las diferencias en valor absoluto
de n puntuaciones
respecto de su media aritmtica. Es decir, dadas las puntuaciones
X1,
X2, ..., Xn, su desviacin media, DM, es
El hecho de que en este ndice se tomen las diferencias en
valor
absoluto de cada puntuacin respecto de la media aritmtica, se
deriva
de la primera propiedad de este ndice de tendencia central.
Desviacin tpica Es la raz cuadrada positiva de la varianza. Es
un ndice de variabilidad
o dispersin de un conjunto de datos respecto a la media.
Medida de dispersin o variabilidad. Estadsticamente es la
raz
cuadrada de la media de la suma de las desviaciones individuales
de un
grupo de sujetos, elevadas al cuadrado, con respecto a la media
aritmtica de un grupo. La
varianza es un ndice del grado en que las puntuaciones
individuales se agrupan ms o menos
en torno a la media del grupo; si todas las puntuaciones
individuales coincidieran con la
media, la varianza sera 0; cuanto ms se aparten de ella, mayor
valor alcanzar la varianza.
Esta medida es muy importante en la Estadstica inferencial ya
que se utiliza en las pruebas
de contraste de hiptesis.
Diagrama de rbol Representacin grfica que permite dibujar y
calcular el nmero de elementos del espacio
muestral de un experimento aleatorio.
DIAGRAMA DE
BARRAS
Representacin grfica especialmente adecuada a variables
cualitativas; las barras, situadas
unas a continuacin de otras, tienen como base las diferentes
categoras y como altura su
frecuencia.
DIAGRAMA DE
CAJA
Representacin grfica especialmente relevante por la gran
cantidad de informacin que
ofrece sobre un conjunto de puntuaciones originales. En concreto
nos informa sobre: a) Las
puntuaciones extremas b) La Mediana, igual al Q2 o cuartil 2 c)
El recorrido intercuartlico:
Q1 a Q3. d) La informacin contenida sobre este valor en el
rectngulo central: en l
podemos apreciar si se da equilibrio o no entre los diferentes
cuartile. e) En ocasiones puede
informarnos sobre las puntuaciones fuera de rango.
Diagrama de
dispersin
Es una alternativa a los diagramas tridimensionales para
representar grficamente dos variables cuantitativas medidas
conjunta>. Se llama tambin "nube de puntos" y es la
representacin grfica de dos variables en la que cada punto
representa una determinado dato definido por unas
coordenadas
que corresponden a los valores de esa observacin en la variable
X
e Y. En el eje horiz se sita los valores de la V independiente y
en
el eje vertical los de la V dependiente. Este tipo de grfico
es
especialmente til en el anlisis de correlacin y regresin.
Se trata de la representacin grfica de los pares de valores de
un grupo de sujetos en dos
variables. El diagrama nos ilustra de la existencia o no de
correlacin, de la intensidad y del
tipo (positiva o negativa). Sobre un eje de coordenadas se van
marcando los puntos en que se
cruzan los valores de la variable X y de la variable Y.
Diagrama de Tallo y
Hojas
Es un tipo de representacin
grfica muy utilizada dentro
del Anlisis Exploratorio de
datos y muy relacionado con
el histograma con la ventaja
de aportar ms informacin
donde los tallos se
representan en el eje vertical
y corresponden a la amplitud
de los intervalos del
histograma y las hojas a la
frecuencia.
-
Diagrama
tridimensional
Permite representar grficamente la distribucin conjunta de
frecuencias absolutas (o de
proporciones) de dos variables y es til cuando el nmero de
valores o categoras de cada
variable no es muy elevado. En caso contrario el nmero de barras
(o rectngulos, segn el
caso) que puede resultar hara poco informativo el diagrama y las
barras quedaran ocultas unas
detrs de otras. Lo mismo sucede con las variables cuantitativas
continuas cuando se quiere
representar mediante una histograma tridimensional sin agrupar
los datos en intervalos. Una
alternativa a los diagramas tridimensionales para representar
grficamente dos variables
cuantitativas medidas conjunta> es el denominado diagrama de
dispersin o nube de puntos.
DISEO
EXPERIMENTAL
Sin entrar ahora en el segundo objetivo control de la varianza-
el diseo en cuanto plan,
estructura y estrategia nos permite poner a prueba, en
condiciones rigurosas, la hiptesis del
investigador sobre el efecto de una variable independiente sobre
otra dependi>, contrastando el
resultado con la posibilidad probabilidad- de que tal efecto sea
debido al azar.
DISEO
Siguiendo a Kerlinger. Diseo es el plan, estructura y estrategia
de una investigacin cuyo objetivo es dar respuesta a ciertas
preguntas y controlar la varianza. Como se aprecia, el autor define
el trmino e incluye en su concepto los dos objetivos fundamentales
del mismo.
Diseo de
investigacin
Es la determinacin de un plan de trabajo o procedimiento para la
recogida de datos.
DISPERSIN Caracterstica de un grupo que nos informa del grado en
que las puntuaciones de los
integrantes de un grupo se sitan de forma ms o menos cercana la
medida de posicin de
que se trate (por ejemplo, de la media aritmtica). Un grupo en
que todos su miembros
obtienen una puntuacin igual a la medida de posicin tiene una
dispersin de 0; sin
embargo, no existe un valor fijo de dispersin mxima. Las medidas
de dispersin o
variabilidad ms importantes y utilizadas son la desviacin tpica
o la varianza.
DISTRIBUCIN DE
FRECUENCIAS
En ocasiones, las puntuaciones originales o directas pueden
representarse en una tabla en la
que junto a estas Xi- se incluya el nmero de veces que cada
puntuacin se repite (frecuencia: fi). Cuando el nmero de
puntuaciones diferentes es elevado, las puntuaciones
directas suelen sustituirse por conjunto de ellas, denominados
intervalos; junto a ellos, las
veces que ese conjunto de puntuaciones se repite (frecuencia del
intervalo). En estos casos, a
la hora de representar al intervalo (por ejemplo, para operar)
se utiliza su valor medio,
conocido como marca de clase.
Distribucin binomial Es la distribucin de probabilidad de una
variable aleatoria discreta que describe el nmero
de sucesos que se presentarn para un nmero dado de ensayos y
conocida la probabilidad de
aparicin del suceso.
Distribucin binomial
negativa
Es la distribucin de probabilidad de una variable aleatoria
discreta que describe el nmero
de ensayos que se requieren para conseguir k xitos.
Distribucin chi-
cuadrado
O ji-cuadrado es la distribucin de probabilidad de una variable
continua (ver variable chi-
cuadrado)
Distribucin
condicionada
En una distribucin conjunta de frecuencias absolutas (o de
frecuencias
relativas), recibe el nombre de distribucin condicionada la
distribucin de una
de las variables condicionada a cada valor de la otra variable.
As, por ejemplo,
si tenemos dos variables, X: "Hbitos de lectura" e Y: "Horas de
consumo de TV" la
distribucin condicionada de frecuencias absolutas se obtiene
dividiendo cada frecuencia
absoluta conjunta por su correspondiente frecuencia marginal; es
decir:
donde: nij: frecuencia conjunta y n.j: frecuencia marginal. Esta
distribucin condicionada nos
informa de la proporcin de observaciones de cada uno de los
valores de una variable
asociado a cada uno de los valores de la otra. Por ejemplo, nos
permite conocer los "hbitos
de lectura" para los diferentes valores de "horas de consumo de
TV" y, viceversa, las "horas
de consumo de TV" para los diferentes "hbitos de lectura".
Distribucin conjunta
de frecuencias
absolutas
Es una tabla de doble entrada, en la que por el lado de las
filas se sitan las categoras de la
variable X, y por el lado de las columnas se sitan las categoras
de la variable Y. En cada
celdilla de la tabla se presenta la frecuencia absoluta
conjunta.
Distribucin conjunta
de frecuencias
relativas
La distribucin conjunta de frecuencias relativas, o
proporciones, es una tabla de doble
entrada, en la que por el lado de las filas se sitan las
categoras de la variable X, y por el
lado de las columnas se sitan las categoras de la variable Y. En
cada celdilla de la tabla se
presenta la frecuencia relativa conjunta o proporcin
conjunta.
-
Distribucin de
Bernouilli
Es la funcin de probabilidad de un experimento aleatorio en el
que slo pueden ocurrir dos
sucesos mutuamente excluyentes y que se denomina experimento de
Bernouilli en honor del
matemtico Jacobo Bernouilli que deriv su funcin de
probabilidad
Distribucin de
frecuencias
Es una tabla donde de forma ordenada se presentan los
diferentes
valores o modalidades que presenta una variable (o
caracterstica) con
el nmero de observaciones (frecuencia) que presentan la
misma
modalidad. La suma de las frecuencias de cada modalidad es igual
al
tamao de la muestra o nmero total de observaciones. Por
ejemplo,
en una muestra de 150 emigrantes su lugar de procedencia ha
sido:
Distribucin de
Poisson
Es el lmite al que tiende la distribucin binomial cuando el
nmero de ensayos, N, aumenta
y la probabilidad de aparicin de un suceso, p, tiende a cero.
Por esta razn se la denomina
tambin como "Ley de los sucesos raros". Por ejemplo, nacimientos
de trillizos en una
ciudad. La distribucin de Poisson tiene una funcin de
probabilidad conocida que se define
mediante una simple ecuacin matemtica que permite obtener las
probabilidades de
aparicin de un determinado suceso.
Distribucin de
porcentajes
Es una tabla donde de forma ordenada se presentan los
diferentes
valores o modalidades que presenta una variable (o
caracterstica)
con el porcentaje (tanto por ciento) de observaciones que
corresponde a cada modalidad. La suma de los porcentajes de
cada modalidad es igual 100. Por ejemplo, en una muestra de
150
emigrantes el porcentaje de su lugar de procedencia ha sido:
Distribucin de
probabilidad
De una variable aleatoria discreta es una lista de las
probabilidades asociadas con cada posible valor de la
variable. Se la llama tambin Funcin de Probabilidad o, en
otros textos, Funcin de Masa de Probabilidad y ms
formalmente se define como una funcin que asigna
probabilidades a cada valor, xi, de la variable aleatoria
discreta, X. Se representa por f(x) =
P(X= xi) y cumple las siguientes condiciones:
que indica que la funcin de probabilidad no puede tomar valores
negativos ni mayores de 1
y que la suma de las probabilidades asignadas a todos los
posibles valores discretos de la
variable es igual a 1. Algunas variables aleatorias tienen como
funcin de probabilidad una
funcin o ecuacin matemtica conocida. Por ejemplo, la funcin de
probabilidad de la
distribucin binomial, es:
Distribucin de
proporciones
Es una tabla donde de forma ordenada se presentan los
diferentes
valores o modalidades que presenta una variable (o
caracterstica)
con proporcin (tanto por uno) de observaciones que corresponde
a
cada modalidad. La suma de las proporciones de cada modalidad
es
igual 1. Por ejemplo, en una muestra de 150 emigrantes la
proporcin de su lugar de procedencia ha sido:
Distribucin F Es la funcin de densidad de probabilidad de la
variable F
Distribucin
heterognea
Es una distribucin con una alta variabilidad con los datos muy
dispersos y alejados de su
tendencia central.
Distribucin
homognea
Es una distribucin con poca variabilidad porque sus datos se
encuentran muy concentrados
respecto a su tendencia central.
Distribucin marginal En una tabla de distribucin conjunta de
frecuencias absolutas (o de frecuencias relativas),
cada una de las dos variables tiene su propia distribucin, la
misma que si considerramos
cada variable por separado. Estas dos distribuciones se llaman
marginales, ya que se colocan
en los mrgenes de la distribucin conjunta, y se obtienen a
partir de la distribucin conjunta
de una manera muy sencilla: sumando las filas, por un lado, y
las columnas, por otro. Por
tanto, las distribuciones marginales de una distribucin conjunta
de dos variables, X e Y, se
reduce a dos distribuciones (de frecuencias absolutas o de
proporciones) de una variable. Una
representa la distribucin de la variable X, sin considerar a la
variable Y, y la otra representa
la distribucin de la variable Y sin tener en cuenta la variable
X
-
Distribucin muestral Es la distribucin de probabilidad de un
estadstico calculado en todas las posibles muestras
del mismo tipo y tamao extradas de una determinada poblacin. Se
demuestra que la
distribucin muestral de la media es, o se aproxima, a la
distribucin normal. El
conocimiento de la distribucin muestral de los estadsticos es la
base de la inferencia
estadstica y el contraste de hiptesis que se estudia en cursos
posteriores.
Distribucin
multinomial
Es una generalizacin de la distribucin binomial en la que (a
diferencia de sta basada en
variable aleatoria de Bernouilli) cada ensayo puede presentar ms
de dos categoras,
exhaustivas y mutuamente excluyentes. Sus caractersticas son:
a)consiste en N pruebas
independientes. b)cada prueba o ensayo presenta ms de dos
resultados. c) las probabilidades
correspondientes a cada uno de los resultados permanece
constante y tales que su suma es
igual a 1.
Distribucin normal Se estudia como distribucin de frecuencias
que representa la distribucin de muchas
variables y como distribucin de probabilidad por su especial
incidencia en la inferencia
estadstica y contraste de hiptesis que se estudiarn en cursos
posteriores. Esta distribucin
se debe a Carl Friedrich Gauss que estudi y describi sus
propiedades matemticas.
Distribucin normal
estndar o tipificada
Es una distribucin normal con media cero y desviacin tpica
uno.
Distribucin t Distribucin de probabilidad de la variable t de
Student
Doble sumatorio Supongamos que un grupo total se
descompone en k grupos con n personas
cada uno, es decir todos los grupos tienen el
mismo nmero de personas:
donde Xij representa la
puntuacin de la persona i que
pertenece al grupo j. La suma de las n
puntuaciones del grupo total vendr dada
por:
Dicho en palabras, el doble sumatorio
significa el sumatorio de los sumatorios de
las puntuaciones de las personas en cada
grupo.
E
Ecuacin de regresin La ecuacin de regresin es una funcin
matemtica que representa la relacin entre dos o
mas variables. En este curso se estudia la ecuacin de regresin
lineal simple entre dos
variables X e Y que viene definida por la ecuacin de una recta,
de expresin: Esta
ecuacin queda perfectamente definida cuando se obtienen los
valores de la ordenada, a y
la pendiente, b.
Enfoque confirmatorio Es la forma de abordar muchos anlisis
estadsticos cuando se realizan para que los datos
confirmen (o refuten) las hiptesis que se plantean, en vez de
plantearse la cuestin de
manera exploratoria de forma tal que sean los propios datos los
que nos "digan" las
relaciones o tendencias que hay entre las diferentes
caractersticas objeto de estudio.
Enfoque exploratorio El enfoque exploratorio trata de que sean
los propios datos los que nos "digan" las relaciones
que hay entre las diferentes caractersticas objeto de estudio.
En contraste al modo
confirmatorio, el modo exploratorio est abierto a un amplio
abanico de explicaciones
alternativas, lo cual no significa que el modo confirmatorio
deba ser desterrado del anlisis
sino, ms bien, que no debe ser el que se emplee de manera
exclusiva.
Entidades estadsticas Cada uno de los elementos que componen una
poblacin
Equiprobables Dos o mas sucesos son equiprobables si tienen la
misma probabilidad de ocurrencia.
-
Error absoluto Es la diferencia , en valor absoluto, entre el
valor observado y el
pronosticado mediante la recta de regresin.
Error de agrupamiento Cuando se ordenan los datos en intervalos
y asumen todos el valor del punto medio, se
pierde la informacin de cada puntuacin concreta, lo que puede
producir un error, que se
conoce como error de agrupamiento. En algunos intervalos, el
punto medio puede ser una
sobreestimacin de los valores originales, mientras que en otros
intervalos se puede dar una
subestimacin. En distribuciones de frecuencia con un n elevado
de datos, los errores por
exceso en unos intervalos tienden a compensarse con los errores
por defecto de otros, con lo
cual, a efectos del anlisis estadstico, el empleo del punto
medio como valor representativo del
intervalo, produce resultados similares a los producidos si se
emplearan los datos originales.
Error de pronstico Es la diferencia entre la puntuacin
observada, Y, y la pronosticada, Y',
mediante la ecuacin de regresin. Esto es:
Error tpico Es la desviacin tpica de la distribucin muestral de
un determinado estadstico. De esta
forma, el error tpico de la media es la desviacin tpica de la
distribucin muestral de la
media. Con otras palabras, la desviacin tpica de todas las
medias calculadas en todas las
posibles muestras del mismo tipo y tamao, n, extraidas de una
determinada poblacin de
tamao N.
Error tpico de
estimacin
Es la desviacin tpica (raz cuadrada de la varianza) de los
errores o residuos de la
regresin.
Escala de intervalo En una escala de intervalo el punto cero es
arbitrario y posee unidad de medida, por lo que
los nmeros asignados tienen ya un significado de cantidad, en el
sentido ordinario de la
palabra. Un ejemplo sencillo y muy ilustrativo son las escalas
Centgrada (C) y Farenheit
(F) de temperatura, donde como se sabe para la escala Centgrada
el punto 0 corresponde a
la temperatura de congelacin del agua y el punto 100 a la
temperatura de ebullicin. El
cero es arbitrario y no indica carencia del atributo medido, o
lo que es lo mismo, no indica
ausencia de calor. En una escala de intervalo el nmero 20 no
representa el doble de
cantidad del atributo medido que el 10, de forma que 20C no es
el doble de calor que 10,
pero por el contrario, la diferencia entre dos valores de la
escala representan distancias
entre cantidades de la propiedad medida, de tal forma que
podemos decir que la diferencia
entre 40C y 30C es el doble de la diferencia entre 20 y 15C.
Esto es as, como ya se ha
sealado, porque el punto 0 no representa carencia del atributo
medido sino que es un
punto cero arbitrario. Respecto a las transformaciones
admisibles es cualquier
transformacin lineal tal de los valores iniciales que deja la
escala invariante
Escala de medida Es un procedimiento por el cual se relacionan
de manera biunvoca (uno a uno) un conjunto
de modalidades (distintas) con un conjunto de nmeros
(distintos). Esto es, a cada modalidad
le corresponde un slo nmero, y a cada nmero le corresponde una
sola modalidad.
Atendiendo a las relaciones que puedan verificarse empricamente
entre las modalidades de
los objetos o caractersticas pueden distinguirse cuatro tipo de
escalas de medida, segn el
esquema tradicional propuesto por Stevens (1946) en su primera
publicacin sobre teora de
la medida: escala nominal, escala ordinal, escala de intervalo y
escala de razn.
Al aplicar la regla de medida y la correspondiente unidad a un
determinado objeto llegamos
a un nmero. Pero los nmeros resultantes no tienen todos las
mismas propiedades ni, por
tanto, se les pueden aplicar las mismas operaciones matemticas.
Con los nmeros ms
perfectos, propios de una escala de medida de cociente o de razn
(edad, talla, peso)
podemos utilizar todas las operaciones matemticas. Con los de
escalas de intervalo
(temperatura), no, ya que no tienen un 0 absoluto. Hay nmeros
propios de una escala de
medida ordinal, que admiten menos operaciones que los
anteriores; ahora bien, dado que el
orden tiene en alguna medida un carcter cuantitativo (por
ejemplo: clase social) algunos
autores clasifican, en ocasiones, a estas variables como
cuasi-cuantitativas. Por ltimo, hay
nmeros propios de escalas de medida nominal; aqu los nmeros no
indican cantidad sino
diferencia: lo que es igual recibe el mismo nmero y lo que es
diferente, un nmero distinto.
Escala de razn La escala de razn es la ms rica en cuanto a la
informacin que proporciona, porque
adems de poseer todas las propiedades de las escalas anteriores:
igualdad - desigualdad
(escala nominal), orden (escala ordinal), y distancia (escala de
intervalo), tiene la ventaja
de tener un cero absoluto que indica carencia absoluta del
atributo medido. Esta es la
escala ms habitual para medir propiedades fsicas, como el peso,
la altura, el volumen,
etc., pero es difcil encontrar variables psicolgicas que puedan
medirse con esta escala.
-
Por eso, podemos afirmar que el que mide 180 cm, es el "doble"
de alto que el que mide
90cm pero nunca que un CI de 180 es el doble de otro CI de 90, a
menos que la variable
inteligencia la podamos medir con escala de razn donde el punto
cero represente al que
carece "absolutamente" de inteligencia. En consecuencia, la
escala de razn incorpora las
caractersticas del sistema numrico de las escalas anteriores: la
igualdad, el orden y la
distancia, a la que aade la propia de esta escala que es la
igualdad de razones. Al tener un
origen de escala absoluto, la nica transformacin admisible para
la escala de razn es del
tipo: g(x)=bx siendo b > 0. Esta transformacin supone
simplemente un cambio en la
unidad de medida de la escala, preservando siempre el origen de
la misma.
Escala nominal En todas aquellas modalidades o caractersticas en
las que la nica comprobacin emprica
que puede hacerse es la de igualdad o desigualdad, su
representacin numrica ha de tener
un carcter meramente nominal. A este nivel de relaciones
empricas (igualdad-desigualdad)
el hecho de atribuir nmeros hay que entenderlo como simples
smbolos o nombres y por
tanto no gozan de propiedades matemticas. No se pueden sumar,
restar, multiplicar o
dividir, y tanto dara, pues, cambiarlos por smbolos no numricos.
Las tipologas respecto al
carcter, segn la cual los seres humanos pueden encuadrarse en
una de las cuatro
categoras: flemtico, melanclico, sanguneo o colrico, son un
ejemplo de escala nominal
de caractersticas psicolgicas. Es fcil adivinar el tipo de
transformacin admisible que se
puede aplicar en este tipo de escalas: cualquiera que preserve
las relaciones de igualdad-
desigualdad de los objetos respecto a una determinada
caracterstica.
Escala ordinal Son aquellas caractersticas objeto de estudio
cientfico en las que se observan relaciones
de un nivel superior al de la simple igualdad-desigualdad que
caracteriza la escala
nominal. Los objetos pueden manifestar determinada caracterstica
en mayor grado unos
que otros, de modo que la escala que los represente debe
preservar esas relaciones
empricas observadas de orden. En el mbito de las ciencias
sociales, muchas son las
caractersticas en las que las relaciones empricas de los objetos
que comparten dichas
caractersticas, tienen un carcter ordinal. Por ejemplo, si no se
sabe nada de la materia, o
se sabe muy poco, lo ms probable es que el juicio que el
profesor haga de su exposicin
sea de "suspenso"; por el contrario, si se sabe bien la materia,
y de igual manera se
expresa, lo ms probable es que el juicio sea de "sobresaliente".
Si en vez de estos trminos se emplea una escala numrica: 0 para
suspenso, 1 para aprobado, 2 para notable, 3 para
sobresaliente y 4 para matrcula de honor, la conclusin que sacar
el lector de, pongamos, dos
expedientes acadmicos de 2 alumnos distintos que hayan cursado
una misma materia, es que si
uno de los alumnos ha obtenido un 3 y el otro un 1, el primero
ha exhibido un mayor conocimiento
de la materia que el segundo, o, lo que es lo mismo, que el
segundo tena menos conocimientos que el
primero. Respecto a las transformaciones que admite la escala
ordinal de medida, puede
decirse que, en general, cualquier transformacin es vlida
siempre que preserve el orden de
magnitud, creciente o decreciente, en que los objetos presentan
determinada caracterstica.
Espacio muestral Es el conjunto formado por todos los resultados
posibles de un experimento aleatorio. Se
representan con la letra mayscula E y tambin se llama universo o
poblacin del experi>.
Esperanza matemtica O valor esperado de una variable aleatoria
es el promedio o valor central de la variable. Es
un resumen numrico de la tendencia central de la distribucin de
probabilidad (si la
variable es discreta) o de la funcin de densidad de probabilidad
(si la variable es
continua). Se conoce tambin con el nombre de "momento respecto
al origen de primer
orden" y se representa con la letra E y entre parntesis la
variable cuya esperanza se
describe: E(X), E(Y), E(W), etc, o con la letra griega "mu"( ) y
como subndice la
variable que se representa , etc.
Estadstica Definida por Amn, (1984; p.37) como " la ciencia que
recoge, ordena y analiza los datos
de una muestra, extrada de cierta poblacin, y que, a partir de
esa muestra, valindose del
clculo de probabilidades, se encarga de hacer inferencias acerca
de la poblacin".
Ciencia que trata de analizar e interpretar los datos recogidos
con algn propsito, como la
investigacin cientfica. Algunos autores la definen afirmando que
su objeto es el estudio de
los fenmenos aleatorios; recuerde el lector que cuando hablamos
de contrastar los efectos
de diversas intervenciones lo que hacemos es asignar
proabilidades a que tales efectos se
deban al puro azar (aleatoriedad) o a la intervencin llevada a
cabo por el investigador en
condiciones de rigor o control de explicaciones alternativas.
Cuando trabajamos con los
valores de las muestras la Estadstica se denomina descriptiva;
si de tales valores deseamos
pasar a estimar los correspondientes a la poblacin, la
Estadstica se conoce como
-
inferencial; esta es ms compleja pero es la que ofrece ms
utilidad u aplicaciones tanto al
cientfico como al profesional. La inferencia estadstica pretende
sacar conclusiones sobre
gran nmero de datos a travs de observaciones de parte de esos
datos. Se trata de
generalizar los datos de una muestra a la poblacin de la que
procede. Mediante la
estadstica inferencial se puede estimar parmetros y realizar
contraste de hiptesis.
Estadstico Un estadstico es un valor que se calcula a partir de
los datos de una muestra. Se utilizan para
representar una caracterstica de la muestra y para estimar el
mismo valor referido a la
poblacin de la cual se ha extrado la muestra. ejp, la media
calculada en una muestra proporciona
informacin sobre la correspon> media poblacional. El valor
numrico de estos estadsticos dependen
de la composicin de la muestra y variar de una muestra a otra.
Se representan por letras del
alfabeto latino. Por ejemplo, rxy, se utiliza para representar
la correlacin entre dos variables
X e Y observadas en una muestra. mientras que el mismo concepto,
referido a la poblacin,
se denomina parmetro y se representan con letras del alfabeto
griego
Valores obtenidos en una muestra. Los ms conocidos son los
agrupados bajo las medidas
de posicin o tendencia central (media, mediana, moda), las de
dispersin o variabilidad
(desviacin media, desviacin tpica, varianza) o los coeficientes
de correlacin. Suelen
representarse con letras latinas ( x , s, r). A partir de ellos,
por inferencia estadstica, podemos estimar sus correspondientes
parmetros con determinados niveles de
probabilidad, asumiendo un riesgo de error tipo I prefijado por
el investigador.
Estadsticos robustos Son ndices estadsticos descriptivos
provenientes del anlisis exploratorio de datos que
tienen la peculiaridad de ser resistentes a los datos extremos
de la distribucin. Entre ellos
se encuentran: MEDIA RECORTADA, MEDIA WINSORIZADA,MEDIA
CENTRAL,MEDIANA RECORTADA O TRIMEDIA yla MEDA.
Experimento Es el desarrollo de un proceso mediante el cual
obtenemos un conjunto de resultados,
observaciones o datos con el fin de realizar una comprobacin o
verificar una hiptesis.
ESTIMACIN DE
PARMETROS
Se denomina as el procedimiento por el que se trata de estimar
el valor de un estadstico,
obtenido en una muestra, a toda la poblacin de la que aquella
forma parte. Toda
estimacin asume un cierto margen de error, medido en trminos de
probabilidad; este
error puede hacerse tan pequeo como desee el investigador, pero
nunca podr hablar en
trminos seguros, de certeza. Al hablar en el texto del
coeficiente de correlacin nos
hemos acercado al concepto y procedimiento de estimacin de
parmetros.
EXPERIMENTO Es la modalidad de investigacin emprica ms exigente;
como consecuencia, su
aportacin esencial es la posibilidad de establecer, con
razonable seguridad, relaciones de
causa a efecto entre una o varias variables independientes
(v.i.) y otra denominada
dependiente (v.d.). Para poder lograrlo se deben cumplir
determinadas exigencias: el
investigador debe poder planificar la accin y provocar el
fenmeno, ha de poder
realizarlo en condiciones de control y debe contar con medidas
de calidad, tan vlidas,
fiables y precisas como sea posible.
Experimento aleatorio Es cualquier experimento realizado al azar
que se puede repetir indefinidamente en las
mismas condiciones y cuyo resultado no se puede predecir con
certeza. cumple las cuatro
condiciones siguientes: a) Se puede repetir indefinidamente en
las mismas condiciones. b)
En cada ensayo se obtiene un resultado que pertenece al universo
o conjunto de todos los
resultados posibles, E. c) Antes de cada ensayo no se puede
predecir con certeza el resultado
que obtendremos. d)A medida que el nmero de ensayos aumenta, la
frecuencia relativa - o
proporcin - de aparicin de cada resultado posible tiende a
aproximarse a un valor fijo.
F
FIABILIDAD
La fiabilidad es una de las caractersticas tcnicas que deben
reunir los instrumentos de
recogida de datos y de medida. Entendemos por fiabilidad el
grado de precisin de la
medida; a ms precisin fiabilidad- menos error de medida. La
fiabilidad se expresa en muchos casos mediante un coeficiente de
correlacin (representado aqu por rXX, dado
que las dos series tienen que ver con el mismo instrumento de
recogida de datos). Las dos
series pueden referirse a las puntuaciones en dos mitades de la
misma prueba (consistencia
interna), a las puntuaciones de la misma prueba aplica en dos
ocasiones separadas por un
cierto tiempo (estabilidad) o a las puntuaciones en dos pruebas
equivalentes, esto es, de
caractersticas tan semejantes como sea posible
(equivalencia)
-
Frecuencia Es el nmero de veces que un valor de la variable
aparece en un conjunto de observaciones.
Frecuencia absoluta Nmero de veces que se repite cada uno de los
valores de la variable. Se simboliza por ni.
La suma de todas las frecuencias absolutas representa el total
de la muestra n.
Frecuencia absoluta
conjunta
Se representa por nij y corresponde al nmerode datos (la
frecuencia) que pertenece a la
categora i-sima de lavariable X y a la categora j-sima de la
variable Y. Lapresentacin
de esta informacin en forma de tabla se conoce como
distribucinconjunta de frecuencias
absolutas.
Frecuencia acumulada Representa el nmero total de observaciones
o datos desde el valor mnimo hasta un cierto
valor. (Ver Acumulada)
Frecuencia relativa Es sinnimo de proporcin.
Frecuencia relativa
conjunta
O proporcin conjunta se representa por pij y corresponde a la
proporcin de datos que
pertenece a la clase i-sima de la variable X y a la clase j-sima
de la variable Y. La
presentacin de esta informacin en una tabla se conoce como
distribucin conjunta de
frecuencias relativas.
Frecuencias esperadas En los problemas de relacin entre
variables categricas que se presentan en tablas de
contingencia, las frecuencias esperadas son las frecuencias que
se deberan presentar en
cada celda de la tabla en el supuesto de que las variables
fuesen independientes.
Frecuencias observadas En los problemas de relacin entre
variables categricas que se presentan en tablas de
contingencia, las frecuencias observadas o empricas son las
frecuencias que tenemos
realmente en cada celda de la tabla y representan los datos
actuales de la tabla. Estas
frecuencias observadas son las que se comparan con las
"frecuencias esperadas" para
estudiar la relacin entre las variables de nuestro estudio.
Funcin de densidad de
probabilidad
Es una funcin que describe el comportamiento matemtico de la
probabilidad de una
variable aleatoria continua. Conceptualmente es equivalente a la
funcin de probabilidad
de una variable aleatoria discreta, pero referido a una variable
continua, y en consecuencia,
permite obtener la probabilidad de que la variable aleatoria
tome un valor en un intervalo
dado. Ejemplo de funciones de densidad de probabilidad de
variables aleatorias continuas
son: la distribucin normal, la F de Fisher, la t de Student y la
chi-cuadrado.
Si f(x) es una funcin de densidad de probabilidad de una
variable aleatoria, se cumplen
las siguientes condiciones:
La probabilidad total para todos los posibles valores de la
variable aleatoria
continua es uno
La funcin de densidad de probabilidad nunca puede ser negativa:
f(x)>0
Funcin de distribucin Toda variable aleatoria discreta o
continua tiene su funcin de distribucin que representa
la probabilidad de que, para cualquier valor de xi, la variable
aleatoria, X, tome valores
menores o iguales que xi.
Se representa por
Para una variable discreta, la funcin de distribucin se obtiene
sumando, o acumulando,
las probabilidades de la funcin de probabilidad desde el menor
valor de la variable al
mayor.
Por ej, suponiendo que para una variable aleatoria discreta su
funcin de probabilidad es
xi 0 1 2 3 4 5
f(xi) = P(X =xi) 0.1 0.2 0.2 0.3 0.1 0.1
Su funcin de distribucin es, acumulando las probabilidades, la
siguiente
xi 0 1 2 3 4 5
F(xi) = P(X
-
G
GENERALIZACIN
Entendemos por generalizacin al hecho de extender los resultados
de la investigacin
desde los sujetos estudiados a los grupos de los que forma
parte, desde las muestras a sus
respectivas poblaciones. Este procedimiento, propio de la
Estadstica inferencial, tiene
exigencias que deben cumplirse para que sea legtimo y
correcto.
Grados de libertad Hace referencia al nmero de datos de
informacin independientes disponibles despus de
realizar un clculo numrico. Por ejemplo, si conocemos la media
de n valores, podemos
asignar valores a n-1 y el ltimo quedar determinado
automticamente para cumplir la
condicin de que la media sea el valor fijado. En este caso, el
clculo de la media se
realiza con n-1 grados de libertad.
H
HIPTESIS
Entendemos por hiptesis las conjeturas sobre la posible relacin
entre los elementos -
variablesintegrantes del problema. En los diseos experimentales
se formulan hiptesis
sobre la relacin causal entre una o varias variables
independientes (V.I.) y la variable
dependiente (V.D.) Una hiptesis se somete a prueba o se
contrasta tratando de apreciar si
las probabilidades a su favor son sensiblemente superiores a una
explicacin por azar. Esta
segunda hiptesis se denomina nula y se representa por H0 ,
frente a la del investigador (H1)
Histograma Un tipo de representacin grfica, para variables
continuas,
formada por una serie de barras contiguas de altura proporcional
a
la frecuencia de la categora de la variable.
Representacin grfica de las puntuaciones obtenidas por un
conjunto de sujetos en una variable cuantitativa. En el eje X se
sitan
los lmites de los intervalos; en el Y, la frecuencia del
intervalo.
I
Indices de posicin Indican la posicin relativa que ocupa una
puntuacin directa dentro de la distribucin de
frecuencias. Por ejemplo, si una puntuacin directa de X=80
supera al 75% de los datos,
esta puntuacin corresponde al percentil 75. Existen tres nombres
para los ndices de
posicin; cuartiles, percentiles y deciles. Los cuartiles dividen
la distribucin en cuatro
partes, los deciles en diez partes y los percentiles en cien
partes iguales.
ndices de posicin. Indican la posicin relativa que ocupa una
puntuacin directa dentro de la distribucin de
frecuencias. Por ejemplo, si una puntuacin directa de X=80
supera al 75% de los datos,
esta puntuacin corresponde al percentil 75. Existen tres nombres
para los ndices de
posicin; cuartiles, percentiles y deciles. Los cuartiles dividen
la distribucin en cuatro
partes, los deciles en diez partes y los percentiles
Intervalo Es sinnimo del concepto de modalidad y corresponde a
cada uno de los grupos de valores,
delimitados por dos nmeros, en que se clasifican los datos
observados de una variable
(habitual> de tipo cuantitativo) y que ocupan una fila en una
distribucin de frecuencias.
Intervalo crtico Es el intervalo que contiene el ndice de
posicin (percentil, decil o cuartil) que se desea
obtener con datos agrupados en intervalos. Por ejemplo, para el
clculo de la mediana, el
primer paso es determinar en qu intervalo se encontrar. A este
intervalo se le denomina
intervalo crtico y para determinarlo se requiere obtener las
frecuencias acumuladas o
proporciones acumuladas. Hecho esto, el intervalo crtico es el
primer intervalo cuya
frecuencia acumulada sea mayor o igual al 50% de n o cuya
proporcin acumulada sea
mayor o igual a 0,50.
Intervalo de confianza Intervalo construido a partir de la
informacin proporcionada por la muestra que coger el
valor numrico del parmetro poblacional con una probabilidad
determinada.
Intervalo de
probabilidad
Intervalo terico, construido a partir de la distribucin de
probabilidad de un determinado
estadstico, que contiene el valor que tomara ese estadstico
calculado en cualquier
muestra de un tamao determinado extrado de la poblacin.
-
Investigacin cientfica Esquemticamente, y siempre con el riesgo
que esta simplificacin supone, podemos
sealar que una investigacin cientfica conlleva los siguientes
pasos: Un primer nivel
terico-conceptual que incluira:
1. Definicin del problema. 2. Deduccin de hiptesis
contrastables.
Un segundo nivel tcnico-metodolgico constituido por aspectos
propia> metodolgicos:
3. Establecimiento de un procedimiento de recogida de
datos.(Diseo de investigacin)
Finalmente, en un nivel estadstico-analtico:
4. Anlisis de los resultados obtenidos. 5. Discusin de dichos
resultados y bsqueda de conclusiones 6. Elaboracin de un informe de
investigacin.
La interpretacin de los resultados obtenidos nos llevara
nuevamente al nivel terico-
conceptual, inicindose nuevamente el proceso y dando lugar a una
estructura cclica
caracterstica de toda investigacin cientfica.
Para Selltiz, Investigar es buscar de nuevo, echar otra mirada
ms cuidadosa para averiguar ms. Echamos otra mirada porque puede
haber algo errneo en lo que ya
sabemos [...] La investigacin cientfica ha de ser sistemtica,
organizada, disciplinada y
rigurosa. Investigacin emprica es aquella que acude a la
experiencia, a los datos, para
llegar a conclusiones en relacin con las hiptesis de
partida.
L
Lmites aparentes Corresponden a los valores observados (ver
valor aparente) en una variable con nuestro
instrumento de medida y que definen un intervalo con una
frecuencia absouta determinada.
Lmites exactos (de un
intervalo)
Son los valores mximo y mnimo que tendra cada intervalo si el
instrumento de medida
tuviera una precisin perfecta. Por ejemplo, cuando se pesa un
objeto con una balanza con
precisin de 1 gramo, el peso que se lee es una aproximacin al
nmero entero ms
cercano. Si el objeto, segn esa balanza, informa de un peso de
40 gramos hay que
entender que el peso real del objeto se encuentra en el
intervalo 40 0,5, es decir el peso
real estar entre 39,5 y 40,5 gramos. El valor que se lee en el
instrumento (40 gramos) se
conoce como valor informado o valor aparente, mientras que los
valores que acotan el
intervalo (39,5 y 40,5) se conocen como lmites exactos.
M
Meda Es un ndice de dispersin o variabilidad resistente que
corresponde a la mediana de las
desviaciones, en valor absoluto, de cada puntuacin a la
mediana.
Media La media se utiliza para representar a todos los datos de
la
distribucin y es el valor alrrededor del cual tienden
a agruparse todas las observaciones. Se obtiene
sumando todas las puntuaciones de la distribucin y
dividiendo por el nmero de puntuaciones sumadas. Su expresin
matemtica
es:
En notacin sumatorio, la media se escribe:
Medida de posicin resultante de sumar todas las puntuaciones de
un grupo y dividir el
resultado por el nmero de integrantes del grupo, representado
por N. Su ventaja
fundamental radica en que todas y cada una de las puntuaciones
de la serie incluyen en su
valor en forma proporcional al mismo. Es especialmente adecuada
para niveles de medida
de razn e intervalo.
-
Media central Con los datos ordenados la media central es el
promedio de la parte central de la
distribucin una vez que se han sustituido los valores extremos
por los valores centrales.
Media condicionada En una distribucin conjunta de frecuencias
absolutas de dos variables
X e Y, podemos calcular la media de X condicionada a cada una de
los
valores de Y, y de igual forma podemos calcular la media de
Y
condicionada a cada uno de los valores de X. Aunque se puede
calcular
por diferentes procedimientos, su expresin general es:
siendo: Yj : valores discretos de la variable Y, o puntos medios
de los intervalos en el caso
de variables continuas agrupadas en intervalos; j = 1, 2, 3,...,
k; nij: frecuencias conjuntas
de Y para el valor i de X, y ni.: frecuencia marginal del valor
Xi de la variable X. De forma
similar escribiramos la media de X condicionada a los diferentes
valores de Y. Por
ejemplo, supongamos que tenemos una tabla de distribucin
conjunta de frecuencias
absolutas que representan las puntuaciones de un test de
razonamiento numrico, X, para
las diferentes edades, Y, de escolarizacin de la ESO. La media
de X condicionada a los
distintos valores de Y, nos informa de la media del test para
las diferentes edades de
escolaridad de la ESO.
Media recortada Es un estadstico de tendencia central resistente
a las desviaciones de los datos en uno de
los extremos de la distribucin. Para su clculo, se ordenan los
datos y se excluyen un
determinado porcentaje de los valores extremos en los dos lados
de la distribucin
calculndose la media aritmtica de los restantes valores.
Media winsorizada Es un ndice de tendencia central resistente a
las desviaciones de los datos extremos de la
distribucin. Una vez ordenados los datos, un determinado
porcentaje de valores extremos se
sustituyen por el valor inmediata> anterior o posterior y se
calcula la de todos los valores.
Mediana Es el valor de la variable que deja por debajo al 50% de
las observaciones. Por tanto, es el
valor de la variable que divide a la distribucin en dos parte
iguales cada una de las cuales
contiene el 50% de los datos.
Medida de posicin resultante de ordenar las puntuaciones de
mayor o menor, o viceversa,
y encontrar la que ocupa el lugar central de la serie. Si la
serie tiene un nmero par de
casos, la mediana ser la media de las dos centrales. Su
inconveniente fundamental es que
en la mediana no influyen los valores de las puntuaciones sino
solo el orden que ocupan.
Dos series muy diferentes pueden tener la misma mediana. Resulta
especialmente
adecuada para el nivel de medida ordinal.
Mediana recortada Es un ndice resistente utilizado dentro del
Anlisis Exploratorio que se obtiene mediante
una media ponderada de los tres cuartiles. El cuartil segundo (o
mediana) tiene doble
ponderacin que los cuartiles primero y tercero.
Medicin Proceso por el cual se asignan nmeros a objetos o
caractersticas segn determinadas
reglas. Esta definicin implica poner en correspondencia, por un
lado, nmeros, y por otro
objetos o caractersticas con sus correspondientes modalidades.
Entre los nmeros se dan
ciertas relaciones que son vlidas dentro del mundo aritmtico,
que es un mundo ideal.
Tambin entre las modalidades de las caractersticas se dan
determinadas relaciones que
son verificables en el mundo emprico, es decir en el mundo real.
Pues bien, medir supone
poner en relacin estos dos mundos, el ideal de los nmeros y el
real de los objetos, de
modo que las relaciones que se dan en el mundo numrico preserven
exactamente las
relaciones que se observan en el mundo emprico, y slo sern
vlidas aquellas relaciones
numricas que puedan ser verificables empricamente.
Medida Es el proceso por el cual se asignan nmeros a objetos o
caractersticas segn
determinadas reglas. Esta definicin implica poner en
correspondencia, por un lado,
nmeros, y por otro objetos o caractersticas con sus
correspondientes modalidades. Entre
los nmeros se dan ciertas relaciones que son vlidas dentro del
mundo aritmtico, que es
un mundo ideal. Tambin entre las modalidades de las
caractersticas se dan determinadas
relaciones que son verificables en el mundo emprico, es decir en
el mundo real. Pues bien,
medir supone poner en relacin estos dos mundos, el ideal de los
nmeros y el real de los
objetos, de modo que las relaciones que se dan en el mundo
numrico preserven
exactamente las relaciones que se observan en el mundo
emprico.
-
ESCALAS DE MEDIDA Una medida, en sentido estricto, es el
resultado de comparar una unidad con una cantidad.
La cantidad peso la medimos comparndola con la unidad Kilogramo
u otras mayores o menores. El resultado es el nmero. La definicin
ms amplia de medida se debe a Stevens: Medir es asignar numerales a
los objetos o hechos de acuerdo con ciertas reglas.
Un numeral puede ser un nmero o un smbolo, lo que permite
admitir el nivel o escala de
medida nominal. En nuestros mbitos, no siempre es tan fcil
proceder a medir variables;
la mayora de las variables son construcciones o constructos
elaborados por los cientficos
e investigadores, como en el caso de la inteligencia, el nivel
de conocimientos, el
autoconcepto, la tasa de inflacin, el producto interior bruto o
similares. En tales casos, la
medida consiste en la asignacin de valores de acuerdo con
ciertas reglas, como ocurre en
una prueba objetiva, un cuestionario de actitudes hacia los
inmigrantes, la tasa de
mortalidad infantil, etc. Los nmeros que resultan no tienen las
mismas propiedades que
en el caso del peso, de la talla o de la edad, nmeros perfectos
que permiten todo tipo de
operaciones y que son propios de escalas de medida de razn o
cociente. Variables como
la temperatura, perfectamente medibles, se diferencian de las
anteriores en que el punto de
partida cero grados- no es fijo, adems de poder presentar
valores inferiores. Este tipo de variables forman parte de la
escala de intervalos. Las que se limitan a indicar el orden en
una serie (1, 2) se ubican en las escalas ordinales; y en el
caso de variables que no indican cantidad sino semejanza o
diferencia (sexo, estado civil, clase social, grados
universitarios) la escala se conoce como nominal.
Mtodo cientfico Se caracteriza por ser "sistemtico" y
"replicable". El trmino sistemtico hace referencia a
que se trata de un proceso que tiene unos pasos perfectamente
establecidos y el trmino
replicable hace referencia a que los datos obtenidos mediante su
uso pueden ser replicados
o refutados por cualquier investigador que lo desee.
Moda El valor de la variable que ms se repite, por tanto, es el
valor de la variable con mayor
frecuencia.
Tambin denominada Modo, es una medida de posicin que coincide
con el valor ms
repetido de la serie de valores. Su inconveniente fundamental es
que en aquellos valores
menos repetidos que el de la Moda no cuentan para su obtencin.
Resulta especialmente
adecuada para el nivel de medida nominal.
Modalidad Una modalidad es cada uno de las variantes como se
manifiesta una caracterstica. El
estado civil, o las creencias religiosas, son caractersticas que
presentan pocas
modalidades. Por el contrario, muchas caractersticas objeto de
estudio cientfico pueden
presentar un nmero casi infinito de modalidades. Si tomamos por
ejemplo la altura o el
peso de la poblacin espaola, estaremos ante caractersticas con
un infinito nmero de
modalidades, pues aunque dos modalidades estn muy prximas,
siempre son posibles
modalidades intermedias.
Modelo Un modelo permite, haciendo uso de desarrollos matemticos
o de otros lenguajes
formales, elaborar una serie de predicciones que pueden ser
contrastadas empricamente.
Entendemos por modelo una representacin simplificada de la
realidad. Tal representacin puede ser icnica, analgica, matemtica.
Los modelos matemticos tienen
una gran utilidad en Estadstica. En la medida en que unos datos
empricos sigan
razonablemente un modelo, podemos aplicar las propiedades de
este al tratamiento
estadstico de aquellos. En nuestro mbito, modelo es, un tipo de
distribucin de datos
terico o ideal al que pueden tender distribuciones empricas o
reales de ciertas variables.
Por ejemplo: la variable motivacin por los idiomas, una vez
medida en un conjunto
amplio de sujetos (muestra) puede acercarse o apartarse ms o
menos de un modelo ideal o
terico como es la denominada curva normal de probabilidades o
campana de Gauss. Este
modelo tiene unas propiedades; si nuestros datos medidos se
acercan suficientemente al
modelo, podemos aplicarles las propiedades del mismo, lo que nos
permitir analizar los
datos y obtener conclusiones. Para decidir si podemos considerar
que unos datos empricos
se acercan suficientemente al modelo hasta hacerlos compatibles
con l, disponemos de
pruebas de bondad de ajuste, como es el caso de chi o ji
cuadrado, cuyo smbolo es X2.
Este tipo de pruebas asignan una probabilidad a los datos
empricos sobre su acomodacin
o no al modelo, lo que permite al investigador aceptar o no la
hiptesis de nulidad.
-
Muestra Una muestra es una seleccin de datos extrados de una
poblacin o universo de posibles
observaciones. La muestra se debe seleccionar de tal forma que
sea representativa de la
poblacin de origen. Una de los procedimientos de seleccionar
muestras representativas es
el muestreo aleatorio simple donde cada elemento de la poblacin
tiene la misma
probabilidad de formar parte de la muestra.
Muestra aleatoria simple La muestra aleatoria simple es una
seleccin al azar de un conjunto de observaciones que
formaran la muestra para el anlisis de datos.
Muestreo La estadstica ha desarrollado toda una teora especfica
en el que se estudian
procedimientos y tcnicas para la extraccin de muestras
representativas de una poblacin
determinada, y que se engloban bajo la denominacin de
muestreo.
N
Nube o diagrama de
puntos
Es la representacin grfica de dos variables en la que
cada punto representa una determinado dato definido
por unas coordenadas que corresponden a los valores
de esa observacin en la variable X e Y. En el eje
horizontal se sita los valores de la variable
independiente y en el eje vertical los de la variable
dependiente. Este tipo de grfico es especialmente
til en el anlisis de correlacin y regresin.
O
Ordenada En la ecuacin de regresin, la ordenada es el valor que
toma la variable dependiente, Y, cuando
la variable independiente, X, toma el valor 0. Grficamente
corresponde al punto donde la recta
corta al eje vertical (o eje de ordenadas). Usualmente, la
ordenada se representa por la letra a.
En la recta de la figura cuya ecuacin es
Y=0,933+0,74X. El valor de Y cuando X= 0
corresponde al punto donde la recta corta con el eje
de ordenadas, Y. Este valor es la ordenada de la
recta y, en este ejemplo vale 0,933.
Outlier Un valor extremo o atpico que es muy diferente del resto
de observaciones de la muestra
P
Parmetro Entendemos por parmetro el valor de un determinado
estadstico no en la muestra en
que se obtiene sino en el total de la poblacin. Si los
estadsticos ms comunes, como
las medidas de posicin y variabilidad (media: ; mediana: Md;
moda: Mo; desviacin
tpica: s; varianza: s2...) se suelen representar por letras
latinas, los parmetros lo hacen
por letras griegas ( = media; s = desviacin tpica; s2 =
varianza...)
Nombre dado a cualquier ndice numrico que describe alguna
caracterstica de la poblacin: su
tendencia central, variabilidad, asimetra, relacin, covariacin,
etc. Se representan por letras
del alfabeto griego, por ejemplo, , se utiliza para representar
la correlacin entre dos
variables X e Y de la poblacin. Suele ser un valor desconocido
que se estima -o infiere- a
partir de los valores observados en la muestra. De la inferencia
de parmetros se ocupa la
Estadstica Inferencial que se estudiar en otros cursos.
-
Pendiente La pendiente de la ecuacin de regresin de Y sobre X se
representa por la letra b e indica el
cambio que se produce en la variable Y por cada cambio unitario
en la variable X.
Grficamente representa la "inclinacin" de la recta de regresin.
Si la relacin entre las variables
es positiva la pendiente tambin es positiva. Si la relacin entre
las variables es negativa la
pendiente es negativa. Si no existe relacin lineal entre las
variables la pendiente es cero.
En la Figura se ha trazado la recta cuya ecuacin es
Y=0,933+0,74X. El valor de la pendiente, como se ha
sealado, es la variacin que se produce en la variable Y
cuando X aumenta una unidad. Como el lector puede
comprobar el valor de Y para X = 4 es 3,893, y para X =
5 es 4,633; la diferencia entre estos dos valores es
exactamente el valor de la pendiente, es decir, 4,633 -
3,893 = 0,74 = b.
Percentil Es el valor de la variable que deja por debajo un
porcentaje determinado de observaciones. Los
percentiles dividen la distribucin en 100 parates, por tanto,
existen 99 percentiles que son los
que van desde el percentil 1 al 99 de tal forma que el percentil
73 sera el valor de la variable de
observacin que deja por debajo el 73% de los datos. El percentil
25 es lo mismo que el primer
cuartil. El percentil 50 es lo mismo que la mediana, que el
decil 5 y que el segundo cuartil. El
percentil 75 es lo mismo que el tercer cuartil. Por tanto, la
escala de percentiles divide a la
distribucin en 100 partes iguales de tal forma que entre dos
percentiles consecutivos se
encuentra el 1% de las observaciones.
Poblacin Por poblacin estadstica se entiende el conjunto de
todos los elementos que comparten una o
varias caractersticas. A cada uno de los elementos que componen
una poblacin se le
denomina de manera genrica entidades estadsticas, y de acuerdo
al nmero de las entidades
que la componen, una poblacin puede ser finita o infinita. El
conjunto de espaoles que
padecen trastornos epilpticos, los municipios con cinco mil
habitantes o menos, los parados
registrados en el Instituto Nacional de Empleo, el conjunto de
libros publicados en una ao por
una editorial, el total de accidentes de trfico ocurridos en las
carreteras espaolas durante el
ao 1999, son ejemplos claros de poblaciones finitas. Por el
contrario, el lanzamiento reiterado
de una moneda, o el conjunto de nmeros naturales (1,2,3...), son
ejemplos de poblaciones
infinitas dado que no hay un lmite establecido en ninguno de
estos dos conjuntos; siempre se
puede tirar la moneda una vez ms y, respecto al conjunto de
nmeros naturales, por muy
grande que sea un nmero siempre habr otros que lo superen
El trmino poblacin se define como el conjunto de todos los casos
o elementos que cumplen con las caractersticas que la definen: los
varones, las mujeres, los estudiantes de Farmacia, los
polticos, los abogados... En ciencias sociales no suele estar
muy claramente definida. El
investigador desea generalizar los datos de la muestra a la
poblacin. En los estudios empricos
no suele ser posible ni, en la mayora de los casos, aconsejable-
estudiar todos los casos; se acude en su lugar a muestras, que
deben ser representativas del conjunto total o poblacin. Por
medio de la Estadstica inferencial se pueden hacer estimaciones
de los parmetros a partir de
las muestras (por ejemplo: desde a )
Porcentaje Simbolizado por Pi, es el valor de la frecuencia
relativa multiplicado por cien. Expresado
formalmente: Pi = pi 100. Indica el tanto por ciento (%) de
observaciones de una determinada
modalidad o valor de la variable de estudio.
Porcentaje acumulado Ver acumulada.
Probabilidad Teora matemtica que estudia la posibilidad de
ocurrencia de sucesos o acontecimientos. En
trminos matemticos la probabilidad tiene tres definiciones: la
definicin clsica, la definicin
estadstica y la definicin axiomtica.
Frente a los sucesos seguros se encuentran los probables. El
tipo de seguros a las que es ms
adecuado aplicar la probabilidad es el de los fenmenos
aleatorios. Conociendo las diferentes
manifestaciones de un fenmeno, como el nmero de caras de un dado
o de los nmeros de la
lotera, podemos decidir la denominada probabilidad a priori,
suponiendo, como debe ocurrir,
que todas las caras del dado y todos los nmeros tienen las
mismas oportunidades. En el primer
caso, la probabilidad de una cara cualquiera es de 1/6; en el
segundo, suponiendo que tengamos
-
60.000 nmeros, ser de 1/60.000. Para nosotros es importante
conocer los modelos de
probabilidad, como el de la curva normal. Gracias a ella, a la
regla matemtica que la rige,
podemos asignar probabilidades a los fenmenos que la siguen, que
se acomodan a ella. Estas
probabilidades nos permiten aceptar o rechazar hiptesis (pruebas
estadsticas) o decidir si un
coeficiente de correlacin rXY es o no estadsticamente
significativo. Los valores de
probabilidad oscilan entre 0 suceso imposible- y 1, suceso
seguro. Reflexione sobre la correccin o incorreccin de una expresin
habitual en los medios de comunicacin como la
siguiente: casi con toda probabilidad. Sera ms correcto afirmar:
con elevada probabilidad? o, casi con seguridad?
Probabilidad
acumulada
Representa la suma de probabilidades desde el menor valor
posible hasta un cierto valor. En los
modelos de distribucin de variables aleatorias discretas, la
probabilidad acumulada
corresponde a la funcin de distribucin de probabilidad.
Promedio La media aritmtica se conoce tambin con el nombre de
promedio y
corresponde a la suma de todas las observaciones o datos
dividido por el
nmero de datos.
Es un valor de la variable que se encuentra hacia el centro de
la distribucin
de frecuencias, se le denomina genricamente como tendencia
central y
sintetiza todos los valores de la distribucin.
Proporcin Simbolizada por pi, es el cociente entre la frecuencia
absoluta de cada clase, ni y el nmero total
de observaciones, n. Expresado formalmente: pi = ni/n. La
frecuencia relativa o proporcin
indica el tanto por uno de observaciones que corresponden a una
categora o valor de la variable
de estudio.
Proporcin
acumulada
Ver acumulada.
Proporcin de
varianza explicada
En la ecuacin de regresin, la varianza de la variable
dependiente se puede descomponer en la suma de dos
varianzas: la varianza de las puntuaciones pronosticadas, y
la
varianza del error o varianza de los residuos. Los pronsticos
son una funcin lineal
de la variable independiente X, funcin que viene especificada
por la propia recta de
regresin: , por lo que la varianza de las puntuaciones
pronosticadas, Y,
dependen de la varianza de X, tal y como indica la siguiente
expresin:
mientras que los residuos no dependen de ninguna variable o lo
que es igual, no es funcin de
ninguna variable conocida e incluida en la ecuacin de regresin.
Entonces, si la varianza de Y
se puede expresar como la suma de la varianza de los pronsticos
y la varianza de los residuos:
y la varianza de las puntuaciones pronosticadas depende de la
varianza de X, entonces la
varianza de Y se puede explicar en parte por la varianza de X.
Es decir, una parte de la
variabilidad de Y puede ser explicada, una vez construida la
recta de regresin por la propia
variabilidad de X. Expresada en trminos de proporciones la
proporcin de la variabilidad de Y
que es explicada por la variabilidad de los pronsticos (que a su
vez son funcin de la
variabilidad de X) ser:
que corresponde con el coeficiente de determinacin, mientras que
la proporcin de la
variabilidad de Y que no se puede explicar por variabilidad de
los pronsticos ser:
PRUEBAS
ESTADSTICAS.
BONDAD DE
AJUSTE
Cuando queremos contrastar dos o ms formas de intervencin
mtodos, procedimiento de disciplina, sistemas de motivacin,
tratamientos fisioteraputicos, frmacos- acudimos a un contraste de
hiptesis. El investigador formula la suya H1- y, para darla por
buena, debe ser capaz de rechazar la alternativa, conocida como
hiptesis nula o de nulidad (H0). Por prudencia,
solo rechazar esta y aceptar aquella cuando las probabilidades a
favor de esta sean tan pequeas
como desee y, en consecuencia, las probabilidades a favor de su
hiptesis sean tan elevadas como
l decida. Las pruebas estadsticas ms comunes son t y F, aunque
hay otras muchas. Un tipo de
pruebas concreto es el de bondad de ajuste; se puede aplicar,
por ejemplo, para decidir si una
determinada distribucin de datos se acomoda suficientemente a un
modelo como para poder