Estadística _______________________________________________________________________ __________________________________ Celestí Bertran i Infante 1 Unitat 1: Recollida de dades i representació gràfica................................ 1.1. Continguts. 1.1.1. Definicions bàsiques. En estadística, anomenem població al conjunt d’individus sobre els quals volem estudiar una determinada propietat característica. Una mostra és un subconjunt d’individus extrets d’una població. Se sol recorre a una mostra sempre que la població té un nombre molt gran d’individus. En tal cas s’ha de tenir molt en compte que aquesta sigui representativa de la població. Al nombre d’individus d’una mostra se l‘anomena grandària de la mostra (N). Els resultats obtinguts de “mesurar” una propietat característica comuna a tots els individus d’una població o mostra rep el nom de variable estadística. Les variables estadístiques es poden classificar en variables qualitatives, com el color dels cabells, la professió dels pares, el sexe dels alumnes d’una classe... i en variables quantitatives, com l’alçada, el pes, el nombre de germans, el nivell de colesterol dins la sang... Les variable quantitativa es poden classificar en discretes, si entre dos valors consecutius no en podem prendre cap més, i en continues, si entre dos valors consecutius de la variable es pot prendre qualsevol altre valor. Exemples 1-2: 1) L’estat civil dels professors i professores d’un centre educatiu, les marques de vi del Principat... són exemples clars de variables qualitatives. 2) El número de calçat, el nombre de germans, el nombre de persones que van diàriament a veure una pel·licula... són exemples de variables quantitatives discretes, mentre que l’alçada i el pes dels alumnes d’una classe, el contingut de plom de les diferents gasolines... són exemples de variable quantitativa continua. Variables estadístiques continues discretes ves quantitati es qualitativ 1.1.2. Recollida de dades i elaboració de taules estadístiques. Un cop s’ha fixat l’objectiu d’estudi i definides les variables, s’ha de delimitar la població o la mostra. La següent fase és la recollida de dades, i hem de tenir molt en compte que pot donar-se dues situacions diferents: 1) la informació que necessitem ja està elaborada per algun organisme oficial o en algun anuari, 2) la informació no existeix prèviament, i per tant cal obtenir-la fent servir enquestes. Un cop tenim les dades per la via més adient, hem d’elaborar les taules estadístiques, i per això hem de definir el que s’entén per freqüència absoluta, freqüència relativa i freqüència percentual.
21
Embed
Unitat 1: Recollida de dades i representació gràficacbertra1/materials/cv4-est_excel/unitat 1.pdf · Estadística _____ _____ Celestí Bertran i Infante
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Unitat 1: Recollida de dades i representació gràfica................................
1.1. Continguts.
1.1.1. Definicions bàsiques.
En estadística, anomenem població al conjunt d’individus sobre els quals volemestudiar una determinada propietat característica.
Una mostra és un subconjunt d’individus extrets d’una població. Se sol recorre auna mostra sempre que la població té un nombre molt gran d’individus. En tal cass’ha de tenir molt en compte que aquesta sigui representativa de la població. Alnombre d’individus d’una mostra se l‘anomena grandària de la mostra (N).
Els resultats obtinguts de “mesurar” una propietat característica comuna a tots elsindividus d’una població o mostra rep el nom de variable estadística.
Les variables estadístiques es poden classificar en variables qualitatives, comel color dels cabells, la professió dels pares, el sexe dels alumnes d’una classe... ien variables quantitatives, com l’alçada, el pes, el nombre de germans, el nivellde colesterol dins la sang...
Les variable quantitativa es poden classificar en discretes, si entre dos valorsconsecutius no en podem prendre cap més, i en continues, si entre dos valorsconsecutius de la variable es pot prendre qualsevol altre valor.
Exemples 1-2:1) L’estat civil dels professors i professores d’un centre educatiu, les marques de vi del Principat...
són exemples clars de variables qualitatives.2) El número de calçat, el nombre de germans, el nombre de persones que van diàriament a
veure una pel·licula... són exemples de variables quantitatives discretes, mentre que l’alçadai el pes dels alumnes d’una classe, el contingut de plom de les diferents gasolines... sónexemples de variable quantitativa continua.
Variables estadístiques
continuesdiscretes
vesquantitati
esqualitativ
1.1.2. Recollida de dades i elaboració de taules estadístiques.
Un cop s’ha fixat l’objectiu d’estudi i definides les variables, s’ha de delimitar lapoblació o la mostra. La següent fase és la recollida de dades, i hem de tenir molten compte que pot donar-se dues situacions diferents:
1) la informació que necessitem ja està elaborada per algun organisme oficial oen algun anuari,
2) la informació no existeix prèviament, i per tant cal obtenir-la fent servirenquestes.
Un cop tenim les dades per la via més adient, hem d’elaborar les taulesestadístiques, i per això hem de definir el que s’entén per freqüència absoluta,freqüència relativa i freqüència percentual.
La freqüència absoluta (ni) d’un valor xi de la variable és el nombre de vegadesque apareix aquest valor en el conjunt de dades obtingudes a partir de la mostrao de la totalitat de la població.
• Es verifica que: ∑ in = N.
La freqüència relativa (fi) d’un valor xi de la variable és el quocient entre la seva
freqüència absoluta i la grandària de la mostra o població, és a dir, fi =Nni
• Es verifica que: ∑ if = 1.
La freqüència percentual (pi) d’un valor xi de la variable és el resultat demultiplicar la seva freqüència relativa per 100, és a dir, pi = fi · 100.
• Es verifica que: ∑ ip = 100.
Exemple 3:A la pregunta de quants germans tenien els 25 alumnes d’una classe d’ESO, les respostes van ser:
a) La freqüència absoluta del valor xi = 2 de la variable és ni = 8.
b) La freqüència relativa del valor xi = 3 de la variable és fi = 255
= 0,2.
c) La freqüència percentual del valor xi = 4 de la variable és pi = 252
·100 = 8 %.
Ara ens cal ordenar les dades i fer el recompte de freqüències, per tal d’elaborar tot seguit la taula.Observeu:
Si la variable és continua és aconsellable agrupar les dades en intervals queanomenem intervals de classe. Els punts mitjos d’aquests intervals reben elnom de marques de classe.
Per tal que cada valor de la variable pugui ser assignat a un interval de classe,cal construir-los de manera que l’extrem superior d’un interval coincideixi ambl’extrem inferior del següent, deixant molt clar a quin dels dos intervals pertanyaquest extrem comú. També es recomanable agrupar dades si la variable ésdiscreta i la grandària de la mostra o població és molt gran.
Exemple 4:Al mesurar les altures (en cm) dels 40 atletes masculins que participen en una cursa popular, s’haobtingut:
Anem a construir la taula agrupant dades. Abans de començar, observeu que l’atleta més baix téaltura de 170 cm, mentre que el més alt té una altura de 185 cm. Definint intervals d’amplitud 3,podem obtenir 5 intervals. Observeu:
1.1.3. Gràfics estadístics.
La forma més usual de representar la informació continguda en una taula defreqüències consisteix en fer servir eixos de coordenades cartesians, on en l’eixOX col·loquem els valors de la variable estadística i en l’eix OY la freqüència o elpercentatge. Ara bé, existeixen altres formes de representar gràficament aquestainformació, normalment associada a variables qualitatives.
Els gràfics els diferenciarem en:• Gràfics associats a variables qualitatives i quantitatives discretes no
agrupades. Dins d’aquest tipus de gràfics tenim: els diagrames de barres,els diagrames de línies i els diagrames de sectors.
• Gràfics associats a variables quantitatives continues i quantitativesdiscretes amb un nombre molt gran de dades. Entre aquests gràfics tenimels histogrames i els polígons de freqüències.
1. Gràfics associats a variables qualitatives i quantitatives discretes noagrupades.
a) Diagrames de barres.Exemple 5:Les dades de la taula adjunta ens dóna les faltes d’assistència dels 24 alumnes d’unadeterminada classe d’ESO.
Exemple 6:Si volem comparar el número de faltes d’assistència del 24 alumnes d’una determinada classed’ESO en dues setmanes consecutives, la taula de distribució de freqüències pren la forma:
Faltes assistència(valors variable)
Núm. d’alumnes1a setmana
Núm d’alumnes2a setmana
01234
108231
117213
N = 24 N = 24
i, el gràfic resultant d’adossar els dos diagrames de barres en un de sol seria:
b) Diagrames de línies.
Aquesta construcció s’obté a partir del diagrama de barres simplement unint elspunts (xi,ni) fent ús de segments rectilinis, el resultat és una línia poligonal.
Exemple 7:En el cas concret de l’exemple 5, el gràfic és:
A l’igual que en els diagrames de barres, podem comparar gràfics de línies, així en el cas del’exemple 6., obtenim:
Aquest tipus de diagrama mostra la importància de les diferents parts que formenun tot; per construir-lo, caldrà dibuixar un cercle i, a continuació, dividir-lo entantes parts com valors diferents té la variable, essent cada una de les partsproporcional a la seva freqüència o al seu percentatge.
Exemple 8:S’han consultat a 25 persones sobre les seves preferències davant de quatre marques demicroones. La taula és:
Marques de microones Freq. absolutesSanyoFagorMoulinexSamsungNS/NC
86524
N = 25
A tall d’exemple, per determinar l’amplitud del sector corresponent al valor Fagor, s’ha de tenir encompte que una volta de circumferència té 360º, que la grandària de la mostra és 25 i que elnúmero de persones que tenen preferència per aquesta marca és de 6. Així s’obté que a la marcaFagor li correspon un angle de 86,4º.
2. Gràfics associats a variables quantitatives continues i quantitatives discretesamb un nombre molt gran de dades.
a) Histograma.
Exemple 9:Les qualificacions finals en l’assignatura d’Estadística, de 40 alumnes de primer de Batxillerat elegitsa l’atzar es troben en la taula adjunta:
Hem de crear un full de treball que anomenarem NOTES.XLS. Per crear-lo podeu utilitzar la
barra de menú: Fitxer/Nou i acceptar.
Situeu-vos en la cel·la A1 i comenceu a escriure les següents dades:
A B C D 1 Nom ¡ cognoms NOTA 1 NOTA 2 NOTA 3 2 Artigues i Mas, Marc 5,6 5,6 8,9 3 Barri i Carmona, Lourdes 4,2 2,3 4,5 4 Bernat i Calamitat, Joan 5,6 8,9 7,8 5 Bertran i Compte, Arnau 7,2 8,3 3,3 6 Campos i Vall, Rosalia 1.5 5,6 4,6 7 Montaner í Pujol, Joaquim 1,6 4 8,3 8 Ruiz i Martos, Maria 5,6 5,6 4,6 9 Torres ¡ Segura, Francesc 7.8 2,3 8,6
A la cel·la E1 poseu Nota mitjana i a la E2 escriviu la formula =SUMA(B2:D2)/3. A partir
d'ara, heu de recordar que: "quan una cel·la és el resultat de fer operacions amb altres
cel·les hem d'escriure sempre el signe = ". Hem escrit els símbols B2:D2, que signifiquen?
És el rang de cel·les que volem utilitzar, és a dir, són les cel·les que van des de la B2 fins a
la D2, ambdues incloses. Hem utilitzat la paraula suma per indicar que amb les cel·les del
rang B2:D2 es faci l'operació indicada, la suma. Finalment hem dividit el resultat entre 3 i ja
tenim la nota mitjana per al primer alumne. Ara desitgem fer el mateix amb la resta
d'alumnes.
Podem anar escrivint per a cada alumne la mateixa fórmula o utilitzar l'eina de copiar. Per
poder copiar -arrossegar- la formula de la cel·la E2 a la resta de cel·les, ens situem en la
cel·la E2, amb el cursor assenyaleu el canto inferior dret fins que es mostri el símbol +,
llavors, tenint polsat el boto esquerre del ratolí, arrossegueu-lo fins a cobrir totes les cel·les
on voleu copiar la fórmula. Si fot va bé, en el rang de cel·les E2:E9 tenim les notes mitjanes
de cada alumne. Indiqueu-les amb una única xifra decimal. Situeu-vos sobre la cel·la E5,
com es la formula que hi ha? En la barra de formules apareix =SUMA(B5:D5)/3. Es
correcte? Efectivament, al copiar, EXCEL desplaça la referència a la cel·la. Això ens porta a
parlar del que son les referències absolutes i referències relatives.
Seleccioneu les dades de la columna Nom i cognoms i NOTA 1, cliqueu sobre la icona de
copiar, passeu al Full2 i situeu-vos sobre la cel·la A1. Cliqueu sobre la icona enganxar. Ara,
en el Full2 teniu les dades seleccionades. En la cel·la C1 poseu Percentatges. En la cel·la
B10 escriviu la següent fórmula =SUMA(B2:B9). En la cel·la C2 poseu la fórmula
=B2/B10*100. Arrossegueu aquesta fórmula a la resta de les cel·les.
Completeu la taula amb la columna dels percentatges i els totals, i representeu el
corresponent diagrama de sectors circulars.
Departament Despeses (en €) % DespesesDepartament Comercial 30.000Departament de Fabricació 24.000Departament d’Informàtica 21.000Departament de Control de qualitat 4.800Departament de Formació 6.000
Mireu de que el gràfic us quedi com el de la figura següent:
Recordeu de desar aquesta activitat com a VENDES_4.XLS.
AAccttiivviittaatt 1111:: MMAATTEESS..XXLLSS
Les dades adjuntes representen les notes de 30 alumnes de Batxillerat en l’assignatura de
Matemàtiques. Agrupeu-les en 5 intervals d’amplitud 2 i elaboreu el seu histograma i el
Per a elaborar l’altre gràfic, seleccioneu la finestra gràfica amb el botó dret, accediu a Datosde origen. Entreu a la fitxa Serie i premeu el botó Agregar. Entreu el rang F2:F8 en l’apartat
de Valores i Aceptar . Ja teniu el Poligon de freqüències.
Si tot ha anat bé, us haurien de quedar els gràfics així:
Guardeu el llibre de treball en el vostre disquet d’activitats amb el nom MATES.XLS.
AAccttiivviittaatt 1122:: MMAAXXIIMMEESS..XXLLSS
Repetiu el procés de l’activitat 11 amb les dades següents que representen a les
temperatures màximes a Roda de Ter durant tot el més d’octubre de l’any 2004.
Continueu amb AVALUACIO_1.XLS. Canvieu el nom del full3. Poseu-li el nom
Activitat 3.
a) En el full Activitat 3, situeu-vos en la cel·la A1 i escriviu ESTAT CIVIL. En el rang
A2:A5 escriviu Casats, Solters, Separats i Vidus. En la cel·la B1 escriviu FREQ.ABSOLUTA i en el rang B2:B5 poseu: 50, 25, 15 i 10. En les cel·les C1 i D1 poseu
FREQ. RELATIVA i FREQ. PERCENTUAL. Completeu la taula utilitzant fórmules.
b) Representeu el corresponen Diagrama de sectors.
No us oblideu de desar el llibre. Recordeu que s’anomena AVALUACIO_1.XLS.