Top Banner

of 325

Statistica I

Jul 19, 2015

Download

Documents

Ghita Maria
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript

STATISTIC APLICAT N TIINELE SOCIO-UMANENoiuni de baz - Statistici univariate

Cristian Opariuc-Dan

Constana, decembrie 2009

Statistic aplicat n tiinele socio-umane

Fiicei mele, Luana-tefana

Statistica este precum fumatul La prima igar, i-e ru. Dac continui, ncepe s-i plac i n final termini prin a fi dependent. Diferena dintre statistic i fumat este c statistica nu duneaz grav sntii.

2

Cristian Opariuc-Dan

CuprinsCuprins ......................................................................................................... 3 Prefa .......................................................................................................... 7 Cuvntul autorului ...................................................................................... 11 I. Natura msurrii n tiinele socio-umane ............................................ 15 I.1 Variabile....................................................................................... 18 Variabile discrete................................................................... 20 Variabile continui .................................................................. 21 Scale neparametrice ............................................................... 23 Scale parametrice .................................................................. 26 Bazele de date creare, salvare, deschidere ........................... 35 I.1.1 I.1.2 I.2 I.2.1 I.2.2 I.3 II. I.3.1 II.1 II.2 III. III.1

Scale (nivele) de msurare ............................................................ 22

Prezentare general SPSS for Windows ........................................ 30

Organizarea datelor ............................................................................. 58 Sistematizarea datelor ................................................................... 60 Reprezentarea grafic a datelor ..................................................... 67 Statistici descriptive Tendina central .......................................... 70 Populaie i eantion ................................................................. 71 III.1.1 Eantionarea simplu randomizat........................................... 73 III.1.2 Randomizarea pe cote............................................................ 74 III.1.3 Eantionarea stratificat ......................................................... 75 III.1.4 Eantionarea pe cluster .......................................................... 76 III.2 Indicatori ai tendinei centrale ................................................... 76 III.2.1 Media .................................................................................... 78 III.2.2 Mediana i rangurile .............................................................. 83

3

Statistic aplicat n tiinele socio-umane

III.2.3 Modul.................................................................................... 87 III.2.4 Precizia indicatorilor tendinei centrale .................................. 88 III.2.5 Obinerea indicatorilor tendinei centrale n SPSS .................. 92 IV. Media populaiei. Reprezentri grafice ale tendinei centrale .......... 100 Reprezentri grafice ................................................................ 101 Analiza grafic a tendinei centrale.......................................... 111 IV.1 IV.2

IV.2.1 Graficul tulpin i frunze .................................................. 112 IV.2.2 Graficul cutie (box-plot)................................................... 115 IV.3 V. Tratarea scorurilor extreme ..................................................... 118 IV.3.1 Obinerea graficelor pentru tendina central n SPSS .......... 121 Statistici descriptive mprtierea ................................................... 126 V.1 Indicatori elementari ai mprtierii ............................................ 128 Amplitudinea de variaie...................................................... 128 Abaterea cuartil sau abaterea intercuartil .......................... 129 Diferena medie Gini ........................................................... 133 Oscilaia .............................................................................. 134 Abaterea medie.................................................................... 137 Abaterea median ................................................................ 139 Dispersia ............................................................................. 139 Abaterea standard ................................................................ 142 Coeficientul de variaie ........................................................ 145 V.1.1 V.1.2 V.2 V.2.1 V.2.2 V.2.3 V.2.4 V.2.5 V.2.6 V.2.7 V.3 VI. VI.1 VI.2

Indicatori sintetici ai mprtierii ................................................ 133

Obinerea indicatorilor mprtierii n SPSS................................ 146 Distribuia normal ........................................................................ 149 Modalitatea ............................................................................. 151 Simetria .................................................................................. 152

VI.2.1 Coeficientul Yule ................................................................ 153 4

Cristian Opariuc-Dan VI.2.2 Coeficientul de asimetrie Fisher........................................... 153 VI.3 VI.4 VI.5 VI.6 Boltirea sau excesul ................................................................ 158 Caracterizarea distribuiei normale .......................................... 162 Transformarea datelor brute .................................................... 171 Sisteme de etalonare ............................................................... 175

VI.4.1 Notele z i note standard derivate ..................................... 164

VI.6.1 Etaloane n cuantile ............................................................. 180 VI.6.2 Etaloane normalizate ........................................................... 183 VI.7 VII. Analiza distribuiei i realizarea etaloanelor n SPSS ............... 189 VI.7.1 Calculul notelor z n SPSS ............................................... 203 Probabiliti i semnificaie statistic .............................................. 209 Patru reguli de probabilitate .................................................... 212 Probabilitatea simpl pentru evenimente egale ................. 213 Evenimentele mutual exclusive ........................................ 214 Evenimentele independente .............................................. 217 Probabilitatea condiionat ............................................... 218 VII.1.1 VII.1.2 VII.1.3 VII.1.4 VII.2 VII.3 VII.1

Eroare standard i intervale de ncredere ................................. 220 Metoda tiinific n tiinele socio-umane .............................. 227 Enunarea problemei ........................................................ 228 Formularea ipotezelor ...................................................... 231 Proiectarea cercetrii ........................................................ 246 Efectuarea observaiilor ................................................... 247 Interpretarea datelor ......................................................... 247 Formularea concluziilor ................................................... 249

VII.3.1 VII.3.2 VII.3.3 VII.3.4 VII.3.5 VII.3.6 VIII. VIII.1 VIII.2

Eantionare i reprezentativitate.................................................. 251 Populaia ................................................................................. 252 Surse de date ........................................................................... 253 5

Statistic aplicat n tiinele socio-umane

VIII.2.1 VIII.2.2 VIII.3 VIII.3.1 VIII.3.2 VIII.3.3 VIII.3.4 VIII.3.5 VIII.4 VIII.4.1 VIII.4.2 VIII.4.3

Sursele principale de date................................................. 253 Sursele secundare de date................................................. 254 Mrimea eantionului ....................................................... 257 Caracteristicile populaiei ................................................. 258 Procedee de eantionare ................................................... 258 Stabilirea eantionului prin analiz ................................... 260 Determinarea mrimii eantionului .................................. 278 Crearea unui eantion n SPSS ......................................... 286 Analiza eantionului......................................................... 302 Investigarea proprietilor eantionului ............................ 308

Eantionul ............................................................................... 254

Construcia eantioanelor n SPSS ........................................... 285

Bibliografie .............................................................................................. 321 n loc de ncheiere .................................................................................... 323

6

Cristian Opariuc-Dan

PrefaApariia unei noi cri de statistic n domeniul tiinelor sociale este un fapt tiinific remarcabil n zona intelectual de resort din Romnia. Denumirea alternativ pentru aceast preocupare academic este Metode cantitative n domeniul tiinelor sociale, avnd n vedere faptul c statistica este un vast ansamblu de metode folosite pentru culegerea, gruparea, prelucrarea, interpretarea i prezentarea datelor culese din sectorul cercetrii sau al practicii profesionale. Din acest ansamblu de metode, psihologii i ali specialiti n domeniul socio-uman nu ntrebuineaz dect o parte. Statistica este o preocupare teoretic i practic, ale crei acumulri a dat roade care se revars ntr-un vast ansamblu de domenii tiinifice i preocupri empirice, domeniul economic fiind cel mai cunoscut marelui public. Oamenii sunt din ce n ce mai bombardai pe canalele media cu informaii statistice, care se constituie, n frecvente cazuri, n surse de manipulare. Orice persoan care dorete s decodeze corect noianul de date statistice cotidiene trebuie s cunoasc sensul i corecta folosire a unor noiuni i a unor raportri din acest areal de preocupri. Dup cum spune un statistician englez, m refer la Milton Smith, nenorocirea nu const n faptul c statisticile mint, ci n faptul c mincinoii se folosesc de statistici. Referinele domnului Cristian Opariuc se fac mai ales la domeniul psihologiei, domeniu n care autorul a avut o rodnic activitate profesional, n calitate de psiholog practician. Se poate spune c expozeul domniei sale din lucrarea de fa reprezint o statistic trit, adic aplicat prin experien profesional ntr-o mulime de situaii de cercetare tiinific i aplicaii empirice. Contribuia domniei sale la rspndirea teoriei i a aplicaiei statistice n domeniul socio-uman, n general, i n cel psihologic, n special, este notabil, avnd n vedere precizrile anterioare referitoare la contactul nemijlocit cu situaii care cereau competen i pertinen n interpretare. Pentru cei tineri i neexperimentai, amintesc faptul c domeniul interpretrii cantitative

7

Statistic aplicat n tiinele socio-umane

i calitative a datelor rezultate din practica profesional i cercetarea tiinific a fost n grea suferin n Romnia. Introducerea consistent in Romnia a spiritului experimental n psihologie i a curentului aplicativ n diverse sectoare de activitate cunoate o dezvoltare promitoare n perioada interbelic, mai ales prin activitatea colii experimentale de la Cluj, al crei iniiator este profesorul tefnescu Goang. Vrful de valoare academic a fost reprezentat de profesorul Nicolae Mrgineanu, prima personalitate romneasc de talie mondial din domeniul psihologiei. Format la instituii academice reputate din Statele Unite, cunosctor al personalitilor tiinifice de prim rang de nivel mondial, citat n lucrri tiinifice de anvergur, Nicolae Mrgineanu a lansat n circuitul tiinific romnesc dou lucrri, intitulate Analiza factorilor psihici i Probleme de psihometrie, care anunau o frumoas perspectiv de dezvoltare a domeniului analizelor cantitative n psihologie. Din pcate, Leviatanul s-a dovedit a fi din nou foarte imprevizibil i a adus n loc de dezvoltare cultural tiinific un pustiitor i secetos vnt asiatic peste destinele oamenilor de valoare din domeniul cultural i tiinific. Vreme de mai bine de cinci decenii, Romnia a cunoscut dictatura celor care proveneau din zona lumpen-proletar, fapt care a afectat foarte serios progresul cercetrilor psihosociale. n aceast perioad, preocuprile statistico-experimentale s-au redus puternic, fiind aproape anihilate de o concepie ngust-pragmatic de organizare a nvmntului i a cercetrii. O tiin care se ocupa cu diagnoza psihic nu putea trezi dect suspiciune n rndul unei nomenclaturi cldite pe principiul contra-seleciei valorice. n aceast perioad, lucrrile de specialitate au lipsit aproape cu desvrire, consecina resimindu-se n rndul puinilor practicieni care activau n domeniul colar, al transporturilor, industrial i militar. ntre 1948 i 1990 au existat profesioniti i cercettori din domeniul psihologiei cu interes i iniiativ, dar mediul n care evoluau era puternic srcit de informaie i via tiinific. Majoritatea celor ce activau n laboratoare au avut un inventar redus de procedee de prelucrare a datelor. n lipsa unor instituii universitare de profil consolidate, care s creeze specia-

8

Cristian Opariuc-Dan liti, au primit titulatura de psihologi absolveni de filosofie, filologie, pedagogie, sociologie. Pentru acetia, chiar construirea etaloanelor prea o tain de neptruns. Dup 1990, revirimentul s-a realizat intens, progresiv. Schimburile culturale i tiinifice s-au intensificat, accesul la informaie s-a democratizat i ne gsim aproape de limita normalitii. Fac aceast afirmaie, deoarece folosirea procedurilor avansate de prelucrare statistic este nc deficitar n Romnia i rafinamentul interpretativ este nc insuficient dezvoltat. Cartea lui Cristian Opariuc este o contribuie notabil pentru intrarea n normalitate. Autorul nu realizeaz un inventar sec de noiuni i procedee statistice, ci se concentreaz prioritar pe explicaii amnunite i pe prezentarea consecinelor aplicrii de procedee statistice. n lipsa unei astfel de atenii, interveniile statistice n cercetare i n practica profesional se pot transforma n capodopere din antologia umorului. Se poate ntocmi o list apreciabil de folosiri inadecvate ale procedurilor cantitative; de exemplu, calcularea mediei pentru frecvenele absolute ale modalitilor scalei nominale, introducerea de date lipsite de consisten scalar adecvat n analiza factorial, folosirea procedurilor parametrice n locul celor neparametrice, interpretarea ngust tehnicist a rezultatelor cercetrilor. Este apreciabil modul n care se concentreaz autorul spre evitarea situaiilor de artefact, spre adecvarea reprezentrilor grafice, spre explicarea particularitilor situaiilor experimentale. De mare importan este acea parte a crii care se refer la domeniul inferenial i la testele statistice adecvate situaiei de cercetare, fiind cunoscut situaia c n acest domeniu se fac cele mai frecvente confuzii. Interesant este faptul c aceste rezultate confuze se constituie n baz de pornire pentru alte demersuri metodologice, de unde o diluare a consistenei faptului tiinific i, drept urmare, a concluziilor care se pot trage din efectuarea unui studiu. Un merit al autorului este atenia acordat unei corecte introduceri a datelor n programul computerizat de prelucrri statistice din domeniul tiinelor sociale, autorul fiind lovit din greu de patima informaticii. Realizrile din 9

Statistic aplicat n tiinele socio-umane

domeniul informaticii, n special a bncilor de date n domeniul examenului psihologic, au constituit fapte de pionierat n domeniu. Lucrarea are un aspect cursiv i se citete uor, explicaia acestor situaii fiind talentul i rbdarea autorului; nimic nu este considerat de la sine neles, ambiguitile sunt excluse, identitatea noional este asigurat i verificat prin exerciii. Lucrarea poate servi drept baz de tratament pentru a nltura idiosincrazia statistic a studenilor i profesionitilor din domeniul tiinelor sociale.

Iai, 23 septembrie 2008

Prof. univ. dr. Aurel Stan Universitatea Al. I. Cuza, Iai

10

Cristian Opariuc-Dan

Cuvntul autoruluiBun venit la cursul de statistic aplicat n tiinele socio-umane. Dac ai cumprat aceast carte, probabil c suntei student sau absolvent al unei faculti pe care ai urmat-o tocmai din dorina de a scpa de matematic, de calcule, probabil c v plac mai mult cuvintele, v place s vorbii cu oamenii, s-i nelegei i s-i ajutai, s ptrundei fenomenele i evenimentele sociale. mi imaginez surprinderea i ngrijorarea dumneavoastr n momentul n care, abia pind pe bncile facultii, ai aflat cu stupoare c trebuia s studiai statistic. Mai mult, c statistica v-a urmat n toi anii de facultate, inclusiv la licen. tiu! i eu, la rndul meu, am trit aceleai sentimente i nu m pot luda c am obinut, de la nceput, performane deosebite n acest domeniu. Asta pentru c statistica nu se las uor dezvluit. Totui, statistica reprezint fundamentul tiinific al unor discipline precum psihologia, sociologia, antropologia i multe altele. Fr sprijinul su, nu am reui s vorbim astzi de inteligen, trsturi de personalitate, tipuri de memorie, nu am avea teste care s le msoare la nivelul la care reuesc acum s le msoare. Statistica nu este att de grea. Nu este nevoie s tim concepte avansate de matematic superioar pentru a nelege i aplica principii statistice. Dac tii s adunai, s scdei, s nmulii i s mprii, sunt sigur c vei putea nva foarte bine i statistica. Nu trebuie s v sperie formulele complexe i neinteligibile. De cele mai multe ori, aceste formule nu sunt altceva dect algoritmi, pai simpli, proceduri de calcul elementar, care v introduc n lumea fascinant a probabilitilor. Chiar dac uneori apar termeni precum logaritmi, integrale, derivate i limite, stai linitii. Nimeni nu v pune s le calculai. Unele calcule pot presupune utilizarea unui calculator tiinific i cam att. Am ncercat s fac din acest volum un material special i am evitat de fiecare dat s utilizez concepte matematice laborioase. Fiecare formul pe care o prezint aici va fi explicat, descompus. Uneori abundena de exemple

11

Statistic aplicat n tiinele socio-umane

i repetiiile sunt destinate fixrii unor concepte mai dificile sau mai importante. Sigur c statistica presupune nc de la nceput stpnirea unor concepte noi. Nu putem avansa dac nu nelegem sensul termenului a msura sau dac nu tim ceea ce este o variabil, un nivel de msur sau un indicator statistic. Muli dintre dumneavoastr abia acum iau contact cu aceti termeni i, desigur, lucrul acesta i sperie. Fii fr grij. O mare parte din terminologia statistic o folosii deja i ai folosit-o de mii de ori. Doar c nu tiai c se numete aa i nici de unde provine. mpreun vom face lumin. Acest volum este unul practic. Fiecare capitol i propune obiective precise i abund de exemple i exerciii concrete. n definitiv, m intereseaz s stpnii practica statisticii, s o utilizai n activitatea dumneavoastr de zi cu zi i nu s facem speculaii teoretice pe aceast tem. Majoritatea capitolelor sunt formate din dou pri: un fundament teoretic i conceptual nsoit de algoritmii (paii) clasici ai unui procedeu statistic i o aplicaie folosind un pachet de programe de prelucrri statistice, SPSS for Windows. n aceast carte am utilizat mai multe versiuni SPSS, ultima fiind versiunea 15. Sunt sigur c principiile prezentate aici vor putea fi aplicate i n versiunile urmtoare. La momentul scrierii acestei cri, ultima versiune de SPSS este versiunea 16. n general, fiecare capitol se finalizeaz cu un set de ntrebri i exerciii pe care v invit s le parcurgei singuri, deoarece sunt menite s stabilizeze cunotinele dobndite. Totui, de ce este important s studiem statistica? Desigur, argumentele sunt nenumrate, ns m voi rezuma doar la cteva. Cel ce nu cunoate statistic nu poate nelege articolele de specialitate. Toate cercetrile care se fac n acest domeniu folosesc metode statistice mai mult sau mai puin elaborate. Un specialist n domeniu care nu cunoate statistic, nu poate citi i nelege n profunzime coninutul unui material de specialitate, corectitudinea sau incorectitudinea datelor expuse. n alt ordine de idei, necunoscnd statistic, nu se poate face cercetare experimental, nu pot fi nelese principiile constructive ale unui instrument sau ale unei metode de msurare a unor caliti 12

Cristian Opariuc-Dan psihologice sau a unor fapte sociale i, prin urmare, un asemenea instrument nu va putea fi utilizat corect. Materialele pe care le-am folosit pentru a scrie aceast carte sunt, n marea lor majoritate, prezentate n bibliografia final. De asemenea, am utilizat multiple surse de pe Internet, precum i experiena mea ca practician i dascl n ale statisticii. Nu pot s nu-i menionez pe cei care mi-au fost primii ndrumtori n aceast aventur i de la care am avut i nc mai am de nvat foarte mult. Astfel, i sunt recunosctor profesorului doctor Cornel Havrneanu, mentorul i prietenul meu, care mi-a ghidat formarea i m-a susinut permanent, prietenului meu asistent doctor Ovidiu Lungu, un statistician nnscut, care m-a determinat s neleg c acesta ar fi domeniul ce mi sar potrivi cel mai bine i care mi-a sprijinit nceputurile, lector doctor Loredana Ruxandra Gherasim, cu care de nenumrate ori am nvat s aplic practic ceea ce tiam teoretic sau s mi fundamentez teoria plecnd de la practic, profesor universitar doctor Aurel Stan, care a avut bunvoina i rbdarea, alturi de cei menionai mai sus, s mi citeasc lucrarea i s mi fac observaii pertinente pe seama ei, prin intermediul cruia am luat cunotin de statistic prima dat, n anii studeniei, i care, ulterior, mi-a furnizat informaii valoroase ce mi-au permis s m perfecionez. Fr contribuia lor, n mod sigur nu a fi ajuns niciodat s scriu aceste rnduri i lor le datorez recunotina mea. Nu pot, de asemenea, s nu mulumesc unei situaii, situaia care ma determinat s vin din Iai la Constana. Am nvat c, statistic, un eec personal creeaz premisele unei relansri. Dac aceast situaie, dac propriile mele eecuri nu ar fi existat, probabil c aceast carte nu ar fi existat nici ea. ntotdeauna, chiar atunci cnd ceva pare sigur imposibil, s tii c soluia e chiar la ndemna dumneavoastr. Referitor la acest fapt, nu pot s nu mulumesc fiicei mele, Luana-tefana, care mi-a fost sprijin i speran n toate momentele dificile i care, n ciuda vrstei, nu a ncetat s m sprijine i s m ncurajeze. i mulumesc i i dedic prima mea lucrare. 13

Statistic aplicat n tiinele socio-umane

Aceast carte nu ar fi vzut tiparul fr susinerea profesorului universitar doctor Mircea Miclea, care m-a ncurajat, m-a neles i a sprijinit apariia acestui volum. i mulumesc i mi exprim recunotina i pe aceast cale. Nu pot, de asemenea, s nu i amintesc pe prinii mei i pe toi prietenii mei, mai mult sau mai puin apropiai, datorit crora am avut energia s ncep aceast lucrare i crora le mulumesc pentru c m-au ajutat s trec peste momentele dificile din ultimii ani i fa de care nu pot s nu mi exprim recunotina. Orict a ncerca, nu reuesc s mi scot din minte vorbele i imaginea primului meu profesor adevrat de matematic, domnul Crezant Ghenghea, din cadrul liceului industrial (pe atunci), actualmente Colegiu Naional Nicu Gane din Flticeni, care a reuit s-mi induc, cum nu a fcut nimeni, dragostea fa de aceast disciplin. Chiar dac nu l nelegeam n acel moment al adolescenei mele, el a fost primul (i singurul) care m-a vzut cu aptitudini n acest domeniu, aptitudini pe care eu nsumi mi le repudiam. A trebuit s treac muli ani ca s ajung la vorbele sale: Eti pentru tiine exacte. Nu poi scpa de ceea ce eti. Ai s-mi dai dreptate mai trziu. i i-am dat dreptate. Mi-a dori s fie acum mndru de ceea ce-am realizat i voi folosi aceast ocazie pentru a-i mulumi. Nu n ultimul rnd, v mulumesc dumneavoastr, care ai cumprat aceast carte, i v invit s m urmai n cltoria din lumea statisticii, s v convingei c lucrurile sunt mai simple dect credei. Eu nu pot dect s v garantez c v voi scoate la liman. Observaiile dumneavoastr sunt foarte importante pentru mine i m vor putea orienta n viitoarele lucrri sau reeditri ale acestui volum. Dac unele informaii nu vi se par clare, dac dorii i altceva, nu v rmne dect s-mi scriei pe adresa [email protected] i s-mi comunicai opinia dumneavoastr. V mulumesc i v doresc succes! Constana, miercuri, 2 decembrie 2009

14

Cristian Opariuc-Dan

I. NATURA MSURRII N TIINELE SOCIO-UMANEn acest capitol se va discuta despre: Sensul i semnificaia termenului de msurare; Variabile discrete i continui; Niveluri de msurare; Descrierea programului SPSS; Crearea unei baze de date SPSS; Operaii elementare n SPSS. Dup parcurgerea capitolului, cititorii vor fi capabili s: neleag conceptul de msurare n tiinele socio-umane; Disting ntre variabilele continui i variabilele discrete; Diferenieze nivelurile de msurare; Se familiarizeze cu aplicaia SPSS; Creeze o baz de date SPSS i s defineasc corect variabilele.

Statistica se refer la msurare i probabiliti. Cuvntul statistic, provine din latinescul statista i desemna, pe vremuri, persoanele care se ocupau cu afacerile statului, care numrau populaia sau realizau alte aciuni ce ajutau statul s gestioneze mai bine politica de taxe i costurile rzboaielor. n perioada medieval, prin statistic, armatorii i calculau costurile echiprii corbiilor, incluznd n calculele lor i probabilitatea ca acestea s fie atacate de pirai sau de a naufragia (Lungu, 2001). Foarte multe dintre conceptele statistice au avut rdcini n alte discipline, unele complet diferite de matematic. Astfel, corelaiile provin din biologie, din analiza asemnrii dintre copii i prinii lor. Analiza de varian provine din fabricile de bere i se folosea la alegerea tipului potrivit de orz i a timpului optim de fermentare, astfel nct berea s aib un anumit gust. Mai interesant este faptul c nsi teoria msurrii i are originea n psihologie, mai precis n studiul inteligenei i al personalitii umane, iar testele

15

Statistic aplicat n tiinele socio-umane

neparametrice provin din sociologie. Unii statisticieni ncercau chiar s demonstreze existena lui Dumnezeu cu ajutorul numerelor, iar astzi, statistica joac un rol important n viaa noastr, indiferent dac ne referim la psihologie, sociologie, tiine economice sau alte discipline. n viziunea lui T. Rotariu, statistica se axeaz n principal pe tratarea informaiilor numerice obinute la nivelul unor mulimi de entiti, informaii prelevate de la fiecare entitate n parte (sau de la o submulime) i care conduc la rezultate cu referin la ansamblu, i nu la entitile componente luate individual. (Rotariu, i alii, 2006) Operaiile statistice presupun, prin urmare, un proces de msurare. La o analiz atent, sintagma a msura un obiect nu nseamn altceva dect a msura proprietile unui obiect. Noi nu putem msura obiectele, ci, pentru a le cunoate, msurm anumii indicatori ai proprietilor acestora. Este adevrat c, n anumite tiine (fizica, chimia etc.), msurarea dobndete un caracter mai concret, deoarece obiectele i proprietile acestora sunt mai accesibile observrii directe. Putem msura cu uurin lungimea i limea unei mese (deci indicatori ai proprietilor lungime i lime ale obiectului mas), deoarece aceste dou proprieti sunt direct accesibile observaiei noastre. ns, n momentul n care discutm de anxietate, depresie, inteligen, atenie, responsabilitate, nivel de trai etc. constatm c aceste proprieti nu pot fi direct observate. Prin urmare, va trebui s deducem aceste caracteristici din observarea unor indicatori presupui ai proprietilor. Aadar, msurarea n tiinele socio-umane are un caracter subtil, care scap observrii directe. (Vasilescu, 1992) n tiinele socio-umane, noi nu cunoatem i uneori nu putem cunoate n mod precis semnificaia mrimilor pe care le determinm, iar cifrele pe care le obinem sunt aproximri mai mult sau mai puin exacte ale realitii. Acest lucru se ntmpl din cauza apariiei erorilor de msurare i a faptului c realitatea social nu are un caracter fix, ci unul fluctuant, variabil.

16

Cristian Opariuc-Dan Cantitatea n care un obiect este saturat ntr-o caracteristic nu este reprezentat printr-un punct, ci printr-un nor de puncte, care oscileaz ntr-un anumit interval, n jurul unei valori. (Vasilescu, 1992) Discutnd despre sensul termenului de a msura, acceptm definiia dat de S. S. Stevens (1959) prin care, n sensul su larg, msurarea nseamn atribuirea de numere obiectelor sau evenimentelor, potrivit unor reguli. Msurarea este, deci, o funcie prin care unui obiect i corespunde un numr i numai unul, la o anumit msurare. Aceast funcie de atribuire va trebui s fie suficient de clar, pentru a permite ca unui obiect s i se atribuie un numr i numai unul i pentru a ne permite s decidem concret i corect ce numr va fi atribuit fiecrui obiect, dar i suficient de simpl pentru a putea fi aplicat. (Vasilescu, 1992) Spre exemplu, codificarea genului biologic al subiecilor este o msurare; dac persoana este brbat, i se acord valoarea 1, iar dac persoana este femeie, i se acord valoarea 2. Observm c regula de atribuire nu permite confuzii brbatul este notat cu 1, iar femeia cu 2 , ofer o selecie exhaustiv de categorizare a oricrui element care apare n mulimea gen biologic i este suficient de simpl pentru a fi utilizat. Acesta este un proces de msurare conform definiiei lui Stevens, dei putem constata cu uurin lipsa posibilitii de ierarhizare. Nu putem construi, la acest nivel, o ierarhie a subiecilor, deoarece nivelul de msurare este unul categorial. Despre nivelurile i scalele de msurare, vom discuta ns mai trziu. Un alt exemplu de msurare l reprezint codificarea gradelor didactice: notm cu 0 preparatorul, cu 1 asistentul, 2 lectorul, 3 confereniarul, 4 profesorul. Observm, din nou, univocitatea i simplitatea regulii; ntr-o universitate, fiecare cadru didactic poate s fac parte dintr-o categorie i numai una, iar fiecare persoan se afl, la un moment dat, ntr-o asemenea categorie. n plus, observm existena unei ierarhii; confereniarul este inferior n grad profesorului i superior n grad lectorului, fr ns a se putea pre-

17

Statistic aplicat n tiinele socio-umane

ciza nici cu ct, nici de cte ori. Aceasta este ns, din nou, o problem a nivelului de msurare, pe care o vom aborda ulterior.

I.1 VariabileAm stabilit deja faptul c obiectele pot fi cunoscute prin msurarea indicatorilor proprietilor sale. Aadar, obiectele devin msurabile prin stabilirea caracteristicilor lor. Caracteristica este, prin urmare, o particularitate, o nsuire a unui obiect sau fenomen, care constituie obiectul msurrii. De exemplu, o mas poate fi caracterizat prin lungime, lime, nlime, greutate, form, culoare etc. Toate acestea constituie caracteristici prin care ncercm s descriem ct mai exact obiectul msurat. Cu ct avem mai multe asemenea caracteristici, cu att obiectul se contureaz mai precis. Caracteristicile prin care obiectul este descris, poart numele de variabile. O variabil reprezint un concept-cheie n statistic i nu este altceva dect un nume pentru un element a crui principal proprietate este aceea c variaz, i modific valorile. Prin aceast proprietate principal, variabilele se disting de constante, elemente care au valori fixe. De exemplu, ntr-un studiu efectuat pe o populaie general, genul biologic poate fi o variabil dac lotul de cercetare cuprinde att brbai, ct i femei. Dac, ns, intenionm s desfurm o cercetare numai pe femei, atunci genul biologic devine o constant, deoarece nu prezint proprietatea principal a variabilelor, aceea de a-i modifica valorile. Modalitatea de realizare a unei variabile (modul n care i sunt atribuite valorile) constituie un eveniment ntmpltor (probabilistic), de aceea variabila se mai numete i variabil aleatoare sau variabil stocastic. De exemplu, nlimea unor elevi dintr-o clas este o variabil care poate lua aleatoriu diferite valori pe care le pot avea elevii la aceast caracteristic. Desigur, valorile pe care le poate lua variabila se grupeaz ntr-un anumit interval de valori. Nu putem vorbi de elevi de 5 centimetri, dup cum nu putem gsi elevi de 5 metri. De aceea, putem considera c nlimea elevilor din 18

Cristian Opariuc-Dan clasa a X-a este o variabil stocastic ce poate lua aleatoriu valori din domeniul de definiie 150 190 centimetri. Aadar, elementele de baz care compun domeniul de definiie al unei variabile aleatorii poart numele de valori sau scoruri. n momentul n care aceste elemente sunt numere, variabila se mai numete i variabil aleanumeric. O variabil aleatorie exprim, aadar, variaia unei caracteristici. Dup cum am spus, nlimea elevilor este o variabil alea-numeric; la fel greutatea acestora, capacitatea toracic, temperatura corpului sau numrul de la pantofi. Nu toate variabilele sunt ns alea-numerice. Culoarea ochilor, culoarea prului, genul biologic, tipul temperamental etc. sunt variabile ale cror valori nu pot fi exprimate prin numere, dei sunt i ele variabile aleatorii. Asemenea variabile nu sunt considerate variabile alea-numerice. Toate aceste caracteristici pot fi msurate, nregistrate i catalogate i, de asemenea, difer de la o persoan la alta sau de la o situaie la alta. De aceea, toate aceste concepte le vom include sub denumirea generic de variabile. De ce suntem ns att de interesai de aceste variabile, de ce sunt importante i la ce ne folosesc? Rspunsul este acela c nu putem fi mulumii doar cu ideea c variabilele variaz. Ne intereseaz, n principiu, s nelegem de ce variaz, cnd i n ce condiii variaz, care este efectul acestor variaii ale lor. Pentru aceasta, variabilele vor trebui mai nti definite, apoi nregistrate i, n final, supuse analizei, crend premisele extragerii unor concluzii i, implicit, ale generalizrii. Realizarea unei variabile prin intermediul scorurilor creeaz posibilitatea abordrii conceptului statistic de frecven. Frecvena reprezint rspunsul la ntrebarea ci indivizi, cte cazuri populeaz fiecare categorie a

19

Statistic aplicat n tiinele socio-umane

variabilei sau, aa cum exprim T. Rotariu, numrul de indivizi statistici care populeaz fiecare clas a caracteristicii (Rotariu, i alii, 2006). Dac ne propunem s nregistrm persoanele dintr-o sal de curs sub aspectul culorii ochilor vom avea, spre exemplu, 20 de persoane cu ochi albatri, 13 persoane cu ochi verzi, 15 persoane cu ochi negri i 50 de persoane cu ochi cprui. Valorile care nsoesc categoriile variabilei culoarea ochilor reprezint tocmai frecvenele mai exact frecvenele absolute, deoarece mai pot exista frecvene exprimate procentual (frecvene relative) i frecvene cumulate, despre care vom discuta n urmtorul capitol. O variabil aleatoare poate fi discret sau continu, dup cum mulimea de definiie a valorilor sale poate fi numrabil (discontinu) sau nenumrabil (continu) 1.

I.1.1 Variabile discreten cazul variabilelor discrete (care, n funcie de nivelul de msurare, pot fi categoriale sau ordinale vom vedea imediat ce nseamn acest lucru), mulimea de definiie a valorilor sale este o mulime discontinu (elementele sale pot fi numrate), iar ntre dou valori nu poate fi interpus, n permanen, o valoare intermediar. Spre exemplu, variabila culoarea ochilor este o variabil discret; ea poate lua valorile: negru, cprui, verde, albastru i putem clasifica subiecii ntr-una din aceste patru categorii. Iat c, mulimea de definiie a valorilor acestei variabile este una numrabil (are doar patru valori) i nu avem posibilitatea ca ntre dou valori s includem, n permanen, o a treia valoare intermediar. Nu putem vorbi despre ochi verde-albastru i apoi verde-verdealbastru i aa mai departe, la infinit.

1

Exist mai multe clasificri ale variabilelor. Le vom aborda atunci cnd situaia o va impune, pentru a nu complica inutil, la acest nivel, expunerea noastr.

20

Cristian Opariuc-Dan Un asemenea exemplu de variabil este o variabil discret nominal sau variabil discret categorial, deoarece permite doar clasificri, fr a putea vorbi de o relaie de ordine sau ierarhie ntre valorile pe care le poate lua respectiva variabil. Un alt exemplu de variabil discret este variabila grad didactic. Ea poate lua valorile: preparator, asistent, lector, confereniar, profesor. Sigur c, i n acest caz, putem clasifica subiecii n funcie de gradul lor didactic. Nu putem ns vorbi, nici acum, de o nou categorie intermediar, de exemplu asistent-lector i apoi asistent-lector-lector i aa mai departe, lucru care i confer caracterul discret. De data aceasta ns, putem pune o relaie de ordine ntre valorile variabilei. Putem vorbi de faptul c asistentul este inferior n grad lectorului sau profesorul este superior n grad confereniarului. O asemenea variabil se numete variabil discret ordinal sau variabil discret de rang.

I.1.2 Variabile continuin cazul variabilei continui, mulimea de definiie a valorilor sale este una continu, ne-numrabil. Aceste variabile se mai numesc i variabile scalare (de interval sau de raport). n aceast situaie, ntre dou valori ale variabilei continui putem gsi, oricnd, o valoare intermediar. Cu alte cuvinte, o caracteristic continu poate lua orice valoare ntre anumite limite. Spre exemplu, variabila nlimea subiecilor este o variabil de tip scalar (continuu). ntre un subiect de 178 centimetri i un subiect de 180 centimetri, putem gsi, oricnd, un subiect de 179 centimetri, apoi ntre unul de 178 i unul de 179 putem gsi un subiect de 178,5 centimetri i aa mai departe, la infinit. O asemenea variabil se caracterizeaz prin faptul c, tipul de date msurat de aceasta este format din uniti de dimensiune egal. Ca exemplu de variabile continui putem da greutatea subiectului, intervalul de tip petrecut

21

Statistic aplicat n tiinele socio-umane

pentru a juca jocuri agresive pe computer etc. Astfel, nlimea subiecilor o putem msura n centimetri, greutatea n kilograme, timpul n minute sau ore, toate acestea fcnd referire la un nalt nivel de precizie, cu valori zero absolute i posibiliti de construire a scalelor de raport putem spune, de exemplu, c un subiect este de dou ori mai greu dect altul sau de dou ori mai nalt.

I.2 Scale (nivele) de msuraren capitolul anterior am vzut c variabilele discrete pot fi categoriale sau de rang; cele continui de interval sau de raport. Dac acceptm definiia lui Stevens, atunci putem intui c msurarea poate fi realizat la diferite niveluri de msurare, organizate ca n figura de mai jos. Nivelul nominal de msurare (clasificare) i nivelul ordinal (de rang sau ierarhic) se grupeaz n scala neparametric (nonmetric) de msurare. Nivelul de interval (intervale egale) i nivelul de raport (proporii) formeaz scala parametric (metric) de msurare.

Raport Parametric Cuantificare Interval Ordinal Neparametric Nominal Figura 1.1 Reprezentarea schematic a nivelurilor de msurare

Observm c termenul de cuantificare dobndete sens ncepnd cu scala ordinal, deoarece abia la acest nivel ne permitem realizarea unor ierarhii. Scala nominal nu accept cuantificare, ci doar clasificare. Se cuvine s facem meniunea c proprietile scalelor sunt incrementale, adic proprietile unui nivel inferior de msurare sunt valide i la un nivel superior de msurare, ns nu i reciproc.

22

Cristian Opariuc-Dan

I.2.1 Scale neparametriceGrupeaz scala nominal i scala ordinal, scale la nivelul crora putem pune, cel mult, o relaie de ordine ntre nivelurile variabilei. Nu putem vorbi de parametri i nici de statistici metrice. Nu are sens calculul mediei sau al altor indicatori din sfera metric, deoarece nu putem stabili un interval (cu ct) fa de care o valoare este mai mare n comparaie cu alta.

I.2.1.1 Scala nominal (de clasificare)Reprezint primul nivel de msurare i const n clasificarea obiectelor n funcie de existena sau inexistena unei caracteristici. Aceast clasificare presupune existena unor categorii disjuncte, astfel nct fiecare obiect s-i gseasc locul ntr-o categorie i numai n una (Vasilescu, 1992). Pentru ca scala s aib sens, trebuie s existe cel puin dou categorii. O variabil nominal cu dou categorii poart numele de dihotomie sau clasificare dihotomic. Dac exist mai multe categorii, vorbim despre polihotomii sau clasificri multiple (polihotomice). mprirea subiecilor n brbai i femei reprezint o clasificare dihotomic. mprirea n funcie de profesie, culoarea ochilor sau a prului, grupa sanguin etc. sunt tot attea exemple de polihotomii. n mod curent, folosim aceast scal n vederea categorizrii subiecilor n funcie de unul sau mai multe criterii (de obicei, n cercetarea psihologic sau sociologic) sau atunci cnd culegem date n urma anchetei sau observaiei. Proprieti ale scalei: Transformrile permise la nivelul acestei scale sunt (Vasilescu, 1992): o Redenumirea atribuirea unor noi nume (n loc de masculin/feminin putem spune brbat/femeie);

23

Statistic aplicat n tiinele socio-umane

o Permutarea schimbarea ordinii elementelor, deoarece nu se poate stabili o ierarhe ntre valorile unei variabile pe aceast scal. Aceast proprietate este caracteristic doar scalei nominale. Operaii statistice permise n principal, operaiile de baz, derivate din numrare, astfel: o Frecvena absolut i relativ (procentul), cte observaii au fost incuse n fiecare categorie (de exemplu 25 de brbai i 40 de femei sau 30% brbai i 78% femei); o Valoarea modal (modul), categoria cu frecvena cea mai mare (de exemplu, din 200 de subieci, 150 au ochi albatri, aceasta fiind categoria cu frecvena cea mai mare modul); o Verificarea statistic prin 2 procedeu de comparare a frecvenelor i de verificare, dac diferenele dintre ele sunt ntmpltoare sau, din contra, semnificative, nentmpltoare; o Coeficieni de corelaie ntre dou variabile cu dou valori fiecare, coeficientul , coeficientul tetragoric, coeficientul de contingen, toate bazndu-se pe lucrul cu frecvene absolute sau relative.

I.2.1.2 Scala ordinal (de rang sau topologic)Reprezint al doilea nivel de msurare i const n ierarhizare, n funcie de mrimea unei caracteristici, fr ns a se putea preciza cu ct un nivel ierarhic este superior sau inferior altuia i nici de cte ori. Spre deosebire de scala nominal (ale crei proprieti le include), scala ordinal permite stabilirea unei relaii de ordine ntre date.

24

Cristian Opariuc-Dan Strict vorbind, acesta este nivelul la care ne situm n tiinele socioumane, n general, i n psihologie, n particular. Din perspectiva statisticii, ca disciplin matematic, nu putem vorbi de medie, abatere standard sau ali indicatori care presupun un nivel de msur cel puin de interval, deoarece o asemenea scal nu exist n domeniul socio-uman la o rigoare (nc) demonstrabil matematic. Scorurile testelor de inteligen, aptitudini, personalitate sunt variabile, avnd valori simplu ordonate la un nivel ordinal de msur. Un test de inteligen nu ne arat, de fapt, cantitatea de inteligen a subiecilor, ci ierarhizarea acestora, poziia, rangul pe care l ocup fiecare ntr-o populaie. Lansarea, n 1905, a scalei metrice a inteligenei de ctre Alfred Binet, se fcea cu urmtoarea meniune din partea autorului: calitile intelectuale nu se msoar precum lungimile, nu satisfac cerina aditivitii; scala permite un clasament ierarhic ntre inteligene diferite i, din raiuni practice, acest clasament echivaleaz cu o msurare. (Radu, i alii, 1993). Autorul a sesizat foarte bine limitele msurrii n tiinele socio-umane nc din acea perioad, limite pe care muli psihologi actuali astzi le ignor. Nu ne mir faptul c matematicienii consider aplicarea statisticii n psihologie ca fiind defectuoas. Datorit faptului c, dac ne-am limita doar la o msurare pe scala ordinal, metodologia psihologic i psihosociologic ar fi srcit de aportul statisticilor parametrice (tari), pentru anumite msurtori se accept utilizarea scalei de interval prima care permite calculul mediei i a abaterii standard ns, acest lucru se face printr-un important compromis statisticomatematic (Clocotici, i alii, 2000). Variabile precum gradul didactic, gradul militar, nivelul de educaie se gsesc la acest nivel de msurare, deoarece pe lng posibilitatea clasificrii, a includerii unui individ ntr-o categorie, avem i posibilitatea ordonrii categoriilor, putnd afirma c o categorie este superioar sau inferioar alteia.

25

Statistic aplicat n tiinele socio-umane

Dac lum, de exemplu, gradele militare, putem spune c ntr-o unitate se afl 30 de locoteneni, 10 maiori i 60 de cpitani sau 15% locoteneni, 5% maiori i 30% cpitani (ne aflm la un nivel nominal de msur), dar i c maiorii sunt superiori n grad cpitanilor sau locotenenii sunt inferiori n grad cpitanilor (nivelul ordinal de msur). Nu putem preciza ns cu ct i nici de cte ori o categorie este superioar sau inferioar alteia. Nu putem afirma c doi locoteneni fac ct un cpitan. De asemenea, este absurd s vorbim despre medie. Care este media dintre un locotenent i un cpitan??!!! Proprieti ale scalei: Aa cum am admis anterior, proprietile specifice scalei ordinale le includ pe cele ale scalei nominale, astfel nct la cele ale scalei anterioare se adaug (Vasilescu, 1992): Transformrile permise la nivelul acestei scale sunt cele care nu afecteaz ordinea iniial. Astfel de operaii sunt ridicarea la putere sau, inversa ei, extragerea de radicali. Din aceste operaii, deriv: Operaiile statistice permise: o Frecvena sumelor n valori cumulate i procentuale, valorile categoriale i categoriale procentuale, valori categoriale centile, valori de mprtiere; o Procedee bazate pe date categoriale: testul semnului, Mann-Whitney, Wilcoxon, Kolmogorov-Smirnov, analiza de varian Kruskal i Wallis; o Coeficieni de corelaie de rang: Spearman, Kendall.

I.2.2 Scale parametriceCuprind scalele de interval i de raport. ncepnd de la acest nivel, putem vorbi de statistici parametrice sau metrice. Are sens de acum s calculm

26

Cristian Opariuc-Dan media, abaterea standard sau ali indicatori care fac parte din statisticile numite i statistici tari.

I.2.2.1 Scale de interval (intervale egale)Reprezint al treilea nivel de msurare i deriv din scala ordinal, la care se adaug proprietatea c intervalele dintre un nivel de valori i altul sunt egale. Este un tip de msurare n care distanele dintre treptele scrii sunt distane egale sub aspectul cantitii caracteristicii de msurat. n psihologie, practic, nu ntlnim aceast scal dect n domeniul psihofiziologiei, n care nregistrm timpi de reacie, numr de erori, fora unei reacii etc. Acest nivel de msurare ne permite s rspundem la ntrebarea cu ct este mai mare, dar nu i la ntrebarea de cte ori, deoarece la nivelul acestei scale nu ntlnim un punct zero absolut, ci unul arbitrar ales. Un exemplu clasic de scal de interval este scala de temperatur Celsius. Dup cum tim, punctul de zero grade Celsius este un punct arbitrar ales, definit ca punctul de nghe al apei la presiunea atmosferic de la nivelul mrii. Intervalele acestei scale sunt egale, ceea ce ne permite s spunem c apa dintr-o gleat este mai cald cu 10 grade Celsius dect apa dintr-o alt gleat, dar nu i c apa este de dou ori mai cald, deoarece punctul zero nu este un zero absolut. Prin analogie, ne putem referi i la scorurile unui test de inteligen, dac admitem compromisul menionat n subcapitolul anterior. Putem spune c, ntre un subiect cu un IQ de 60 i unul cu un IQ de 120 exist o diferen de 60 de puncte, dar nu c cel cu un IQ de 120 este de dou ori mai inteligent dect cel cu un IQ de 60. n definitiv, nu avem o inteligen zero. La o privire mai atent, observm i compromisul efectuat. Performana la un test de inteligen depinde de mai muli factori, nu numai de cei legai de inteligen. Astfel, intervin motivaia, memoria, atenia, condiiile de examen etc. Este cert c cel de al doilea subiect este mai inteligent dect primul (ne situm

27

Statistic aplicat n tiinele socio-umane

acum la nivel ordinal), ns a afirma, chiar i c este mai inteligent cu 60 de uniti pe scala IQ, consider c este hazardat (la nivel de interval). n definitiv, la o reexaminare a celor doi subieci cu acelai test exist o probabilitate foarte mare ca aceast distan, de 60 de puncte, s nu se pstreze. Iat o msurare care, dei la prima vedere pare la nivel de interval, totui, mai exact, o putem situa la nivel ordinal. Diferena dintre scala inteligenei i scala temperatorilor Celsius este totui foarte mare. Mai mult, intervalele pe o scal IQ sunt doar aparent egale. Diferena de 5 puncte IQ dintre un subiect cu un IQ de 60 i unul cu un IQ de 65 are cu totul alt sens n comparaie cu diferena dintre un subiect cu un IQ de 120 i altul cu un IQ de 125 i, de asemenea, se deosebete de diferena dintre doi subieci cu IQ 100 i 105. Cele 5 puncte IQ nu sunt, n aceste cazuri, egal distanate. Proprieti ale scalei: Transformrile permise la acest nivel sunt cele de tip liniar, caracteristice ecuaiei y=ax+b unde a>0 iar y este valoarea transformat, x valoarea care urmeaz a fi transformat, a constanta de extindere i b constanta de deplasare (Vasilescu, 1992). o Deplasri prin mrirea punctului zero relativ la o alt valoare (modificarea constantei b); o Extinderi amplificarea sau diminuarea intervalelor scalei cu acelai factor (modificarea constantei a), fr s deteriorm rezultatul msurtorilor (de exemplu, transformarea din note z n stanine sau sten). Operaii statistice permise: o Calculul mediei aritmetice, al abaterii standard, al boltirii i al simetriei; o Statistici parametrice: testul t Student, F Fisher, analiza de varian; 28

Cristian Opariuc-Dan o Toate tipurile de corelaii: r Pearson, raport de corelaie (R), coeficientul de regresie (b). Anumite operaii statistice, dei presupun scala de interval, necesit i ndeplinirea altor condiii, i anume respectarea unei legi de distribuie, n general legea distribuiei normale (gaussiene). Prin urmare, n analiza datelor, pe lng cerina nivelului de interval se impune i analiza distribuiei datelor nregistrate. Transformrile permise la nivelul acestei scale au o importan practic deosebit atunci cnd procedm la normalizarea unei distribuii statistice de date.

I.2.2.2 Scala de raport (proporii)Ultimul nivel de msurare i cel mai precis este reprezentat de scala de raport care are toate caracteristicile unei scale de interval la care se adaug existena unui zero absolut. n sfrit, aceast scal ne permite s rspundem la ntrebarea de cte ori, deoarece existena unui zero absolut face posibil compararea proporiilor. De exemplu, dac un subiect are greutatea de 60 de kilograme, iar un altul 120 kilograme, putem spune c al doilea subiect este cu 60 de kilograme mai greu dect primul, dar i c al doilea subiect este de dou ori mai greu dect primul, ambele afirmaii avnd sens. Din nefericire, un asemenea nivel de precizie nu poate fi atins n tiinele socio-umane, deoarece este imposibil s gsim o variabil care s admit un zero absolut. Este absurd s vorbim de o inteligen zero, de o emotivitate zero, de depresie sau anxietate zero. Proprieti ale scalei (Vasilescu, 1992): Transformrile permise la acest nivel sunt cele de tip multiplicativ, caracteristice ecuaiei y=ax unde a>0, iar y este valoarea transformat, x valoarea ce va fi transformat, iar a constanta de extindere. Observm dispariia constantei b, constanta de de29

Statistic aplicat n tiinele socio-umane

plasare, deoarece punctul zero este un punct de referin absolut i nu unul arbitrar ales. La fel ca i n cazul scalei de interval, putem amplifica sau diminua intervalul (prin modificarea constantei a) ns nu putem opera deplasri, deoarece acest lucru ar determina scderea preciziei ctre o scal de interval (am stabili un punct zero arbitrar i nu absolut) Sunt permise toate operaiile statistice, inclusiv calculul mediei geometrice i al coeficientului de variaie.

I.3 Prezentare general SPSS for Windows2SPSS sub Windows reprezint un pachet de programe interactiv, de utilitate general, destinat analizelor de date i include multiple faciliti i tehnici de natur statistic. Pachetul de programe SPSS sub Windows reprezint o aplicaie care folosete ntreaga funcionalitate a sistemului

Figura 1.2 Lansarea programului SPSS for Windows

Figura 1.3 Fereastra logo SPSS for Windows

de operare Windows, regsind n structura sa utilizarea mausului, ferestrele redimensionabile i scalabile, meniuri derulante, casete de dialog etc. Dei majoritatea utilizatorilor vor fi complet satisfcui utiliznd doar interfaa grafic pe care SPSS o pune la dispoziie, totui pachetul de programe dispune i de un puternic limbaj de comenzi prin care se pot realiza activiti automate (scripturi) ce deter-

2

Pe parcursul acestei prezentri, unele imagini sunt din SPSS 12.0 for Windows. Acest lucru nu incomodeaz n utilizarea altor versiuni. Toate imaginile utilizate reprezint marc nregistrat SPSS Inc.

30

Cristian Opariuc-Dan min eficientizarea aciunilor utilizate n mod frecvent sau efectuarea unor aciuni complexe, indisponibile n interfaa grafic (SPSS, 2001). Programul SPSS, la fel ca orice alt aplicaie sub sistemul de operare Windows, indiferent de versiunea acestuia, la instalare i creeaz un grup de pictograme (iconuri) n seciunea Programs a meniului Start din sistemul de operare Windows. Pentru a putea lansa n execuie aplicaia, va trebui ca mai nti s efectuai clic cu maus-ul pe butonul start al desktop-ului Windows, buton situat de obicei n partea din stnga jos a ecranului. Apoi mergei la seciunea Programs i se va deschide o nou list care conine toate programele instalate n calculatorul dumneavoastr (ei bine, cel puin programele la care avei acces dumneavoastr). n aceast list, cutai grupul de programe SPSS for Windows, grup n care vei gsi pictogramele de lansare ale aplicaiei SPSS. Probabil c ai identificat deja n acest grup de programe pictograma numit SPSS for Windows. Aceasta este imaginea pe care va trebui s facei clic pentru a porni aplicaia. 3 SPSS este un program extrem de complex. Lansarea acestuia debuteaz cu prezentarea unei ferestre introductive, denumit i fereastr logo. Ea cuprinde informaii despre versiunea programului (n cazul nostru, SPSS 12.0 Standard), deoarece exist i versiuni server, mai complexe, versiuni demonstrative (ca aceea pe care o putei descrca gratuit de la http://www.spss.com) sau student pentru nvare etc., precum i despre posesorul licenei de utilizare a acestui produs informatic. Se cunoate faptul c, n conformitate cu legea dreptuluiFigura 1.4 Fereastra introductiv3

Desigur, n situaia n care SPSS for Windows este deja instalat pe calculatorul dumneavoastr. Dac nu avei instalat SPSS for Windows, putei descrca o versiune demonstrativ de 30 de zile de pe site-ul http://www.spss.com Asigurai-v c avei o conexiune suficient de rapid i de stabil la Internet, deoarece fiierul este destul de mare (aproximativ 160 MB)

31

Statistic aplicat n tiinele socio-umane

de autor i protecia creaiilor intelectuale, un produs software poate fi utilizat doar n cazul n care se posed o licen de utilizare pentru acesta, altfel riscndu-se pedepse severe, contravenionale sau de natur penal. Dup cteva secunde, fereastra de prezentare se dezactiveaz, iar aplicaia prezint o interfa prietenoas prin care ne invit s trecem la treab. Putem n aceast etap s lansm n execuie un program tutorial care ne va forma abilitile de baz n vederea utilizrii acestui pachet informatic complex; de asemenea, putem trece direct la introducerea datelor sau putem rula o cerere predefinit, se poate crea o nou cerere de date sau se poate deschide o baz de date existent, situaie n care va trebui s precizm locaia acesteia. Nu n ultimul rnd, putem deschide o baz de date ntr-un alt format, de exemplu Excel, Statistica sau SAS, iar SPSS va ti s converteasc aceste date pentru a le face disponibile. Exist, de asemenea, n Figura 1.5 Fereastra principal SPSS partea de jos a acestui formular introductiv, o caset denumit Dont show this dialog in the future. Dac o vei bifa, avei posibilitatea ca, la viitoarea lansare a produsului, s nu se mai afieze formularul, caz n care programul va trece direct n fereastra principal SPSS. Desigur, selectarea unei opiuni dintre cele prezentate mai sus nu nseamn i executarea acesteia de ctre SPSS. Pentru a lansa n execuie opiunea aleas, va trebui apsat, obligatoriu, butonul OK. Apsarea butonului Cancel indic programului c trebuie s prseasc formularul introductiv i

32

Cristian Opariuc-Dan s lanseze fereastra principal SPSS n modul de lucru configurat pentru o nou baz de date. n acest moment, nu ne intereseaz niciuna dintre opiunile predefinite, astfel nct vom apsa butonul Cancel. Iat c formularul prezentat mai sus a disprut, fcnd loc ferestrei principale SPSS. S privim cu atenie aceast nou interfa cu utilizatorul. Ca orice alt aplicaie Windows, SPSS posed o bar de titlu bara albastr din partea de sus a ferestrei , n partea stng a acesteia afindu-se mesajul Untitled SPSS Data Editor. Acest mesaj ne informeaz c ne aflm n fereastra de date (editare a datelor) din SPSS i c baza de date nu a fost nc salvat (n momentul salvrii, textul Untitled este nlocuit cu numele fiierului salvat pe disc). n partea dreapt a barei de titlu, avem cele trei butoane clasice ale oricrei ferestre Windows: butonul de minimizare sau de transfer al aplicaiei n bara de sarcini, butonul de maximizare extindere a aplicaiei pe ntregul ecran sau de restaurare a aplicaiei la dimensiunile iniiale i butonul de nchidere a aplicaiei, acel buton n form de X. Sub bara de titlu, se afl meniurile, serii de etichete purtnd fiecare un nume (n limba englez), prin intermediul crora putem comanda SPSS i putem efectua operaiile i prelucrrile de care acesta este capabil. Nu vom insista acum asupra explicrii tuturor meniurilor, acest lucru l vom face pe parcursul prezentului curs. Bara de meniuri este urmat de bara de instrumente mici butoane cu aspectul unor pictograme care, n general, dubleaz anumite funcii din meniuri, funcii mai des folosite. SPSS prezint o bar de instrumente dinamic, adic aspectul butoanelor i, desigur, funcionalitatea acestora se modific relaionat contextului n care ne aflm. De exemplu, vom avea anumite butoane n modul de introducere a datelor i alte butoane n modul de definire a variabilelor ori n modul de afiare a rezultateFigura 1.6 Seciunea de editare a datelor lor analizelor de date.

33

Statistic aplicat n tiinele socio-umane

Dup bara de instrumente, apare seciunea de editare a datelor. Aceasta este format dintr-o parte needitabil, informativ, partea din stnga, n care se afieaz n permanen poziia celulei active (celul pe care am selectat-o). Formatul acestui identificator este un numr urmat de dou puncte i apoi numele variabilei (spre exemplu, 8:time nseamn c suntem poziionai pe rndul 8 a opta nregistrare a variabilei timp). Partea editabil arat ntotdeauna valoarea acestei variabile n poziia specificat (n cazul nostru, la rndul 8 al variabilei timp se afl valoarea 34). Cea mai mare parte a ferestrei principale SPSS este dedicat seciunii de date. Observm c datele, n SPSS, sunt organizate tabelar, pe linii i coloane, analog altor aplicaii mai cunoscute, cum ar fi foile de calcul tabelar (Excel) sau bazele de date (FoxPro sau Access). Liniile (nregistrrile) sunt identificate prin numere, iar coloanele reprezint variabilele. ntr-o baz de date goal, toate variabilele sunt denumite implicit var, iar aceast denumire este scris cu culoarea gri, reprezentnd faptul c acestea nu au fost nc definite. Navigarea prin baza de date se poate face cu cele dou casete de derulare (numite i lifturi sau controale de derulare), situate n partea dreapt, respectiv n partea de jos a ferestrei de date, la fel ca n orice program Windows. Seciunea de date conine, n partea din stngajos, doi marcatori de seciune foarte importani: Data View i Variable View. Aceste elemente permit coFigura 1.7 Marcatomutarea ntre modul de vizualizare a datelor dintr-o rii de seciune baz de date (seciunea Data View) i modul de definire a variabilelor (seciunea Variable View). n partea de jos a programului SPSS, se afl bara de status cu dou seciuni: seciunea de informaii, n partea stng, unde se afieaz scurte instruciuni despre diferitele funcii ale meniurilor sau ale barei de instrumente, i seciunea de stare a procesorului SPSS unde se afieaz informaii refe-

34

Cristian Opariuc-Dan ritoare la rularea unor sarcini mari consumatoare de timp. n general, nceperea unei prelucrri statistice se poate face doar n condiiile n care vedei mesajul SPSS Processor is ready n aceast seciune. Prsirea programului SPSS se poate face fie apsnd butonul de nchidere al aplicaiei X din colul din dreapta sus al ferestrei principale, fie folosind meniul File i apoi Exit. Dac ai fcut prelucrri de date sau modificri n baza de date, programul v va solicita mai nti salvarea documentului, ca msur de protecie mpotriva pierderii de informaie. Despre salvare, ns, discutm n subcapitolul urmtor.

I.3.1 Bazele de date creare, salvare, deschidereDup ce ne-am familiarizat cu interfaa programului SPSS, este momentul s vedem cum putem deschide o baz de date existent i care sunt elementele componente ale acesteia. SPSS vine nsoit de o serie de baze de date demonstrative n scopul facilitrii procesului de nvare. Pe parcursul acestor exerciii, vom folosi, din raiuni de compatibilitate, aceste exemple de baze de date oferite de ctre productorii programului SPSS. Deschiderea unei baze de date n scoFigura 1.8 Deschiderea pul efecturii prelucrrilor statistice se poate unei baze de date face prin mai multe metode, rmnnd la latitudinea dumneavoastr i potrivit experienei pe care o avei s alegei metoda care v convine mai mult. Prima metod este aceea prin care apelm la meniul File (Fiier) i apoi poziionm cursorul maus-ului pe submeniul Open (Deschide). Apare o list de unde putem deschide o baz de date (Data), o procedur de sintax

35

Statistic aplicat n tiinele socio-umane

(Syntax) o foaie de rezultate (Output), un set de comenzi (Script) sau un alt tip de fiier (Other). Pentru a deschide o baz de date, va trebui selectat opiunea Data. Observai c fiecare dintre aceste opiuni este urmat de puncte de suspensie (). ntotdeauna cnd vei ntlni aceste puncte de suspensie alturi de o comand Windows (nu doar n SPSS, ci i n orice program Windows), va trebui s tii c acea comand v invit la dialog. Adic se va deschide o nou fereastr, de unde va trebui s alegei ceva sau s furnizai anumite informaii programului pentru a putea executa comanda respectiv. O alt metod prin care putei deschide o baz de date este folosirea aa- numitelor taste rapide. De obicei, meniurile sunt nsoite de combinaii de taste prin care putei efectua direct o anumit sarcin. n loc s apelm la meniul File, apoi Open i apoi Data, putem pur i simplu s inem apsat tasta Ctrl n timp ce apsm tasta O (de la Open). O astfel de combinaie se noteaz prin Ctrl+O, notaie pe care o vom folosi pe ntreg parcursul acestui curs. Vom observa c aceast combinaie are acelai efect ca i parcurgerea primei metode, avantajul fiind acela c este mult mai rapid. A treia metod apeleaz la numitele taste fierbini (hot-keys). O tast fierbinte este o tast folosit n combinaie cu tasta Alt. Dac vei privi cu atenie meniurile, vei putea observa c unele litere sunt subliniate de exemplu, n meniul File este subliniat litera F. innd apsat tasta Alt i apsnd apoi tasta F, vom obine deschiderea meniului File, ca i cnd am efectua clic pe acesta. n mod analog, notarea acestei combinaii se face folosind convenia Alt+F. Deci, pentru a deschide o baz de date, putem folosi combinaiile Alt+F deschiderea meniului File i apoi Alt+O deschiderea submeniului Open, iar, n final, Alt+A accesarea opiunii Data. Aceasta este, dac dorii, o navigare prin meniuri fr maus. Ultima metod se refer la folosirea barei de instrumente pentru a deschide o baz de date. Pur i simplu apsai pe primul buton de pe bara de instrumente, acela care are aspectul unui dosar deschis.

36

Cristian Opariuc-Dan Indiferent de metoda folosit, efectul va fi acelai: deschiderea unei casete de dialog, din care putei alege baza de date pe care o vei ncrca (v mai amintii nota referitoare la punctele de suspensie?). S analizm puin aceast nou fereastr. n partea de sus avem o list derulant intitulat Look in: Apsnd sgeata orientat n jos din partea dreapt a acestei casete, vom putea alege directorul n care este localizat baza noastr de date. Observm c directorul curent este directorul aplicaiei (SPSS), iar n seciunea de sub Figura 1.9 Fereastra de selectare a fiierului n vederea deschiderii aceast caset este afiat coninutul acestui dosar. Putei astfel selecta orice director n care avei fiiere recunoscute de SPSS, pentru a le putea afia i/sau deschide. Alturi de caseta Look in, se afl o serie de butoane care controleaz navigarea prin structura de directoare de pe discul dumneavoastr. Primul buton, cel de forma unei sgei orientate n partea stng, permite navigarea la ultima aciune efectuat. Dac, de exemplu, din directorul SPSS v-ai poziionat pe directorul Windows, apsnd acest buton vei reveni din nou n directorul SPSS. La prima deschidere a acestei casete de dialog, butonul este inactiv, deoarece nu ai efectuat nc nici o aciune care s fie nregistrat. Al doilea buton, de forma unui dosar cu o sgeat orientat n sus, permite navigarea ascendent prin arborele de directoare. La o prim apsare, v vei deplasa n directorul Program Files, la urmtoarea v vei situa n directorul rdcin C i aa mai departe. Cel de-al treilea buton permite crearea unui nou director n directorul curent. Apsnd pe el, vei putea crea un nou director, numit New Folder, denumire pe care o vei putea modifica dup dorin. n sfrit, ultimul buton controleaz modul n care se afieaz pictogramele n caseta central. Putei alege vizualizarea pictogramelor n format mare, mic, sub form de list sau list detaliat.

37

Statistic aplicat n tiinele socio-umane

Fereastra central afieaz, dup cum am menionat, structura de subdirectoare i fiiere a directorului curent. Putei efectua dublu clic pe numele unui director pentru a afia coninutul acestuia sau pe numele unui fiier pentru a-l deschide n mod direct (fr a mai apsa butonul Open). Dac efectuai doar un simplu clic, numele fiierului selectat va fi afiat n caseta File name i va trebui s folosii apoi butonul Open pentru a-l deschide. Caseta derulant Files of type reprezint un filtru pentru fiierele afiate. Dac o vom deschide, efectund clic pe sgeata orientat n jos din partea dreapt a acesteia, vom putea alege ce anume tip de fiiere s se afieze n seciunea central. Observm c, dei directorul SPSS conine mai multe fiiere, sunt afiate doar fiierele cu extensia .sav, adic fiierele care conin baze de date SPSS, deoarece n aceast caset de filtrare s-a ales extensia .sav. Putem alege alte extensii de fiiere care sunt afiate, de exemplu formatul Excel (.xls) sau dBase (.dbf), iar SPSS va afia doar fiierele ce au aceast extensie. Deschiderea propriu-zis a unui fiier se face fie efectund clic pe acesta i apsnd butonul Open, fie efectund dublu clic pe numele fiierului. Spre exemplu, vom ncrca baza de date Cars din directorul implicit SPSS, baz de date ce reprezint un inventar al diferitelor tipuri de maini i al caracteristicilor acestora. Dup deschidere, observm c s-a modificat aspectul ferestrei principale SPSS. n primul rnd, n bara de titlu a aprut mesajul Cars SPSS Data Editor, mesaj ce ne informeaz c am deschis baza de date Cars i c ea este pregtit pentru analiz. De asemenea, constatm c structura acesteia este compus din opt variabile, fiecare dintre ele reprezentnd o anumit caracteristic a mainilor. Ultima variabil, variabila Filter_$ este o variabil intern folosit de programul SPSS pentru o filtrare anterioar a datelor, variabil pe care ne propunem s o tergem. Cum? Efectund clic pe numele acesteia. Observm c ntregul coninut al coloanei Filter_$ s-a selectat. n continuare, apsm tasta Delete, situat pe tastatur, n partea dreapt a grupului principal de taste, iar variabila a fost eliminat mpreun cu toate datele 38

Cristian Opariuc-Dan acesteia. Felicitri. Iat i prima dumneavoastr intervenie real n SPSS. Dup cum bine tim, orice prim intervenie ntr-un program nseamn o tergere a ceva. Nici noi nu puteam face excepie! Baza de date deschis de ctre dumneavoastr a fost afiat n seciunea Data view, fapt care ne atrage atenia c n acest mod putem afia i urmri coninutul datelor din baza de date. Dac vom efectua clic pe seciunea Variable view, vom intra n modul de definire a datelor. Dup cum ne spune i numele seciunii, aici putem vizualiza i edita denumirea, tipul i alte informaii referitoare la variabile. Ca s folosim un limbaj mai tehnic, dac n Data view ne aflm n seciunea datelor propriu-zise, n Variable view ne aflm n seciunea meta-datelor, adic n seciunea informaiilor despre date, unde putem interveni asupra structurii lor interne. Vom clarifica imediat, prin cteva exemple, aceste aspecte. Astfel, prima variabil, denumit mpg este o variabil numeric, ce accept maximum 4 caractere (adic cifre ntre 0 i 9999) i fr zecimale.

Figura 1.10 Seciunea de definire a variabilelor

Numele mpg nu este ns un nume intuitiv i nu ne putem da seama cu precizie la ce se refer aceast variabil. Din pcate, doar versiunile de SPSS de la 13.0 n sus accept nume de variabile cu mai mult de 8 caractere, ns nu se permite includerea spaiilor sau a altor semne de punctuaie n denumirea acestora i de aceea va trebui s fim foarte restrictivi n momentul n care le crem. Pentru a nelege mai uor la ce anume se refer o anumit variabil,

39

Statistic aplicat n tiinele socio-umane

avem posibilitatea de a o eticheta, adic de a include un text descriptiv asociat numelui ei. n cazul nostru, eticheta variabilei ne informeaz c mpg se refer la Miles per Gallon, adic la consumul automobilului exprimat n distana pe care acesta o poate parcurge cu un galon de combustibil. Urmtoarea seciune prezint valorile pe care le putem defini pentru respectiva variabil. Iat, n cazul variabilei origin, care se refer la ara de producie a mainilor, observm c s-a asociat valoarea 1 pentru mainile de producie american, valoarea 2 pentru cele de producie european i valoarea 3 pentru cele japoneze. n spaiul destinat definirii variabilelor, avem, de asemenea, posibilitatea de a controla modul de tratare a cazurilor lips, alinierea datelor n cadrul celulelor i definirea tipului de variabil nominal, ordinal i scalar. Efectund clic pe aceste seciuni, ai observat c, uneori, apare n partea dreapt a acestora fie un buton cu punctele de suspensie care va deschide o caset de dialog unde se pot controla parametrii valorilor acceptate, fie un buton de incrementare/decrementare cu ajutorul cruia putei mri, respectiv micora o anumit valoare, fie o caset de selecie sgeata orientat n jos prin care putei deschide o list, de unde s selectai anumite valori. Exerciiu practic: n exerciiul care urmeaz vom traduce pur i simplu n romnete structura acestei baze de date i vom salva baza de date sub un nou nume, Masini (atenie, nu folosii diacriticele romneti n scrierea literelor, prin urmare, n acest caz, nu folosii litera , ci s. Deci nu vom salva cu Maini, ci Masini), ntr-un director nou creat avnd calea C:\Exercitii SPSS (aceeai meniune referitoare la diacritice). n cazul primei variabile, numele va rmne acelai, iar noi vom modifica doar descrierea. Vom da clic n seciunea Label, acolo unde se afl afiat textul Miles per Gallon i vom scrie textul Mile per galon.

40

Cristian Opariuc-Dan A doua variabil se numete engine. Vom schimba numele acesteia n cilindree (ne-am ncadrat n 8 caractere), fcnd clic n coloana Name i scriind noul nume. Eticheta va deveni, pentru a doua variabil, Capacitate cilindric, pe care o vei modifica dup exemplul primei variabile. Procedm la fel n cazul variabilelor 2, 3, 4, 5 i 6, lsnd traducerea din englez n romn la latitudinea dumneavoastr. Atenie, ns, la acel maximum de 8 caractere cnd redenumii o variabil. Variabila numrul 7 se refer la ara de origine a mainilor. O vom redenumi origine i vom modifica, desigur, eticheta. Exist ns, la acest nivel, un element n plus, i anume coloana Values. V mai amintii probabil de mainile americane, europene i japoneze. Dac Figura 1.11 Etichetarea variabilelor de nivel nominal i ordinal vom da clic pe celula corespunztoare coloanei Values pentru aceast variabil, constatm apariia unui mic buton cu puncte de suspensie n partea dreapt a celulei. Apsnd acest buton se deschide o nou fereastr, fereastra de configurare a valorilor asociate. Vorbeam anterior despre maini de producie american, european i japonez. n aceast caset vedem lista acestor asocieri n partea de jos. n stnga listei, exist 3 butoane: Add cu ajutorul cruia putem crea o nou asociere, Change prin care putem modifica o asociere selectat i Remove care terge, elimin asocierea selectat. Noi ne-am propus s traducem aceast structur de date n limba romn. Vom efectua clic pe prima asociere 1 = American. Constatm c, automat, n caseta Value a aprut cifra 1, iar n caseta Value Label textul American. Putem deduce cu uurin c valorii 1 i s-a asociat textul American(apropo, la ce nivel de msurare ne aflm aici i ce fel de variabil este aceasta?). De asemenea, s-a activat butonul Remove, SPSS presupunnd c dorim s eliminm aceast asociere din moment ce am selectat-o. Pentru a modifica textul, efectum clic 41

Statistic aplicat n tiinele socio-umane

n interiorul casetei Value Label i scriem n loc de American, America (mai bine spus, tergem un n). De data aceasta, se activeaz i butonul Change, SPSS depistnd modificarea efectuat i presupunnd c vom dori s o i aplicm efectiv. Dac vei apsa acest buton (Change), vei constata c eticheta s-a modificat din 1 = American n 1 = America. Felicitri. Ai realizat prima traducere. Acum procedai la fel pentru Europa i Japonia. Desigur, oricnd putei include o nou asociere. Tastai cifra 4 n caseta Value (deoarece ar urma 4 n ordine logic) i textul Romnia n caseta Value Label, apoi apsai butonul Add care ai observat c a devenit activ. Astfel ai asociat valoarea 4 mainilor de producie romneasc. n momentul n care ai terminat de efectuat toate asocierile, apsai butonul OK pentru a le memora i a prsi formularul. Reinei c apsarea butonului Cancel duce la prsirea formularului fr memorarea asocierilor. Apare totui o ntrebare. De ce s folosim aceste asocieri n loc de a scrie pur i simplu n baza de date America, Europa i Japonia? n primul rnd, pentru c este mai uor. Imaginai-v c avei de introdus un numr de 3000 de date n baza dumneavoastr de date. n loc s scriei de fiecare dat un text format din 6-8 caractere, vei tasta pur i simplu 1 atunci cnd v referii la America, 2 cnd v referii la Europa i 3 cnd v referii la Japonia. SPSS va ti, de fiecare dat, n urma asocierilor realizate n etapa anterioar, la ce anume se refer 1, 2 i 3. n al doilea rnd, dei 1, 2 i 3 sunt doar nite etichete pentru America, Europa i Japonia, se preteaz mult mai bine la prelucrrile statistice ulterioare, fiind date numerice. Procedai la fel i cu ultima variabil, referitoare la numrul de cilindri ai motorului, pentru ca, n final, s obinei structura complet a bazei de date. Prin acest exerciiu, ne-am deprins cu unele elemente ale configurrii structurii bazei de date. n continuare, vom salva baza de date modificat sub

42

Cristian Opariuc-Dan denumirea de Masini. Directorul folosit va fi C:\Exercitii SPSS (atenie la diacritice!). Putei alege meniul File i opiunea Save sau Save as, putei apsa combinaia de taste Ctrl+S sau Alt+F, Alt+S sau putei apsa butonul de salvare de pe bara de instrumente (acela care are o dischet drept pictogram). Dar atenie! Diferena dintre opiunea Save i Save as este aceea c, folosind Save, se vor salva modificrile efectuate tot n baza de date iniial, n cazul nostru baza de date Cars. Noi ne-am propus s salvm baza de date sub un alt nume i ntr-un alt loc, deci nu vom putea folosi dect opiunea Save as (Salveaz ca). Se va deschide caseta de salvare a unei baze de date care are acelai aspect ca i caseta de deschidere a unei baze de date, cu excepia butonului Open, n acest caz denumirea acestuia fiind Save. Folosind cunotinele dobndite anterior, va trebui s v poziionai cu ajutorul casetei Figura 1.12 Fereastra de salvare a Save in (echivalenta casetei Look in unei baze de date din fereastra de deschidere a bazei de date) n directorul rdcin C:\, s creai un nou director folosind butonul de creare a unui director din acest formular pe care s-l denumii Exerciii SPSS, s efectuai dublu clic pe acesta pentru a-l deschide i s introducei numele bazei de date Masini n caseta File name. Apsai apoi butonul Save pentru a salva efectiv fiierul pe disc. Ai reuit, nu-i aa? n urma acestor operaiuni, n bara de titlu SPSS va aprea mesajul Masini SPSS Data Editor, care ne informeaz c programul a salvat cu succes baza de date pe disc i a activat-o. Reamintim faptul c, la crearea unei noi baze de date, folosirea oricror opiuni de salvare (meniul File, butonul de pe bara de instrumente sau

43

Statistic aplicat n tiinele socio-umane

tastele rapide) duce la apariia ferestrei Save as, deoarece fiind o baz de date nou, acesteia nu i-a fost atribuit nc un nume printr-o operaie de salvare. Putei cu uurin identifica dac o baz de date are un nume (a fost salvat) sau nu, urmrind bara de titlu. Bazele de date noi sunt identificate prin mesajul Untitled SPSS Data Editor, n timp ce bazele de date salvate au afiat numele acestora n bara de titlu. Ai observat c, la lansarea programului SPSS, acesta creeaz automat o baz de date nou i nedefinit i ateapt din partea noastr definirea variabilelor i salvarea acesteia. Odat salvat baza de date, orice modificri efectum n ea, la salvare ele vor fi scrise automat n fiierul al crui nume este afiat n bara de titlu, fr a mai aprea fereastra de salvare de mai sus. Singura modalitate prin care putem da un alt nume bazei de date sau prin care o putem salva ntr-un alt loc este folosirea opiunii Save as. Crearea unei noi baze de date se poate face folosind meniul File, submeniul New i opiunea Data, combinaiile de taste Ctrl+N sau Alt+F, Alt+N, Alt+A. n oricare dintre aceste situaii, SPSS va crea o baz de date goal i nedefinit, la fel ca n cazul lansrii programului. Ca exerciiu, folosind cunotinele dobndite, v propunem crearea unei noi baze de date avnd urmtoarea structur i salvarea acesteia sub numele de IQ n directorul C:\Exercitii SPSS:

Variabila nume va fi de tip ir de caractere (string) i va stoca numele subiecilor, toate celelalte variabile fiind numerice. Exist dou definiii de asocieri, i anume variabila sexul (1-Masculin 2-Feminin) i scoala (1-Primare 2-Gimnaziu 3-Liceul 4-Postliceala 5-Facultate)

44

Cristian Opariuc-Dan Dup construirea structurii de date, procedai la salvarea fiierului n locul precizat. Folosind cunotinele teoretice acumulate, precizai tipul fiecrei variabile create n acest exerciiu. Ne propunem n continuare aprofundarea definirii variabilelor n SPSS. Pentru aceasta, ne vom folosi de baza de date IQ creat i salvat n exerciiul anterior. n seciunea Data View, am remarcat deja prezena a zece caracteristici prin care se poate defini o variabil n SPSS. Prima dintre acestea se refer la numele variabilei (Name), caracteristic ce nu presupune prea multe explicaii. Numele variabilei reprezint modul n care aceasta va fi apelat n toate prelucrrile efectuate folosind baza de date. Nu putem ns s nu precizm c SPSS impune o serie de restricii n denumirea variabilelor (versiunile mai mici de versiunea 13): n primul rnd, numele acestora s nu depeasc 8 caractere, variabilele cu nume mai lungi de 8 caractere nefiind acceptate. Apoi, nu pot fi folosite spaii sau semne de punctuaie n denumirea variabilelor, putnd fi ns folosit linia de subliniere pentru cazurile n care dorim s abreviem o variabil format din dou cuvinte. De exemplu, dac avem o variabil care se refer la anul naterii, o vom putea abrevia denumind-o an_naste. Astfel, lungimea ei este de 8 caractere, fiind acceptat de SPSS, iar cele dou cuvinte componente le-am separat printr-o linie de subliniere, fapt de asemenea acceptat de SPSS. Nu conteaz dac scriem numele variabilelor cu litere mari sau cu litere mici, deoarece, n final, SPSS le convertete automat n litere mici. Din punctul de vedere al primei caracteristici, baza noastr de date IQ nu creeaz probleme, fiind definite cinci nume de variabile: numele, varsta, sexul, scoala i iq. A doua caracteristic se refer la tipul de date ce va fi stocat n aceste variabile (Type), caracteristic pe care nu am abordat-o n detaliu n timpul prezentrii noastre de pn acum. Aceast seciune conine un buton cu trei puncte de suspensie, pe care l putem apsa pentru a deschide fereastra de

45

Statistic aplicat n tiinele socio-umane

configurare a tipului de date. Aceasta conine o serie de butoane de opiuni, dintre care putem selecta tipul de date pe care variabila noastr l va stoca, dup cum urmeaz: Tipul de date Numeric se refer la numere. Valorile acceptate vor fi, deci, numere, n format standard. Alegnd acest tip de date, putem stabili i dimensiunea acestora valoarea maxim pe care SPSS o poate accepta prin Figura 1.13 Stabilirea tipului de date precizarea numrului de caractere a unei variabile n cmpul Width i numrul de caractere dup virgul n cmpul Decimal Places. De exemplu, numrul maxim de caractere 3 i 2 caractere zecimale nseamn c acea variabil poate stoca valori numerice de la 0 pn la 999,99. Acest tip de date va scrie valorile numerice fr nici o separaie ntre sute i mii i folosind ca separator zecimal separatorul configurat al sistemului. Un exemplu de numr scris n acest format ar fi 78457845.57 Tipul de date Comma se refer, de asemenea, la numere i pot fi definite la fel ca tipul anterior, numai c acestea vor fi afiate folosindu-se virgula ca separator ntre valoarea sutelor i valoarea miilor i punctul ca separator al valorilor zecimale. De exemplu, o valoare numeric n acest format ar arta astfel: 9,999.89. Este, practic, formatul numeric clasic american. Tipul de date Dot identic cu tipul de date anterior, doar c se inverseaz rolul punctului i al virgulei. Relund acelai exemplu, numrul de mai sus va fi scris astfel: 9.999,89 n acest caz recunoatem formatul romnesc. Tipul de date Scientific notation se refer la modul tiinific de afiare a cifrelor, folosind litera E pentru a reprezenta puterile lui 10. Modul

46

Cristian Opariuc-Dan de configurare a dimensiunii variabilei este acelai, iar un exemplu de numr folosind aceast reprezentare poate fi 1.23E2 ceea ce semnific de fapt 123.00. Tipul de date Date se refer la date calendaristice. Alegnd aceast opiune, va trebui s configurai, selectnd din lista ce se va deschide, modul de afiare a datei calendaristice dintr-o mulime de formate care vi se ofer.calendaristice Tipul de date Dollar se refer la valori monetare, avndu-se n vedere moneda american. Putei alege i particulariza valoarea maxim pe care o poate accepta variabila din lista ce se afieaz sau putei particulariza aceast valoare, la fel ca n cazul valorilor numerice. Figura 1.14 Tipul de date

Tipul de date Custom currency permite definirea unor valori monetare particularizate, valabile pentru alte ri n afara Statelor Unite. Se poate defini forma de prezentare a variabilei i valoarea maxim acceptat, la fel ca la tipul anterior. Tipul de date String stocheaz doar iruri de caractere, cu alte cuvinte texte, fr nici o posibilitate de prelucrare statistic. Poate fi definit i aici dimensiunea maxim pe care o poate avea variabila din punctul de vedere al numrului de caractere acceptate. n cazul nostru, variabila nume este un exemplu excelent de variabil de tip string. Caracteristica a treia i caracteristica a patra a unei variabile, respectiv Width i Decimals se refer exact la valorile maxime pe care le pot accepta variabilele i la numrul de zecimale, elemente pe care le-am discutat anterior, iar aceste dou caracteristici nu fac dect s creeze o alt posibilitate de definire a variabilelor sub acest aspect.

47

Statistic aplicat n tiinele socio-umane

n cazul exemplului nostru, constatm c avem o singur variabil de tip string, variabila nume care poate accepta maxim 20 de caractere, toate celelalte variabile fiind de tip numeric; variabilele sexul i coala pot accepta doar o singur cifr fr zecimale, iar variabilele varsta i iq pot accepta 3 cifre fr zecimale. Aceast definiie permite stocarea subiecilor cu numele format din maxim 20 de litere, vrsta poate lua valori de pn la 999, suficient, deci, pentru scopurile noastre, acelai lucru fiind valabil i pentru coeficientul de inteligen. Sexul i nivelul de colarizare accept doar o singur cifr, deoarece am convenit s asociem valoarea 1 cu sexul masculin i 2 cu sexul feminin, n mod analog procednd i cu nivelul de colarizare. Datele au fost definite ca numerice pentru a crea posibilitatea interpretrii lor ulterioare, cunoscndu-se faptul c datele de tip string nu pot fi interpretate statistic. Urmtoarea caracteristic, caracteristica Label, permite includerea unei denumiri mai intuitive a variabilei, prin care s poat fi mai uor identificat i recunoscut. Astfel, variabilei nume i putem da eticheta Numele subiecilor, variabila iq o putem eticheta drept Coeficientul de inteligen i aa mai departe. Putem include orice etichet descriptiv dorim pentru numele unei variabile, cu condiia ca lungimea acesteia s nu depeasc 255 de caractere. Deci atenie la scrierea romanelor n descrierea variabilelor!!! Aceast caracteristic mai are ns o funcie important; SPSS include eticheta variabilelor n rapoartele finale rezultate n urma prelucrrii datelor. Dac creai un tabel de frecven, SPSS nu va afia numai numele variabilei, de exemplu iq, ci va include i descrierea acesteia, Coeficientul de inteligen, fcnd astfel mult mai estetice i mai inteligibile foile de raport. Caracteristica Values am discutat-o pe larg n seciunile anterioare i nu vom mai reveni asupra ei. Menionm doar c ea permite clasificri (deci variabile categoriale) i asocieri de valori. Spre exemplu, putem asocia valoarea 1 sexului masculin i valoarea 2 sexului feminin, pentru a putea introduce

48

Cristian Opariuc-Dan mai uor datele i pentru a putea efectua prelucrri statistice la nivel de variabile nominale. Caracteristica Missing permite definirea modului n care vor fi tratate valorile lips din cadrul unei variabile. Uneori, este important s cunoatem de ce lipsesc valori dintr-o variabil. Datele lips se pot datora, spre exemplu, faptului c subiectul refuz s rspund la o anumit ntrebare sau fapFigura 1.15 Tratarea valorilor lips tului c ntrebarea nu este adresat acelui subiect. Iat dou situaii care ar necesita un tratament separat al valorilor lips. Datele pe care le vei trata n mod explicit ca date lips pot fi supuse apoi unei analize statistice separate, fiind iniial excluse din cele mai multe calcule. Un alt exemplu, frecvent ntlnit n chestionarele sociologice, se refer la codificarea rspunsurilor de tip Nu tiu/Nu rspund. Majoritatea cercettorilor codeaz aceste variante cu 9 sau 99. Evident, variantele incerte nu vor face obiectul prelucrrii iniiale a datelor. Folosind aceast seciune se pot include aceste valori (9 sau 99) ca valori lips, SPSS eliminndu-le din analiz. Definirea valorilor lips poate accepta trei situaii. Situaia No missing values, cnd comunicm programului c nu dorim un tratament special pentru valorile lips, acestea fiind tratate ca atare n cursul fiecrei prelucrri de date pe care o realizm, situaia Discrete missing values, cnd putem defini pn la trei valori care vor fi tratate ca valori lips n cursul prelucrrilor statistice ulterioare (de exemplu, la un chestionar cu 3 variante de rspuns, dorim ca doar rspunsurile 1 i 3 s fie luate n calcul, rspunsul 2 fiind tratat ca non-rspuns. Pentru aceasta, vom include cifra 2 n prima dintre cele trei casete ale acestei seciuni.) i situaia Range plus one optional discrete missing value, n care putem stabili un interval pentru care valorile vor fi tratate ca valori lips (spre exemplu, coeficienii de inteligen cuprini ntre 10 i 75), n plus existnd posibilitatea de

49

Statistic aplicat n tiinele socio-umane

a include i o valoare particular (discret), ca i n situaia anterioar. n exemplul nostru de baz de date, nu avem nici un motiv de a trata n vreun fel valorile lips, deci nu vom configura aceast caracteristic. Caracteristica Columns permite specificarea limii coloanei n care se vor afia valorile variabilelor n modul Data View. Implicit, coloanele au o lime egal cu 8 caractere. Putem include aici o alt valoare sau putem redimensiona limea coloanelor n modul Data View, prin tragerea cu ajutorul maus-ului a liniei de separaie dintre dou coloane. Introducerea diferitelor valori pentru aceast caracteristic permite ajustarea i redimensionarea precis a limii coloanelor. n cazul nostru, pentru variabila nume, dimensiunea implicit de 8 caractere va fi insuficient pentru prezentarea unui subiect cu numele Popescu Valentin, afindu-se doar primele 8 caractere i anume Popescu . Pentru a vedea ntregul nume, fie introducei valoarea 16 pentru caracteristica Columns a variabilei nume, fie tragei cu ajutorul maus-ului linia de demarcaie dintre coloana nume i coloana varsta, pentru a mri limea coloanei de afiare a numelui subiecilor. Aceast caracteristic, ca i urmtoarea, nu influeneaz n niciun fel modul de prelucrare a datelor, ci doar aspectul tabelului de date din Data View. Caracteristica Align controleaz modul n care sunt aliniate valorile variabilelor n tabelul de date. Putei opta pentru o aliniere la stnga, centrare sau aliniere la dreapta a valorii variabilelor n cadrul coloanelor din Data View, fr a influena n vreun fel modul de prelucrare al variabilelor. Ca regul general, variabilele de ti