Top Banner
1 STATISTICA DESCRITTIVA Si occupa di predisporre i metodi per sintetizzare con opportune grandezze le caratteristiche salienti dei fenomeni. La descrizione passa attraverso due fasi: - la formazione dei dati statistici: si raccolgono i dati di fatto riguardanti il fenomeno in esame - il trattamento matematico dei dati: i dati vengono sintetizzati in grandezze che colgono gli aspetti più rilevanti del fenomeno. Come per qualunque disciplina, anche per accostarsi allo studio della statistica è necessario costruirsi una terminologia, un vocabolario, tra le altre per le seguenti ragioni: - indicare gli enti appartenenti alla stessa classe con il medesimo nome - a volte gli enti sono complessi: una volta attribuito un nome, attraverso una definizione rigorosa, ad un ente (o ad un insieme di enti) complesso quanto si voglia,
70

Statistica I

Nov 07, 2015

Download

Documents

jayzus

statistica 1
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
  • 1

    STATISTICA DESCRITTIVA Si occupa di predisporre i metodi per sintetizzare con opportune grandezze le caratteristiche salienti dei fenomeni. La descrizione passa attraverso due fasi: - la formazione dei dati statistici: si

    raccolgono i dati di fatto riguardanti il fenomeno in esame

    - il trattamento matematico dei dati: i dati vengono sintetizzati in grandezze che colgono gli aspetti pi rilevanti del fenomeno.

    Come per qualunque disciplina, anche per accostarsi allo studio della statistica necessario costruirsi una terminologia, un vocabolario, tra le altre per le seguenti ragioni: - indicare gli enti appartenenti alla stessa

    classe con il medesimo nome - a volte gli enti sono complessi: una volta

    attribuito un nome, attraverso una definizione rigorosa, ad un ente (o ad un insieme di enti) complesso quanto si voglia,

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 2

    possibile comunicare in modo economico. Il nome trascina con s in modo sintetico anche tutti i dettagli dellente in questione, senza fatica per chi si appropriato della definizione.

    Formazione dei dati statistici Per poter raccogliere i dati di fatto necessario determinare la popolazione di riferimento e le unit statistiche. Le unit statistiche sono le entit reali che interessa esaminare. La popolazione statistica linsieme delle unit reali che interessa esaminare. Non sempre agevole determinare le unit statistiche. Se si volesse, ad esempio effettuare unindagine sul grado distruzione, sullet e sullo stato civile dei disoccupati residenti nel comune di Milano, sarebbe necessario avere un criterio in base al quale stabilire se una persona disoccupata o no. Tali criteri (definizioni) possono variare da indagine ad indagine. Nel fare confronti fra dati statistici bene sempre accertarsi che essi

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 3

    facciano riferimento ad unit statistiche definite allo stesso modo. La variet delle definizioni riferentisi a fenomeni o eventi analoghi nuoce alla comparabilit dei dati ed al buon nome delle indagini statistiche. Tramite organismi internazionali si cerca di uniformare le definizioni relative ai fenomeni pi rilevanti in modo da poter avere dati nazionali confrontabili a livello internazionale. Individuate le unit statistiche, si possono formare i dati statistici, procedimento che passa attraverso quattro fasi: a) la formazione dei casi statistici b) la loro rilevazione c) lo spoglio dei casi rilevati d) la preparazione dei dati e delle tabelle

    statistiche. Non sempre, per, nello svolgere una ricerca i dati statistici vengono rilevati ad hoc. Talvolta i dati statistici sono gi raccolti da altri ricercatori o da altre istituzioni ad

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 4

    esempio lISTAT in occasione dei censimenti. In questi casi non sempre i dati gi disponibili sono pienamente adeguati ai fini dellindagine. a) formazione dei casi statistici Una volta individuata e determinata la popolazione, si scelgono le caratteristiche o caratteri che si ritengono rilevanti per gli scopi dellindagine: le unit statistiche che si osservano sono portatrici di svariati caratteri, alcuni dei quali sono utili ai fini dellindagine, altri no. Prendere in considerazione una caratteristica non rilevante appesantisce inutilmente lindagine e spesso fonte di confusione. Omettere una caratteristica rilevante potrebbe inficiare lindagine, in quanto quella caratteristica potrebbe spiegare un certo aspetto del fenomeno in oggetto. Per ogni carattere prescelto necessario prevedere le modalit con le quali esso pu manifestarsi. Il ricercatore deve innanzi tutto individuare, fra le infinite caratteristiche che

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 5

    si possono rilevare, quelle che ritiene utili ai fini dellindagine ed immaginare che le altre non esistano. Solo astraendo dalle caratteristiche ritenute non interessanti possibile raggruppare le unit della popolazione in classi (insiemi) omogenee, relativamente ai caratteri e alle modalit considerate. Due unit statistiche portatrici delle stesse modalit dei caratteri presi in considerazione si considerano uguali, vale a dire che si possono raggruppare in una stessa classe, anche se sono portatrici di modalit differenti per quei caratteri non presi in considerazione. I casi statistici non sidentificano con le unit statistiche reali della popolazione (ad es. individui, nuclei famigliari, aziende, etc) ma solo con i caratteri e le modalit dei quali sono portatrici. Nelle indagini per questionario, per ciascuna domanda, va effettuata la scelta fra domanda a risposta chiusa, domanda a risposta aperta, domanda a risposta mista.

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 6

    Nella domanda a risposta chiusa le risposte sono fissate in anticipo, cosicch allintervistato non data n libert di espressione n possibilit di scelta diversa da quella che offre il questionario. I vantaggi di questa tipologia sono molteplici: ad ogni risposta si pu far corrispondere un codice numerico, il che facilita loperazione di spoglio; possibile classificare rapidamente lunit intervistata in una precisa categoria di analisi; le domande a risposta chiusa sono assai utili per la conoscenza degli avvenimenti passati o presenti e hanno la possibilit di funzionare da filtro. Esempio: se hai risposto S a questa domanda (filtro), rispondi anche alla successiva. Le domande a risposta aperta non prevedono risposte prefissate e lasciano, quindi, piena libert allintervistato nella scelta del contenuto e della forma della risposta. Esse permettono di affrontare la quasi totalit degli argomenti (anche i problemi pi delicati), ma

  • 7

    possono essere causa di errori di interpretazione (della domanda da parte dellintervistato e/o della risposta da parte del ricercatore). Nelle domande a risposta mista non tutte le risposte sono prefissate; rispetto alle domande a risposte chiuse, esse permettono risposte pi complete e pi articolate col rischio, talvolta, di gonfiare eccessivamente la risposta Altro. Queste domande possono essere pre-codificate solo parzialmente (in quanto alle risposte non prefissate pu essere data una codifica solo a posteriori). Quanto alla forma con cui porgere le domande bene prestare attenzione: - a non utilizzare parole a doppio senso o

    ambigue, ma ricorrere a espressioni semplici e di preciso significato

    - a non porre sotto forma di domanda diretta loggetto dellindagine

    - a non dare per scontati fatti che potrebbero non sussistere

  • 8

    - a non formulare domande troppo lunghe, per il fatto che, quanto pi sono lunghe, tanto minore la validit delle relative risposte

    - a non mettere nel questionario troppe domande per non stancare lintervistato, rischiando di ridurre la validit del questionario

    - a intercalare domande impegnative con domande pi semplici, al fine di tener desta lattenzione dellintervistato

    - a disporre con cura le domande del questionario, in quanto la loro disposizione pu avere influenza sui risultati dellindagine.

    La lista delle modalit di un carattere deve soddisfare due propriet: a) essere esaustiva b) essere esclusiva, ovvero tale che le sue

    modalit siano esclusive. I caratteri si suddividono in due categorie: a) caratteri quantitativi b) caratteri qualitativi.

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 9

    Si dice quantitativo un carattere le cui modalit esprimono quantit o misure espresse numericamente. Esempi ne sono il numero di figli per famiglia, il reddito familiare, il peso dei coscritti. I caratteri quantitativi si dividono in discreti e continui. Sono discreti i caratteri le cui modalit possono assumere solamente un numero finito di valori. Si tratta per lo pi di caratteri che vengono rilevati tramite conteggio: ad es. il numero di locali per appartamento, il numero di errori tipografici di una pagina di libro, ecc I caratteri quantitativi continui possono assumere bench solo ipoteticamente - tutti i valori compresi in un intervallo: ad es. laltezza dei coscritti, il peso dei neonati, ecc Si dice qualitativo un carattere le cui modalit indicano categorie, attributi, e sono espresse per lo pi da vocaboli, espressioni verbali e simili. Sono qualitativi il sesso, lo stato civile,

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 10

    il settore di attivit economica, il tipo di diploma. Un ricercatore quando fissa le modalit di un carattere e indica i criteri di appartenenza alle stesse costruisce una scala. La scala usata per individuare le modalit di un carattere non parte del carattere stesso. Essa infatti scaturisce meramente dalla sua definizione operativa. Esempi: entit di un terremoto. In termini generali e semplificati per un determinato aspetto di un fenomeno un procedimento di misurazione consiste in un insieme di operazioni che consente, data una manifestazione di un fenomeno, di associare allaspetto di interesse una modalit o un valore su una prefissata scala. Si hanno quattro tipologie di scale: 1) scala nominale: per due generiche

    modalit della scala, a e b, sussistono solo le relazioni mutuamente esclusive di eguaglianza o di diversit: ( ) ( )baba =

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 11

    2) scala ordinale: le modalit costituiscono un insieme ordinato; per due generiche modalit della scala, a e b, sussiste necessariamente una delle relazioni mutuamente esclusive a maggiore di b, ovvero eguaglia b, ovvero minore di b:( ) ( ) ( )bababa

    3) scala ad intervalli: le modalit costituiscono un insieme numerico ordinato di valori numerici definiti a meno di una trasformazione lineare del tipo

    0, >+= xy ; ne consegue che anche le differenze sono intrinsecamente ordinate, nel senso che se a, b, c e d sono modalit della scala in ogni caso sussiste un delle relazioni dcba

    4) scala di rapporti: le modalit costituiscono un insieme ordinato di valori positivi e sono definite a meno di una trasformazione di proporzionalit del tipo

    0, >= xy , corrispondente allarbitrariet della scelta dellunit di misura; ne

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 12

    consegue che lo zero univocamente definito, o come si suole dire, oggettivo.

    (Seguono esempi) I diversi tipi di scala formano una gerarchia. Una scala ordinale possiede tutte le caratteristiche di una scala nominale ed in pi ha la caratteristica di essere ordinale. Una scala ad intervalli possiede tutte le caratteristiche delle scale nominali e ordinali ed in pi possiede ununit di misura. Infine la scala di rapporti oltre allunit di misura ha uno zero oggettivo. Tale gerarchia permette, ad esempio, di estendere i metodi specifici delle scale nominali anche alle scale ordinali ed alle scale ad intervalli e di rapporti. Non possibile invece estenderli alle scale nominali per limpossibilit di ordinare le modalit. Vale la pena di osservare che, sebbene tali estensioni siano necessarie, qualora non esistano metodi appropriati per il livello di scala in esame, in questo modo non si utilizza totalmente linformazione contenuta nei dati.

  • 13

    b) rilevazione dei casi statistici Dicesi rilevazione statistica la constatazione, caso per caso, della presenza o dellassenza dei vari caratteri con le rispettive modalit, e la sistematica annotazione di ciascun reperto. Tale operazione in stretto collegamento con le tecniche delle singole discipline e pu essere effettuata o tramite osservazione dei fatti esistenti tali osservazioni possono essere molto semplici o molto complicate e possono richiedere luso di strumenti sofisticati, ad es. telescopi in astronomia e microscopi in biologia oppure attraverso losservazione dei fatti che vengono provocati sperimentalmente in laboratorio. Nel contesto delle scienze sociali le rilevazioni si possono classificare in complete, incomplete e pi che complete. Sono complete le rilevazioni che permettono di raggiungere tutte le unit statistiche della popolazione; incomplete quelle tramite le quali non possibile raggiungere tutte le unit statistiche; pi che complete quelle nelle quali

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 14

    una unit statistica pu essere raggiunta pi duna volta. Esempio di questultimo caso si ha quando sindaga sui nuclei familiari intervistando i figli: se sintervistano due fratelli, il nucleo familiare raggiunto due volte nellambito della medesima rilevazione. Si pu distinguere fra indagini nelle quali possibile riconoscere la parentela, da indagini nelle quali ci non possibile (ad es. questionario anonimo). c) spoglio dei casi rilevati d) preparazione dei dati e delle tabelle

    statistiche Esempio: classificazione dei 232 intervistati durante la lezione dell8.10.99 (DUET-DUSI) secondo il sesso e il tipo di diploma. Non rispondenti: 3 SD LC LS LL RG ITIS GEO TUR AL TOT M F

    1 6

    42 25

    2 29

    16 26

    11 3

    3 1

    14 20

    5 25

    94 135

    TOT 7 67 31 42 14 4 34 30 229

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 15

    DISTRIBUZIONI DI FREQUENZE Dicesi distribuzione di frequenze linsieme del numero di unit statistiche (frequenze) che si hanno in corrispondenza delle modalit di un carattere. La distribuzione di frequenza costituisce la pi completa descrizione dei fenomeni oggetto di studio. Alcuni esempi. - Innanzi tutto le distribuzioni marginali della

    tabella precedente. - Distribuzione del carattere (qualitativo)

    Luogo di residenza degli intervistati durante la lezione dell8.10.99 (DUET-DUSI) in possesso della maturit scientifica.

    Non rispondenti: 1 Luogo di residenza Frequenze

    Milano Provincia di Milano

    Lombardia escluso Milano e provincia Nord Italia Lombardia esclusa

    Centro e Sud Italia

    12 31 16 5 2

    66

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 16

    - Distribuzione del carattere (quantitativo discreto) Voto di maturit (convertito in centesimi) degli intervistati durante la lezione dell8.10.99 (DUET-DUSI) in possesso della maturit scientifica. Non rispondenti:3

    Voto di maturit Frequenze 60 61 62 63 64 65 66 67 68 70 71 72 74 75 77 78 83 89

    15 2 8 3 2 5 2 4 3 7 3 3 2 1 1 1 1 1

    64

    - Per la popolazione precedente degli intervistati durante la lezione dell8.10.99

    jacoporovatiEvidenziato

  • 17

    (DUET-DUSI) in possesso della maturit scientifica, riclassificazione in classi del carattere Voto di maturit.

    Voto di maturit Frequenze 60

    61-65 66-70 71-76 77-89

    oltre 89

    15 20 16 9 4 0

    64

    - Distribuzione del carattere (quantitativo continuo) reddito annuo lordo dichiarato (in milioni di lire) dei capifamiglia di 200 nuclei famigliari di un condominio.

    Reddito annuo lordo dichiarato

    Frequenze

    Meno di 10 10 20 20 25 25 35 35 55 55 75

    Almeno 75

    17 53 46 34 31 14 5

    200

    jacoporovatiEvidenziato

  • 18

    ALTRI TIPI DI DISTRIBUZIONI E bene prendere in considerazione anche le cosiddette distribuzioni di quantit, essendo esse molto impiegate nella pratica delle rilevazioni. Esempio: valore delle importazioni italiane (in milioni di lire) secondo gruppi di merci per lanno 1981.

    Gruppi di merci Valore Prodotti (primari ed intermedi) destinati allalimentazione Combustibili minerali e derivati Prodotti tessili e dellabbigliamento Prodotti metallurgici Prodotti meccanici Mezzi di trasporto Prodotti chimici Altri prodotti

    11732 32590 3941 7358

    12644 9537 8940

    16933 Totale 103675

    Sembra che lo scopo della tabella sia quello di mostrare la ripartizione del totale importazioni secondo i gruppi merceologici. A tale tipologia di tabelle si d il nome di distribuzioni di quantit. Vale la pena di aggiungere che i metodi statistici per trattare tali distribuzioni sono differenti da quelli impiegati per le distribuzioni di frequenze.

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 19

    Esempio: Fatturato e dipendenti delle dieci maggiori societ italiane del 1970.

    Societ Fatturato (milioni)

    Dipendenti

    Fiat Agip Esso Italsider Montecatini Edison Sip-It. Eserc. Telef. Shell Italiana Magazzini Standa B.P. Italiana Pirelli S.p.a.

    1711845 963184 708469 677698 609489 516030 504716 325679 261490 261355

    182522 6657 2377

    42060 52279 50132 3661

    21958 1303

    27700 Totale 6539955 390679

    Il fatturato e il numero di dipendenti sono caratteri rilevanti negli studi di economia industriale. Per il fatturato interessante conoscere come si distribuisce fra le societ, le quali sono in questo caso le unit statistiche. Pertanto si tratta di una distribuzione di quantit. Per quanto attiene ai dipendenti si pu concentrare lattenzione sul singolo dipendente o sulle societ. Nel primo caso i 390679 dipendenti (unit statistiche) sono

  • 20

    classificati secondo la societ di appartenenza. Nel secondo le societ (unit statistiche) sono classificate in base al numero di dipendenti (distribuzione di quantit). SERIE STORICHE E TERRITORIALI Le serie temporali o storiche sono insiemi di quantit (intensit) o di frequenze di un fenomeno che fanno riferimento alle modalit del tempo. Gli istanti o gli intervalli di tempo costituiscono le modalit (grandezze stock e grandezze flusso). Ne sono esempio la popolazione italiana censita dal 1861 al 1991, il numero di immatricolati alla Facolt di Economia dalla.a 1995-1996 alla.a. 1999-2000, il valore degli utili conseguiti da unazienda per un certo numero di esercizi. Le serie territoriali sono insiemi di quantit (intensit) o frequenze di un fenomeno che fanno riferimento a divisioni territoriali. Ne sono esempio il consumo di energia elettrica per usi domestici nelle regioni italiane, il numero di aziende di un certo settore economico nelle provincie lombarde.

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 21

    Elaborazione dei dati statistici Si gi affermato che la distribuzione di frequenza costituisce la pi completa descrizione dei fenomeni oggetto di studio. Purtroppo le informazioni presenti nelle distribuzioni si prestano poco ad essere ricordate e non permettono confronti immediati. Pertanto si cerca di effettuare processi di sintesi sulle distribuzioni, volti a determinare poche grandezze, semplici da ricordare e utili nei confronti. I metodi che permettono di descrivere le caratteristiche salienti di un solo fenomeno danno luogo alla statistica descrittiva univariata. I metodi che permettono di analizzare contemporaneamente due o pi fenomeni danno luogo alla statistica descrittiva multivariata. Non sempre i dati sono direttamente confrontabili vuoi perch troppo complessi, vuoi perch eterogenei. I metodi che

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 22

    permettono di effettuare confronti pertengono alla statistica descrittiva. Al fine di effettuare correttamente i confronti bene che siano sempre soddisfatti i seguenti due postulati. Postulato I (Confronti fra grandezze omogenee) Due intensit o frequenze di un medesimo fenomeno o carattere sono sempre comparabili fra loro, a patto che siano collegate con la variazione sistematica di una sola circostanza. Postulato II (Confronti fra grandezze eterogenee) Le intensit o frequenze di fenomeni diversi ammettono confronti a patto che essi siano riconducibili ad un unico genere, o si trovino nel rapporto di genere a specie, e purch nessuna delle circostanze concomitanti differisca sistematicamente. In forza del postulato I sono confrontabili le produzioni del bene x in Italia registrate nel 1996 e nel 1991 (varia solo il tempo), mentre

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 23

    non sono confrontabili la produzione di x in Italia nel 1996 e la produzione di x in Francia nel 1995 (variano il tempo e il territorio). Per quanto attiene al postulato II: - sempre possibile confrontare fra loro le

    frequenze delle modalit dello stesso carattere, essendo le modalit specie dello stesso genere (carattere)

    - Sono confrontabili le produzioni di grano e mais, avute nello stesso territorio e nello stesso anno e misurate nella stessa unit di misura, in quanto intensit riferentesi a specie dello stesso genere (cereali).

    Entrambi i postulati raccomandano che nel confrontare due frequenze o due intensit leventuale differenza si deve poter attribuire ad una sola circostanza. Non sempre i dati, per loro natura, permettono di operare confronti diretti. Nasce lesigenza di rintracciare procedimenti tecnici che in alcune circostanze permettono, con unopportuna trattazione dei dati, di effettuare confronti fra dati statistici anche se

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 24

    differiscono per lazione di pi duna circostanza. Possono essere daiuto i rapporti statistici, che si ottengono facendo il quoziente fra due quantit delle quali almeno una di natura statistica.

    jacoporovatiEvidenziato

  • 25

    RAPPORTI STATISTICI Si dice rapporto statistico il quoziente fra due dati, dei quali almeno uno di natura statistica. Vengono utilizzati per eliminare linfluenza di alcune circostanze che, altrimenti, non renderebbero confrontabili i dati. Un rapporto statistico indica la quota del numeratore che idealmente spetterebbe ad ununit del denominatore. I rapporti statistici pi comunemente impiegati sono: - i rapporti indici (numeri indici) - i rapporti di composizione - i rapporti di densit - i rapporti di derivazione - i rapporti di coesistenza - i rapporti di durata - i rapporti di ripetizione. Numeri indici Sono impiegati per valutare le variazioni relative di un fenomeno nel tempo o nello spazio.

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 26

    Si consideri il Numero degli Iscritti al primo anno Facolt di Economia ad una certa data (a.a. 1997/98) agosto 97.

    G. Mese

    G. Sett.

    CL DUEA DUSI DUCE DUET TOT. Dip.

    TOT. Fac

    4 6 8

    12 18 19 20 21 22 25 26 27 28 29

    L Me V

    Ma L

    Ma Me G V L

    Ma Me G V

    23 51 69 76 98 100 105 109 118 134 147 162 178 193

    4 9 11 14 19 21 23 24 27 30 34 39 43 45

    0 1 2 2 4 4 5 5 5 6 7 7 8

    10

    2 5

    10 10 10 11 11 11 12 15 16 17 20 20

    1 3 7 7

    10 10 11 13 13 16 17 22 23 23

    7 18 30 33 43 46 50 53 57 67 74 85 94 98

    30 69 99 109 141 146 155 162 175 201 221 247 272 291

    E difficile valutare dallinsieme delle cifre assolute lentit delle variazioni dei fenomeni nel tempo. Si preferisce, a tal fine, per ciascun fenomeno, istituire dei rapporti fra ciascun termine ed un altro della successione stessa, che viene assunto come base. Solitamente i rapporti cos calcolati vengono moltiplicati per 100.

  • 27

    Essendo i numeri indici dei numeri puri, cio privi di unit di misura, spesso possibile istituire tramite essi confronti sulle variazioni di fenomeni diversi. Si voglia, ad esempio confrontare lentit delle iscrizioni per il Corso di Laurea e per il DUET durante la settimana 22-29 agosto 1997, mediante i numeri indici a base fissa Venerd 22 agosto = 100.

    G. Mese

    G. Sett.

    CL DUET N.I. CL a base fissa 22/8=100

    N.I. DUET a base fissa 22/8=100

    22 25 26 27 28 29

    V L

    Ma Me G V

    118 134 147 162 178 193

    13 16 17 22 23 23

    100 113,56 124,58 137,29 150,85 163,56

    100 123,08 130,77 169,23 176,92 176,92

    (Seguono commenti) E possibile considerare anche i numeri indici a base mobile, definiti come quoziente fra una grandezza e la precedente, usualmente moltiplicato per 100. Ci ha senso per serie di dati ordinabili in base a qualche criterio: per serie temporali s, per serie territoriali no.

    jacoporovatiEvidenziato

  • 28

    Ecco le due serie di indici a base mobile: G.

    Mese G.

    Sett. CL DUET N.I. CL a base

    mobile N.I. DUET a base

    mobile 22 25 26 27 28 29

    V L

    Ma Me G V

    118 134 147 162 178 193

    13 16 17 22 23 23

    -

    113,56 109,70 110,20 109,88 108,43

    -

    123,08 126,25 129,41 104,55

    100

    (Seguono commenti) Rapporti di composizione I rapporti di composizione, detti anche rapporti di parte al tutto, si ottengono rapportando unintensit (o una frequenza) parziale a quella totale. Nellesempio precedente non si possono calcolare rispetto ai totali di colonna in quanto il numero di iscritti a una certa data conta anche gli iscritti alla data precedente. Ha senso, invece, considerare le composizioni degli iscritti relativamente a due (o pi) date. Si confrontino le composizioni degli iscritti per corso nei giorni 22 e 29 del mese di agosto.

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 29

    G. Mese

    G. Sett.

    CL DUEA DUSI DUCE DUET TOT.

    22 29

    V V

    67,43 66,32

    15,43 15,46

    2,86 3,44

    6,86 6,87

    7,42 7,91

    100 100

    (Seguono commenti) Tali rapporti permettono di fare confronti temporali o spaziali. Le frequenze relative, che saranno prese in considerazione nel seguito, sono rapporti di composizione. Rapporti di densit Dicesi rapporto di densit il quoziente fra una circostanza quantitativa, caratteristica di un fenomeno, e una dimensione del campo di osservazione. Ad esempio, la densit di popolazione il rapporto fra il numero di abitanti di un territorio e la sua superficie (pi corretto sarebbe considerare la superficie abitabile, in vece di quella ecumenica). Le frequenze specifiche, che saranno definite in seguito per caratteri quantitativi riclassificati (in classi) sono rapporti di densit.

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 30

    Ad esempio, si vogliano confrontare le frequenze del carattere (quantitativo continuo) reddito annuo lordo dichiarato (in milioni di lire) dei capifamiglia di 200 nuclei famigliari di un condominio.

    Reddito annuo lordo dichiarato

    Frequenze

    Meno di 10 10 20 20 25 25 35 35 55 55 75

    Almeno 75

    17 53 46 34 31 14 5

    200

    Il particolare rapporto di densit chiamato frequenza specifica - in questo caso assoluta il quoziente fra la frequenza di una classe e lampiezza dellintervallo ad essa corrispondente. In questo esempio si ipotizza che il reddito minimo sia pari a 3 milioni e il reddito massimo pari a 100 milioni.

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 31

    Reddito annuo lordo dichiarato

    Frequenze Ampiezza intervalli

    Frequenze specifiche

    Meno di 10 10 20 20 25 25 35 35 55 55 75

    Almeno 75

    17 53 46 34 31 14 5

    7 10 5

    10 20 20 25

    2,42 5,3 9,2 3,4

    1,55 0,70 0,20

    La frequenza (assoluta) specifica indica il numero di unit statistiche presenti in un qualunque intervallo di ampiezza unitaria della classe cui ci si riferisce. In tal modo sono possibili confronti fra frequenze riferite a classi di ampiezza differente. Si vogliano, ora, confrontare le frequenze del carattere (quantitativo discreto) Voto di maturit (convertito in centesimi) degli intervistati durante la lezione dell8.10.99 (DUET-DUSI) in possesso della maturit scientifica, ipotizzando di avere riclassificato il carattere altrimenti, i confronti sarebbero possibili direttamente. Per i caratteri discreti

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 32

    la dimensione del fenomeno costituita dal numero di modalit appartenenti a ciascuna classe.

    Voto di maturit

    Frequenze Numero modalit

    Frequenze specifiche

    60 61-65 66-70 71-76 77-89

    oltre 89

    15 20 16 9 4 0

    1 65-61+1=5

    5 6

    13 11

    15 4

    3,2 1,5

    0,31 0

    (Seguono commenti) Rapporti di derivazione Dicesi rapporto di derivazione il quoziente fra lintensit o la frequenza di un fenomeno e lintensit o la frequenza di un altro fenomeno ritenuto essere la causa od il presupposto del fenomeno di cui al numeratore. Si vogliano, ad esempio, confrontare il numero di nati vivi in due regioni italiane nel medesimo anno. Appare ragionevole rapportare tali valori al numero di abitanti della rispettiva regione.

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 33

    Rapporto di derivazione anche il quoziente fra numero di voti ottenuti da un partito politico e numero di aventi diritto al voto. Rapporti di coesistenza Esistono fenomeni in qualche modo antitetici, i quali coesistono; di interesse lo studio simultaneo di questi fenomeni. Si consideri, ad esempio, la classificazione dei 232 intervistati durante la lezione dell8.10.99 (DUET-DUSI) secondo il sesso e il tipo di diploma. Non rispondenti: 3 SD LC LS LL RG ITIS GEO TUR AL TOT M F

    1 6

    42 25

    2 29

    16 26

    11 3

    3 1

    14 20

    5 25

    94 135

    TOT 7 67 31 42 14 4 34 30 229

    Pu essere interessante esaminare il rapporto fra il numero di maschi e il numero di femmine, moltiplicato per 100.

    LC LS LL RG ITIS GEO TUR AL TOT 16,7 168 6,9 61,5 366,7 300 70,0 20,0 69,6

    Un rapporto di coesistenza il cosiddetto grado di copertura, ottenuto come quoziente

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 34

    fra il valore delle esportazioni e il valore delle importazioni, moltiplicato per 100. I rapporti di durata e di ripetizione saranno spiegati dopo aver introdotto i valori medi.

  • 35

    FREQUENZE ASSOLUTE, CUMULATE, RELATIVE, SPECIFICHE Le frequenze relative (o percentuali) si possono calcolare per tutti i tipi di caratteri considerati, indipendentemente cio dalla scala di misurazione dei caratteri stessi. In particolare, la generica frequenza relativa if data dal rapporto fra la frequenza assoluta in , con cui si presenta li-esima delle r modalit (o classi), ed il numero totale N delle osservazioni. In formula:

    Nnf ii = , per ri ,...,2,1= .

    Si verifica facilmente che 11

    ==

    r

    iif .

    Infatti: 11

    111===

    ===

    r

    ii

    r

    i

    ir

    ii nNN

    nf , essendo Nnri

    i ==1

    .

    Moltiplicando le if per 100 si ottengono le frequenze relative percentuali. Le frequenze relative e le frequenze percentuali sono utili per fare confronti fra gruppi, classificati secondo il medesimo

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 36

    carattere, ma di numerosit diversa. Esse, daltro canto fanno perdere linformazione sul numero totale delle osservazioni e risultano poco affidabili quando N molto piccolo. Risulta pertanto consigliabile: - riportare sempre assieme alle frequenze

    relative anche il numero delle osservazioni - avere molta cautela nellinterpretare

    frequenze relative calcolate su poche osservazioni.

    Classificazione dei 232 intervistati durante la lezione dell8.10.99 (DUET-DUSI) secondo il sesso e il tipo di diploma. Non rispondenti: 3 SD LC LS LL RG ITIS GEO TUR AL TOT M F

    1 6

    42 25

    2 29

    16 26

    11 3

    3 1

    14 20

    5 25

    94 135

    TOT 7 67 31 42 14 4 34 30 229

    Tipo di diploma Frequenze (assolute)

    Frequenze relative

    Frequenze percentuali

    LC LS LL RG

    7 67 31 42

    0,0306 0,2925 0,1354 0,1834

    3,06 29,25 13,54 18,34

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 37

    ITIS GEO TUR AL

    14 4

    34 30

    0,0611 0,0175 0,1485 0,1310

    6,11 1,75

    14,85 13,10

    TOTALE 229 1,0000 100,00

    Considerando i due gruppi costituiti rispettivamente da maschi e femmine, si ottiene la seguente tabella:

    Maschi Femmine Tipo di

    Diploma Freq. (ass.)

    Freq. Rel.

    Freq. perc.

    Freq. (ass.)

    Freq. Rel.

    Freq. perc.

    LC LS LL RG ITIS GEO TUR AL

    1 42 2

    16 11 3

    14 5

    0,0106 0,4468 0,0213 0,1703 0,1170 0,0319 0,1489 0,0532

    1,06 44,68 2,13

    17,03 11,70 3,19

    14,89 5,32

    6 25 29 26 3 1

    20 25

    0,0444 0,1852 0,2148 0,1926 0,0222 0,0074 0,1482 0,1852

    4,44 18,52 21,48 19,26 2,22 0,74

    14,82 18,52

    TOT. 94 1,0000 100,00 135 1,0000 100,00

    Le frequenze cumulate jN e le frequenze retrocumulate jN possono calcolarsi per caratteri rilevati su scala (almeno) ordinale non si possono calcolare per caratteri rilevati su scala nominale.

    jacoporovatiEvidenziato

  • 38

    Le frequenze cumulate sono cos definite:

    ==

    j

    iij nN

    1 per rj ...,,2,1= .

    Esse indicano, per rj ...,,2,1= , lammontare delle unit che presentano modalit o valori al pi uguali (cio minori o uguali): - alla j-esima modalit, nel caso di

    distribuzioni per modalit - allestremo superiore della j-esima classe,

    nel caso di distribuzioni per classi. Le frequenze retrocumulate sono cos definite: =

    =

    r

    jiij nN per rj ...,,2,1= .

    Esse indicano, per rj ...,,2,1= , lammontare delle unit che presentano modalit o valori almeno uguali (cio maggiori o uguali): - alla j-esima modalit, nel caso di

    distribuzioni per modalit - allestremo inferiore della j-esima classe,

    nel caso di distribuzioni per classi.

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 39

    Rapportando le frequenze cumulate o retrocumulate alla numerosit totale N si ottengono rispettivamente: - le frequenze cumulate relative, date da:

    NN

    F jj =

    - le frequenze relative retrocumulate, date da:

    NN

    F jj = .

    Ovviamente moltiplicando per 100 le frequenze relative cumulate e retrocumulate si ottengono, rispettivamente le frequenze percentuali cumulate e retrocumulate.

    Voto di maturit

    Frequenze Frequenze Cumulate

    Frequenze retrocumulate

    60 61-65 66-70 71-76 77-89

    oltre 89

    15 20 16 9 4 0

    15 15+20=35

    51 60 64 64

    64 64-15=49

    29 13 4 0

    (Seguono commenti)

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 40

    Reddito annuo lordo dichiarato

    Frequenze Frequenze cumulate

    Frequenze retrocumulate

    Meno di 10 10 20 20 25 25 35 35 55 55 75

    Almeno 75

    17 53 46 34 31 14 5

    17 70 116 150 181 195 200

    200 200-17=183

    130 84 50 19 5

    Le frequenze specifiche si possono calcolare solo nel caso di distribuzioni per classi, cio nel caso di caratteri con scala (almeno) di intervalli. Pertanto la loro determinazione riguarda i caratteri quantitativi: - discreti con dati raggruppati in classi - continui. Esse sono utili a cogliere laddensamento delle frequenze nelle singole classi. Data la loro natura, le frequenze specifiche vengono anche chiamate densit di frequenza. Le frequenze assolute (relative) specifiche sono date dal rapporto:

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 41

    - fra le frequenze assolute (relative) e lampiezza dellintervallo associato alla classe cui ci si riferisce, nel caso di caratteri continui

    - fra le frequenze assolute (relative) e il numero di modalit della classe cui ci si riferisce, nel caso di caratteri discreti.

    In tutti i casi la definizione delle frequenze specifiche presuppone che: - le frequenze assolute o relative siano

    distribuite uniformemente allinterno di ciascuna classe;

    - non vi siano classi aperte allinizio e/o alla fine della distribuzione o, in caso contrario, se ne possa determinare il limite, rispettivamente, inferiore e superiore.

    Purtroppo, i precedenti presupposti non sempre trovano riscontro nella realt. In particolare, la prima assunzione pu non valere, specialmente quando le classi sono di ampiezza elevata. Quanto al secondo presupposto, pu essere difficile, se non impossibile, specificare con

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 42

    precisione accettabile il limite inferiore e/o superiore delleventuale classe aperta iniziale e/o finale. Nonostante questi limiti, vale comunque la pena di calcolare le frequenze specifiche, al fine di avere informazioni, anche approssimative, su come varia laddensamento delle frequenze passando da una classe allaltra della distribuzione (cio al variare delle modalit del carattere).

  • 43

    RAPPRESENTAZIONI GRAFICHE Le rappresentazioni grafiche permettono di visualizzare alcune tipologie di frequenze. Quantunque nella pratica delle indagini statistiche ci simbatta in un gran numero di tipologie di grafici, in questa sede ci soccuper solo dalcune di esse, ritenute pi significative. Innanzi tutto le rappresentazioni grafiche che verranno prese in considerazione riguarderanno esclusivamente caratteri quantitativi. Ad ogni tipologia presentata verr premessa la forma analitica della funzione (matematica) che d origine al grafico. Carattere discreto Se il carattere non raggruppato in classi, la distribuzione delle frequenze (assolute) pu essere cos sinteticamente descritta:

    =

    rj

    rj

    nnnn

    xxxxX

    LL

    LL

    21

    21 (1)

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 44

    La rappresentazione grafica delle frequenze assolute, relative e percentuali consiste nel cosiddetto diagramma ad aste o a bastoncini. Vengono riportati su un piano cartesiano gli r punti di coordinate: - ( )jj nx , per quanto attiene alle frequenze

    assolute - ( )jj fx , per quanto attiene alle frequenze

    relative - ( )jj fx 100, per quanto attiene alle

    frequenze percentuali. I bastoncini sono costituiti dai segmenti verticali che congiungono lasse delle ascisse ai punti (le cui ordinate sono le frequenze). La forma analitica delle frequenze cumulate assolute la seguente:

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

    jacoporovatiEvidenziato

  • 45

    ( )

    =

  • 46

    La forma analitica delle frequenze retrocumulate assolute la seguente:

    ( )