Statistiques 1 Statistiques A. Introduction La statistique est la science qui collecte, analyse et interprète des observations relatives à un même phénomène ; elle étudie méthodiquement un ensemble de données numériques, ce qui permet de faire un état de la situation présente et passée, de présenter ces données d'une manière intelligible et surtout de servir de base à la prévision. L’étude statistique d’un ensemble de données procède en 4 étapes aux objectifs bien définis : PHASE 1 : collecte des informations (enquête, sondage, référendum…) PHASE 2 : présentation des résultats : création de tableaux et diagrammes. PHASE 3 : analyse des tableaux : recherche de valeurs caractéristiques. PHASE 4 : interprétation des paramètres : cette phase n’est plus du ressort du mathématicien, mais bien du sociologue, du politologue, etc. B. Données statistiques 1. Individus - Caractères - Modalités Vocabulaire Une population est un ensemble soumis à une étude statistique. Les individus sont les éléments de la population. L’effectif (total ) de la population est le nombre d’individus de cette population. On le note souvent n. Une série statistique est un ensemble de valeurs collectées portées sur une liste comme, par exemple, la taille des élèves d'une classe, le nombre de voix obtenues par l'ensemble des personnes sur une liste,...
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Statistiques
1
Statistiques
A. Introduction
La statistique est la science qui collecte, analyse et interprète des observations
relatives à un même phénomène ; elle étudie méthodiquement un ensemble de
données numériques, ce qui permet de faire un état de la situation présente et passée,
de présenter ces données d'une manière intelligible et surtout de servir de base à la
prévision.
L’étude statistique d’un ensemble de données procède en 4 étapes aux objectifs bien
définis :
PHASE 1 : collecte des informations (enquête, sondage, référendum…)
PHASE 2 : présentation des résultats : création de tableaux et diagrammes.
PHASE 3 : analyse des tableaux : recherche de valeurs caractéristiques.
PHASE 4 : interprétation des paramètres : cette phase n’est plus du ressort du
mathématicien, mais bien du sociologue, du politologue, etc.
B. Données statistiques
1. Individus - Caractères - Modalités
Vocabulaire
Une population est un ensemble soumis à une étude statistique.
Les individus sont les éléments de la population.
L’effectif (total) de la population est le nombre d’individus de cette population.
On le note souvent n.
Une série statistique est un ensemble de valeurs collectées portées sur une liste
comme, par exemple, la taille des élèves d'une classe, le nombre de voix obtenues par
l'ensemble des personnes sur une liste,...
Statistiques
2
Un caractère statistique est une propriété étudiée sur la population.
Il peut être qualitatif ou quantitatif.
- Un caractère est qualitatif s'il est non mesurable comme, par exemple, la
marque d'une voiture, l'activité professionnelle, la nationalité, la profession...
- Un caractère est quantitatif s'il peut se mesurer, c'est-à-dire si on peut lui
attribuer une valeur numérique comme, par exemple, l'âge, le poids, le revenu
annuel, le nombre d’enfants...
Les modalités d’un caractère sont les différentes formes qu’il peut prendre.
Un caractère quantitatif peut être discret ou continu.
- Il est discret si le caractère ne peut prendre qu’un nombre limité de valeurs
comme, par exemple, le nombre d'enfants d'une famille, le nombre de voitures
que possède une famille,...
- Il est continu si le caractère peut prendre toutes les valeurs dans un
intervalle étendu, où le nombre théorique de possibilités est énorme, voire
infini, comme par exemple, la taille d’un être humain,…
Exemples
1) Lors d’une étude statistique sur l’âge du personnel d’une entreprise, la popul ation sera
composée de l’ensemble des membres du personnel, les individus seront les per s onnes et
le caractère sera l’âge . Ce caractère est q uantitatif .
2) Si on étudie la répartition par marque du parc automobile belge, la population sera
composée d e l’ensemble de toutes les voitures immatriculées en Belgique et les individus
de la série seront l es voitures. Le caractère est l a marque.
Les modalités du caractère sont : A udi, Citroën, Mercedes. Ce caractère est q ualit atif.
3) Si on demande à chaque élève d’une classe combien d’animaux domestiques il possède, la
population sera composée e st l’ensemble des élasse, les individus sont l es é lève s,
le caractère étudié est e st le nombre d’animaux par élève.
Les modalités sont 0 , 1, 2, ….. . C’est un caractère q uantitatif.
Statistiques
3
Exercice : Les variables suivantes sont-elles qualitatives ou quantitatives ?
Dans le cas quantitatif, précise si la variable est discrète ou continue
1) Couleur de 10000 voitures passant à un carrefour un jour donné.
2) Poids de 500 singes
3) Destinations proposées dans une brochure de vacances
4) Nombre d’enfants dans une famille.
5) Statut marital d’une personne.
6) Nombre de fleurs produites par une plante.
7) Professions exercées par 1500 personnes interrogées dans la rue.
2. Echantillons
Vocabulaire
Pour diverses raisons pratiques (population trop étendue, coût de l’opération), on
réduit la collecte des données à un groupe restreint, l’échantillon, sélectionné avec
soin pour pouvoir extrapoler à l’ensemble de la population les conclusions tirées de
la seule étude de ce groupe ; il est donc crucial que l’échantillon soit représentatif de
la population, et c’est là une phase bien délicate.
Un échantillon est donc une partie représentative de la population totale.
Exemple
Lors de l’étude du revenu moyen des Belges, on sélectionne « au hasard » 1000
personnes qui participeront à un sondage et qui sont censés représenter la
population.
Remarque
Une tâche difficile consiste à choisir correctement l’échantillon de la population.
En effet, si on étudie la capacité respiratoire de la population belge, il est important
de ne pas choisir uniquement des personnes âgées, ou uniquement des sportifs de
haut niveau.
Statistiques
4
3. Tri des données
Vocabulaire
Commençons par un exemple qui permettra de connaître le vocabulaire.
Dans le tableau brut ci-dessous, on a indiqué les résultats des élèves de sixième
année d’une école, sur 10, à une interrogation de maths.
8 1 3 7 6 5 6 7 9 10 1 0
8 1 5 8 7 6 3 5 2 10 9 9
7 6 4 4 8 7 8 9 7 6 1 3
5 4 6 6 7 9 10 7 5 2 9 10
8 1 5 9 4 6 8 6 7 9 10 1
0 2 6 6 7 4 5 6 8 7 6 2
4 9 8 9 7 6 7 5 4 10 1 9
8 4 9 6 6 3 4 7 8 1 10 6
4 5 7 1 3 5 9 4 10 8 6 1
3 9 8 8 1 5 2 6 7 5 6 4
La population est l ’ensemble des élèves de sixième.
Les individus sont l es élèves des classes de sixième.
Le caractère étudié est l e résu ltat obtenu à une interrogation en maths.
C’est un caractère q ualitatif.
L’effectif de la population est 1 20.
Ce tableau n’étant pas très parlant, nous allons construire un nouveau tableau qui
sera recensé et ordonné.
Remplis le tableau ci-dessous (page 7) à l’aide des informations données pour
chacune des colonnes.
a) Dans la première colonne, on indique, par ordre croissant, les modalités xk,
c’est-à-dire les différentes notes dans l’échelle des notations.
La modalité n’est pas toujours un nombre, elle peut aussi être un intervalle
(on parle alors de classes) ou un symbole (F ou M pour le sexe…) lorsque le
caractère étudié est qualitatif.
Statistiques
5
b) La deuxième colonne contient, pour chacune des lignes, le nombre d’élèves
ayant obtenu la note reprise dans la première colonne.
Ces nombres sont les effectifs correspondant à chacune des modalités.
Ils se notent ek ou nk.
L’effectif d’une modalité est le nombre de fois que cette modalité apparaît dans le
tableau brut.
Cette colonne te permet de répondre à la question :
Combien d’élèves ont obtenu 6/10?
Réponds aux questions suivantes :
Combien d’élèves ont obtenu moins de 6 /10 (6 compris)?
Combien d’élèves ont obtenu moins de 8 /10 (8 compris)?
Combien d’élèves ont obtenu plus de 7 /10 (7 non compris)?
L’effectif total est la somme des effectifs des différentes modalités du caractère
statistique étudié. Il est noté n.
On indique l’effectif total dans la dernière case de la deuxième colonne.
Quel est l’effectif total de cette série ?
c) Dans le cas d’un caractère statistique quantitatif et si les modalités figurent
dans un tableau ordonné,
L’effectif cumulé d’une modalité (ou d’une classe) est la somme des effectifs de cette
modalité (ou classes) et de celles qui la précèdent.
On indique les effectifs cumulés dans la troisième colonne.
La dernière case de cette colonne contient l’effectif total.
Les effectifs cumulés se notent k , qui se lit nu.
À l’aide des informations de cette colonne, réponds aux questions suivantes :
Combien d’élèves ont-ils eu moins de 7 /10 (7 compris)?
Combien d’élèves ont-ils eu moins de 5 /10 (5 non compris)?
Combien d’élèves ont-ils eu plus de 6 /10 (6 compris)?
Statistiques
6
d) La quatrième colonne reprend la fréquence de chaque modalité.
La fréquence d’une modalité est le quotient de l’effectif de cette modalité et de
l’effectif total n.
La fréquence de la modalité xk d’effectif nk se note fk et vaut kk
nf
n .
Ce nombre est généralement exprimé en pourcentage.
Réponds aux questions suivantes :
Quel pourcentage d’élèves a obtenu un résultat de 3/10 ?
Quel pourcentage d’élèves a obtenu le maximum ?
e) La cinquième colonne reprend les fréquences cumulées de chaque modalité.
La fréquence cumulée d’une modalité (ou d’une classe) est le quotient de l’effectif
cumulé de cette modalité et de l’effectif total.
La fréquence cumulée de la modalité xk se note Fk et vaut kkF
n
.
Réponds aux questions suivantes :
Quel pourcentage d’élèves a obtenu un résultat inférieur ou égal 3/10 ?
Quel pourcentage d’élèves a obtenu un résultat strictement inférieur à 5 ?
Quel pourcentage d’élèves a obtenu un résultat non strictement inférieur à 7 ?
Quel pourcentage d’élèves a obtenu un résultat supérieur ou égal à 8 ?
Statistiques
7
Tableau recensé et ordonné (à remplir)
Remarques
- On peut également définir la fréquence cumulée d’une modalité (ou d’une classe)
comme la somme des fréquences de cette modalité (ou de cette classe) et de celles
qui la précèdent. Cependant, dans ce cas, des erreurs d’arrondis sont fréquentes et
rendent les résultats souvent approximatifs.
- Lorsque les résultats d’un caractère statistique quantitatif sont trop nombreux, il
est souvent avantageux de les regrouper par classes d’individus.
Ces classes ont généralement la même largeur.
On parle de manière analogue de l’effectif et de la fréquence d’une classe.
- Lorsque l’on étudie un caractère qualitatif, les effectifs cumulés et fréquences
cumulées n’ont aucun sens.
- Quand l’effectif correspondant à une modalité est nul, il n’est pas obligatoire de
l’indiquer dans le tableau.
Statistiques
8
Exemples
Dans chacun des exemples proposés, complète les cases manquantes
1) Caractère ……………………………
Population : 30 élèves d’une classe
Caractère : sexe
Modalités : masculin – féminin
Tableau brut :
M M F M M F
M F M F M F
F M M F M M
F M F M M F
M M M F F F
Tableau ordonné :
………….
kx …………….
kn
…………………
kk
nf
n
M 17 1730
0,567 ou 56,7 %
F 13 1330
0,433 ou 43,3 %
Total : …………….. 1 ou 100 %
2) Caractère ……………………………
Population : 25 élèves d’une classe
Caractère : cotes obtenues (sur 20) à un contrôle de géographie
Modalités : …………………………
Tableau brut :
12 03 13 15 17
11 15 13 13 18
11 13 20 12 ….
08 12 05 08 ….
10 17 05 15 ….
Statistiques
9
Tableau ordonné :
Modalités
………….
Effectifs
…………
Fréquences k
k
nf
n
………….
…………..
k
……………
……………
Fk
03 1 1
0,04 ou 4%25
1 0,04
05 2 2
0,08 ou 8%25
3 0,12
08 2 2
0,08 ou 8%25
5 0,20
10 1 1
0,04 ou 4%25
6 0,24
11 3 3
0,12 ou 12%25
9 0,36
12 3 3
0,12 ou 12%25
12 0,48
13 4 4
0,16 ou 16%25
16 0,64
15 3 3
0,12 ou 12%25
19 0,76
17 2 2
0,08 ou 8%25
21 0,84
18 1 1
0,04 ou 4%25
22 0,88
19 1 1
0,04 ou 4%25
23 0,92
……. 2 2
0,08 ou 8%25
25 1
Total : n = 25 1 ou 100 %
3) Caractère quantitatif à grouper en classes
Population : 80 virements inférieurs à 120 €
Caractère : montants des virements
Tableau brut :
5 20 80 35 8 44 80 28 114 60
60 101 45 102 67 116 48 79 14 57
61 39 7 40 105 30 42 119 90 90
100 48 49 50 67 119 78 65 60 118
17 114 72 107 10 77 84 54 36 45
117 39 82 40 60 24 59 100 113 79
76 74 5 110 99 97 86 19 62 58
21 32 87 54 32 54 92 93 36 60
Statistiques
10
0
1
2
3
4
5
3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
On regroupe les virements par tranches de 20 € : [0 ;20[ ; [20 ;40[, …..
[100 ;120[.
Tableau ordonné :
Modalités
kx Effectifs
kn Fréquences
…………….
Effectifs
cumulés
…….
Fréquences
Cumulées
…….
[0,20[
[20,40[
[40,60[
[60,80[
[80,100[
[100,120[
Total :
4. Graphiques
Après avoir collecté des données et les avoir ordonnées dans des tableaux structurés, il est
intéressant de pouvoir les représenter graphiquement. Il existe différents types de
graphiques : à bâtonnets, en rectangles, circulaires, figuratifs, en pyramides, …. Des logiciels
informatiques, de type Excel, sont d’une aide précieuse et efficace dans la confection de
graphiques liés à des données statistiques.
1) Diagramme en bâtonnets
Dans un tel diagramme, la longueur d’un « bâtonnet » représente
l’effectif de la modalité correspondante.
En reprenant la situation des différentes cotes obtenues par les 25
élèves au contrôle de géographie, on a
Statistiques
11
2) Histogramme
Une représentation graphique au moyen de rectangles s’appelle un
histogramme. La base de chaque rectangle correspond à l’intervalle de la
classe et l’aire de chaque rectangle est proportionnelle à la fréquence de la
classe correspondante.
En reprenant l’exemple des montants des virements dans lequel l’intervalle de
la classe est 20 €.
[0;20[
[20;40[
[40,60[[60;80[
[80;100[
[100;120[
0
5
10
15
20
3) Diagramme circulaire
En reprenant l’exemple du nombre de filles et de garçons dans une classe de
30 élèves, on a
filles
43%garçons
57%
L’amplitude de l’angle au centre du secteur circulaire représentant la modalité
« garçon » vaut 17
360 20430
.
Cette représentation est souvent utilisée lors des élections.