Des versions téléchargeables de cette activité sont disponibles dans
les formats suivants :
Il arrive souvent qu’on veuille déterminer une caractéristique pour toute une population, mais qu’on ne puisse pas recueillir de données sur l’ensemble de la population. On doit donc se fier à des renseignements qu’on recueille auprès d’une partie seulement de cette population (un échantillon) pour découvrir ce qu’on veut savoir concernant la population dans son ensemble. (En d’autres termes, l’échantillon représente une vue d’ensemble.) Par exemple, les statisticiens calculent le taux mensuel de chômage au Canada en recueillant des données auprès d’un échantillon de personnes en âge de travailler. De plus, mener une enquête auprès de l’ensemble d’une population coûterait trop cher et prendrait trop de temps.
Pour obtenir des renseignements sur l’ensemble d’une population, il importe de savoir comment interpréter les données d’un échantillon. Avant d’étudier les échantillons, voyons pour quelle population il est possible d’observer la situation dans son ensemble. Dans le tableau de données suivant, on donne les tailles, en centimètres, d’une population composée de 100 élèves de 15 ans.
165 | 161 | 170 | 182 | 176 | 185 | 180 | 155 | 154 | 166 |
165 | 152 | 174 | 167 | 165 | 171 | 172 | 150 | 181 | 165 |
166 | 161 | 174 | 158 | 166 | 168 | 164 | 150 | 155 | 170 |
168 | 144 | 164 | 154 | 177 | 173 | 178 | 158 | 165 | 175 |
180 | 174 | 152 | 167 | 148 | 175 | 153 | 162 | 180 | 175 |
157 | 172 | 155 | 140 | 147 | 160 | 152 | 166 | 168 | 158 |
153 | 165 | 160 | 143 | 166 | 167 | 167 | 163 | 158 | 160 |
150 | 157 | 172 | 167 | 184 | 172 | 165 | 159 | 158 | 177 |
179 | 174 | 156 | 178 | 165 | 179 | 174 | 148 | 175 | 166 |
157 | 159 | 163 | 165 | 162 | 153 | 145 | 170 | 176 | 180 |
La moyenne de la population est de 164,7. |
L’écart‑type est de 10,2. |
N = taille de la population
1. Tout d’abord, assurez‑vous de bien comprendre la façon de calculer la moyenne et l’écart‑type d’une population. Décrivez chaque procédé.
2. Dans le document no 1, examinez le premier histogramme intitulé « Ensemble des données originales ».
a. Tracez une droite verticale pour indiquer la moyenne sur le graphique.
b. Déterminez, si possible, la médiane ou le mode d’après l’histogramme.
c. Tracez le polygone de fréquences. Décrivez sa forme.
d. Commentez la variation évidente des données du graphique.
Il s’agit d’une vue d’ensemble de la population. Toutefois, si l’on ne pouvait recueillir de données que d’un seul échantillon, croyez-vous que cet échantillon refléterait véritablement la population? Si on prenait différents échantillons, est-ce que l’histogramme de chacun aurait le même aspect que celui de la population? Est-ce que la moyenne de chaque échantillon serait toujours la même?
3. Avec les autres élèves de la classe, tirez un nombre assez grand d’échantillons différents (par exemple 100) à partir du tableau de données sur les tailles d’élèves. Puis, étudiez les relations entre les moyennes et les écarts‑types des échantillons et celles de l’ensemble de la population.
a. Créez un échantillon aléatoire comprenant cinq tailles. Dites comment vous vous êtes assuré que l’échantillon était aléatoire. Inscrivez la valeur des cinq tailles sélectionnées.
b. Calculez la moyenne de votre échantillon (à une décimale près).
c. Refaites l’exercice jusqu’à ce que vous ayez extrait votre part des 100 échantillons de la classe. (Votre enseignant vous indiquera la part qui vous revient). Notez la moyenne de chacun de vos échantillons.
4. a) À l’aide des 100 moyennes des échantillons calculées par les élèves de la classe, remplissez le tableau statistique suivant.
(Nota : Le tableau comprend des intervalles d’une unité. Par exemple, 145 inclut toutes les valeurs des moyennes des échantillons égales ou supérieures à 145 jusqu’à 146, mais sans inclure cette valeur. Par conséquent, le résultat 145,3 est inclus dans l’intervalle entre 145 et 146, ce qui apparaîtra dans le tableau statistique comme 145.)
Moyennes des échantillons pour n= 5
Classe | Pointage | Fréquence | Classe | Pointage | Fréquence | |
145 | 163 | |||||
146 | 164 | |||||
147 | 165 | |||||
148 | 166 | |||||
149 | 167 | |||||
150 | 168 | |||||
151 | 169 | |||||
152 | 170 | |||||
153 | 171 | |||||
154 | 172 | |||||
155 | 173 | |||||
156 | 174 | |||||
157 | 175 | |||||
158 | 176 | |||||
159 | 177 | |||||
160 | 178 | |||||
161 | 179 | |||||
162 | 180 |
b. Tracez l’histogramme et le polygone de fréquences sur la deuxième grille du document no 1.
c. Comparez la forme de ce polygone de fréquences à celle de l’ensemble des données originales.
d. Calculez et inscrivez la moyenne et l’écart‑type des moyennes des échantillons.
5. Il existe d’autres moyens de produire des échantillons à partir de données originales. En effet, on a utilisé le logiciel statistique Fathom pour constituer 100 échantillons aléatoires différents de 20 élèves à partir de la population originale de 100 élèves (voir l’annexe A). Puis, on a calculé les moyennes des échantillons. Le tableau statistique vous est donné ci-dessous.
La moyenne des moyennes des échantillons est de 164,5. L’écart-type des moyennes des échantillons est de 2,2. |
|
Tracez l’histogramme et le polygone de fréquences des 100 échantillons de 20 tailles sur la troisième grille du document no 1.
6. Examinez les trois graphiques du document no 1. Commentez-les et proposez une explication pour :
a. la forme des histogrammes des moyennes des échantillons;
b. la moyenne des moyennes des échantillons pour diverses tailles d’échantillon;
c. l’écart-type des moyennes des échantillons à mesure que la taille de l’échantillon augmente. Quel est le ratio approximatif de l’écart‑type pour un échantillon de 20 tailles d’élèves comparativement à l’écart‑type pour un échantillon de 5 tailles?
7. Décrivez le résultat auquel vous vous attendriez si on sélectionnait 100 échantillons différents de 40 tailles? Que pourriez-vous prédire concernant :
a. la forme de l’histogramme des moyennes des échantillons?
la moyenne des moyennes des échantillons?
b. l’écart-type des moyennes des échantillons?
c. De toute évidence, la variation est liée à la taille des échantillons. Dépend‑t‑elle aussi du nombre d’échantillons sélectionnés?
8. Consultez le document no 2 intitulé « Différents nombres et tailles d’échantillons ». On a utilisé les mêmes données sur les tailles d’élèves pour constituer 100, 500 et 1 000 échantillons pour n = 30 (graphiques 2, 3 et 4) et 500 et 1 000 échantillons pour n = 50 (graphiques 5 et 6).
Examinez les graphiques et l’information consignée. Commentez :
a. les formes;
b. les moyennes des moyennes des échantillons;
c. les écarts‑types des moyennes des échantillons.
9. On a utilisé le calcul de l’écart‑type pour obtenir une mesure de la variation des moyennes des échantillons. Cette mesure de la variation est habituellement appelée erreur‑type de la moyenne,.Selon la formule suivante, elle dépend uniquement de l’écart‑type de la population, et de la taille de l’échantillon, n.
Utilisez cette formule pour calculer l’erreur‑type de la moyenne pour les échantillons de 30 tailles et ceux de 50 tailles. Comment ces valeurs se comparent‑elles aux valeurs de l’écart‑type calculées dans le tableau?
Conclusion
Vous possédez maintenant les éléments suivants :
- la distribution de moyennes des échantillons;
- la relation entre la moyenne des moyennes des échantillons et la moyenne de la population;
- la relation entre l’écart‑type de la moyenne de la population et l’erreur‑type de la moyenne.
Collaboration : Anna Spanik, professeure de mathématiques, école secondaire Halifax West, Nouvelle-Écosse.