Étude de l’échantillonnage Partie 1 : Variations dans les échantillons Notes de l’enseignant

Des versions téléchargeables de cette activité sont disponibles dans
les formats suivants :

(format RTF, format PDF)


Objectif

L’objectif de cette activité est d’examiner la relation entre la moyenne de la population et la moyenne des moyennes des échantillons.

Résultats

Grâce à cette activité, les élèves pourront :

  • appliquer les caractéristiques des distributions normales;
  • concevoir et mener des enquêtes ainsi que simuler la collecte de données pour étudier la variabilité d’échantillonnage;
  • se faire une idée de l’application des nombres aléatoires à l’échantillonnage statistique;
  • se faire une idée de l’influence de la taille de l’échantillon sur la variation des résultats des échantillons;
  • représenter graphiquement la distribution des moyennes des échantillons et la proportion des échantillons et les interpréter.

Format

L’activité prendra la forme d’une discussion en classe que vous dirigerez vous-même. Les élèves seront invités à partager l’information. Pour faciliter la discussion, divisez la classe en petits groupes d’élèves.

Introduction

Il est important que les élèves se rendent compte qu’il est généralement impossible de recueillir des renseignements sur l’ensemble d’une population. L’objectif de l’échantillonnage est de tirer des conclusions plausibles sur une population en obtenant des renseignements auprès d’une fraction assez petite (un échantillon) de cette population. Pour cela, on doit savoir quelles formules employer pour traiter l’information ainsi recueillie et quel degré de confiance on peut en obtenir.

Cette enquête constitue la première étape vers la compréhension du concept d’intervalle de confiance.

Enseignement en classe

Remettez une copie de la feuille de travail de l’élève et du document no 1 intitulé « Histogrammes et polygones de fréquences d’échantillons de tailles d’élèves de 15 ans ».

1. Les formules de la moyenne et de l’écart‑type de la population sont déjà fournies. Elles sont présentées sous forme symbolique, en notation sigma. Il est possible que ce soit la première fois que les élèves voient cette notation, et ce, même s’ils ont déjà calculé des moyennes ou des écarts‑types. Dans le cadre de la discussion en classe ou d’un devoir écrit, demandez aux élèves de décrire le processus de calcul de la moyenne et de l’écart‑type et d’établir la relation entre le processus de calcul et les formules.

2. Discutez de la forme de l’histogramme (graphique par points) de l’ensemble des données originales. Les élèves devraient remarquer que la variation des données semble être assez marquée. Posez‑leur la question « Croyez-vous que chaque échantillon de la population aura le même aspect? »

3. Utilisez le tableau de données sur les tailles et demandez aux élèves de sélectionner des échantillons aléatoires comprenant cinq tailles. Dites‑leur d’inscrire les valeurs de leurs données, ainsi que la moyenne pour chaque échantillon.

Répartissez la tâche, de sorte que chaque élève ou groupe d’élèves soit chargé de produire une partie des 100 échantillons. Dessinez un tableau sur un transparent ou sur le tableau afin que les élèves puissent voir les moyennes des échantillons au fur et à mesure qu’elles sont calculées.

Il est important que les élèves sélectionnent manuellement et de façon aléatoire les échantillons. La génération trop rapide de cette information au moyen d’un logiciel ou d’une calculatrice pourrait masquer ce qui se passe réellement. Lorsqu’ils auront sélectionné manuellement les quelques premiers échantillons, vous pourrez leur proposer d’utiliser un générateur aléatoire électronique, comme la fonction « randInt » (1, 100, 5) de la calculatrice TI.

4. Demandez à tous les élèves de remplir le tableau statistique des 100 moyennes des échantillons. Attendez‑vous à voir certains résultats intéressants au fur et à mesure que les élèves sélectionnent de façon aléatoire les échantillons. Cela leur permettra de mieux comprendre qu’on ne peut pas avoir une confiance absolue dans les résultats attendus.

Il est également digne d’intérêt de souligner que les échantillons sont sélectionnés avec remise, mais que les résultats seraient comparables s’ils l’étaient sans remise. Le graphique devrait révéler un regroupement plus important des données autour de la moyenne que celui indiqué par l’histogramme des données originales.

5. Distribuez aux élèves une copie de l’annexe A (liste de 100 échantillons de 20 tailles produite au moyen du logiciel Fathom). Demandez‑leur d’utiliser le tableau statistique figurant sur leur feuille de travail pour tracer le troisième histogramme du document no 1.

6. Demandez aux élèves de faire part à la classe de leurs commentaires sur les trois graphiques. Ces commentaires devraient inclure les observations suivantes :

a. Les histogrammes des moyennes des échantillons montrent une distribution normale. Ils sont à peu près symétriques par rapport à la moyenne.

b. La moyenne des moyennes des échantillons est approximativement la même que la moyenne de la population et ne dépend pas de la taille de l’échantillon.

c. Au fur et à mesure que la taille de l’échantillon augmente, l’écart‑type des moyennes des échantillons diminue. (Le ratio de l’écart‑type pour une taille d’échantillon de 20 par rapport à celui d’une taille d’échantillon de 5 devrait être d’environ ½.)

7. Les élèves devraient faire les prédictions suivantes pour 100 échantillons de 40 tailles :

a. L’histogramme présentera un regroupement plus serré autour de la moyenne que celui obtenu pour les échantillons contenant 20 tailles;

b. La moyenne des moyennes des échantillons sera à peu près la même que la moyenne de la population;

c. L’écart‑type des moyennes des échantillons sera plus faible que l’écart‑type pour les échantillons de 20 tailles (inférieur à 2,2).

8. Les élèves devraient faire les observations suivantes :

a. Les formes des graphiques 2, 3 et 4 sont semblables et celles des graphiques 5 et 6 aussi. Les graphiques 5 et 6 sont plus hauts et plus étroits, et les points de données sont regroupés de façon plus serrée autour de la valeur moyenne et sont moins nombreux dans les « queues ». Tous les graphiques représentent une distribution à peu près normale. La distribution de l’ensemble des données originales montre nettement plus de variation que les distributions des échantillons;

b. Toutes les moyennes sont d’environ 164,7, soit de même valeur que la moyenne de la population;

c. Les écarts‑types des graphiques 2, 3 et 4 sont presque les mêmes (1,9); les écarts‑types des graphiques 5 et 6 sont les mêmes (1,5). Il semble donc que :

    • l’écart‑type de la moyenne dépend de la taille de l’échantillon, mais non du nombre d’échantillons sélectionnés;
    • à mesure que la taille de l’échantillon augmente, l’écart‑type des moyennes des échantillons diminue.

Nota : Ces observations sont très importantes.

9. Si n = 30,
Si n = 50,

Ces calculs sont très près des valeurs de l’écart‑type indiquées dans le tableau.

Collaboration : Anna Spanik, professeure de mathématiques, école secondaire Halifax West, Nouvelle-Écosse.

This entry was posted in Ressources pour les enseignants. Bookmark the permalink.