NOTE: These videos were prepared when the Census at School Project was managed by Statistics Canada. Most of the information is still relevant.
Duration: 12:04 min.
Description:
Dans cet épisode, on va regarder ensemble comment utiliser le logiciel statistique Fathom pour analyser un ensemble de données de la base de données internationale du Recensement à l'école.
To access the Rich-Text Format (RTF) version, use the document conversion features available in most word processing software, or use a file viewer capable of reading RTF.
Download Transcript:
Video Transcript
Bonjour, je suis Linda Lefebvre, analyste à Statistique Canada. J’ai déjà enseigné les mathématiques au secondaire au Québec et j’ai aussi donné des ateliers aux enseignants sur des ressources éducatives de Statistique Canada.
Dans cet épisode, on va regarder ensemble comment utiliser le logiciel statistique Fathom pour analyser un ensemble de données pris de la base de données internationale du Recensement à l’école.
Fathom est un logiciel dynamique d’analyse statistique de la compagnie Key Curriculum Press et on l’utilise dans plusieurs conseils scolaires. Fathom permet de faire de l’analyse à une ou à deux variables. On peut créer différentes sortes de diagrammes avec des données catégoriques ou numériques—discrètes ou continues—et trouver la moyenne, la médiane et le mode, l’écart type et même la droite de meilleur ajustement.
Vous avez déjà téléchargé un échantillon de données de la base internationale du Recensement à l’école et vous l’avez importé dans Fathom. Alors maintenant, ouvrons ce fichier Fathom que vous avez déjà enregistré et maximisez la fenêtre, de façon à ce qu’elle prenne tout l’écran.
Cet icône montre que nous avons une collection de données. Double-cliquez sur l’icône de collection et vous allez voir tous les cas de données de votre classe. Si les cas de données ne s’ouvrent pas sur l’onglet, vous pensez peut-être que vous n’avez pas de données. Vous n’avez qu’à cliquer sur l’onglet Cas en haut de la fenêtre et les données vont apparaître.
Chaque cas de données contient les réponses aux questions d’enquête pour chaque élève dans cet échantillon de 100 élèves canadiens. On peut descendre jusqu’en bas en utilisant la glissière au coté droit pour voir toutes les réponses de cette personne-là aux questions de l’enquête.
Regardez le coin en bas à gauche des cas de données. Ces chiffres vous disent que vous regardez le cas 1 sur 100 élèves. Cliquez sur la flèche à gauche de ces chiffres : vous pouvez voir les réponses des autres élèves de cet échantillon.
Les cas de données nous laissent voir un élève à la fois. Pour voir l’échantillon au complet, c’est plus facile d’utiliser un tableau.
Alors rapetissons la fenêtre des cas de données et glissons-la dans le coin en haut à gauche, sous la collection, pour les enlever du chemin.
Pour faire un tableau, cliquez d’abord sur l’icône de la collection et cliquez ensuite sur l’icône du Tableau dans le menu gris et descendez-le dans votre espace de travail.
Pour voir plus de données, vous pouvez tirez sur le contour de la boîte pour l’agrandir. Mais d’habitude, je laisse le tableau assez petit pour avoir plus de place pour mes diagrammes. Vous pouvez aussi vous déplacer dans le tableau en glissant les barres de déplacement en bas (pour voir les réponses à toutes les questions) et les barres de déplacement à droite (pour voir tous les élèves).
Pour créer un diagramme en Fathom, cliquez sur l’icône Graphique et glissez un diagramme dans votre espace travail. Vous pouvez cliquer et tirer sur un des coins du diagramme pour l’agrandir. Pour faire un diagramme, Fathom utilise la méthode « glisser et déposer » et c’est la même chose pour les données catégoriques et numériques.
On va faire le premier diagramme avec « la main dominante » des élèves : des données catégoriques puisqu’il y a trois catégories : droitier, gaucher et ambidextre.
On commence donc par trouver la colonne main dans le tableau en se servant des flèches ou des barres de déplacement – la voici, après la colonne de la circonférence du poignet.
Pour glisser cet attribut « main »sur l’axe des x, on clique sur le titre « main » et avec le bouton de la souris encore enfoncé, on glisse le titre vers le diagramme. En glissant, on voit deux zones ou on pourrait déposer les données : une sur l’axe horizontal (ou l’axe des x) et une autre sur l’axe vertical (ou axe des y). Pour ce diagramme, je vais le mettre sur l’axe des x.
Voilà! Un diagramme à bande de la main dominante pour ces 100 élèves canadiens.
Utilisez le menu déroulant au coin en haut à droite du diagramme pour voir les autres types de diagrammes appropriés à ces données. Un diagramme décomposé est un peu comme un diagramme circulaire – ça montre des segments dont la largeur correspond à la fréquence de chaque catégorie. À la fois dans les diagrammes décomposés et les diagrammes à bandes, c’est facile de voir le mode (la réponse la plus fréquente) pour la main dominante, qui est celle des droitiers.
Si on veut voir qui des gars ou des filles sont plus portés à être gauchers ou ambidextres, on peut mettre le sexe sur l’axe des y. Allez aux cas de données ou au tableau et glissez l’attribut « sexe » sur l’axe vertical. Maintenant, on peut voir que les gars sont plus susceptibles d’être ambidextres que les filles dans cet ensemble de données. En fait, il n’y a pas de filles ambidextres dans cette classe et il n’y a pas du tout de gauchers.
Jusqu’à maintenant, on a utilisé des données catégoriques dans nos diagrammes. On peut aussi illustrer des données numériques en Fathom en utilisant la même méthode. Un bon exemple de données numériques continues est la variable de la taille, qui peut prendre n’importe quelle valeur entre 130 et 200 cm.
Pour faire un diagramme de la taille, on doit d’abord enlever les données du diagramme qu’on a déjà. Cliquez du côté droit de votre souris sur le diagramme pour ouvrir le menu contextuel du diagramme. Et puis, cliquez sur Enlever l’attribut des X. Refaites les étapes pour Enlever l’attribut des Y. La surface est maintenant prête pour le prochain diagramme.
Trouvez l’attribut « taille ». Cliquez sur le titre et apportez-le sur l’axe des X. Vous allez voir un diagramme de points qui montre la fréquence des tailles. Le mode apparaît : c’est la colonne de points la plus haute.
Utilisez le menu déroulant sur le diagramme pour voir d’autres types de diagrammes. Un Histogramme est un autre bon type de diagramme pour des données continues. Le diagramme de quartiles (Fathom nomme ça « Diagramme à boîtes ») est aussi bon pour des données numériques puisqu’il montre la valeur médiane et les quartiles inférieur et supérieur.
Quand on travaille avec des données numériques, c’est utile de pouvoir trouver la moyenne ou la médiane ou encore l’écart-type. Fathom donne un grand nombre de formules ou de fonctions pour travailler avec les données, incluant celles que je viens de nommer. Voyons comment utiliser les commandes de fonctions pour analyser la taille plus en détail.
Pour trouver la moyenne, cliquez du côté droit de la souris sur le diagramme, pour montrer le menu contextuel, et choisissez Tracer une valeur. Dans le menu, choisissez Fonctions, puis Statistique, puis Un Attribut. Double-cliquez sur moyenne (assurez-vous de faire un double clic) et puis cliquez OK. La taille moyenne de ce groupe d’élèves va paraître comme ligne verticale traversant le diagramme à la valeur moyenne, et la valeur numérique va s’afficher au bas du diagramme.
Pour explorer l’effet de valeurs minimales et maximales sur la moyenne, cliquez sur le point le plus haut ou le plus bas de l’étendue et glissez-le vers la ligne de la moyenne. Remarquez comment la moyenne diminue lorsque cette valeur extrême prend une valeur plus proche du centre de l’étendue. Pour retourner le point à sa valeur originale, aller au menu Édition et cliquez Annuler le glissement des points.
Tracez une médiane en utilisant la même procédure que pour la moyenne, mais en choisissant médiane parmi les fonctions statistiques. (Cliquez du côté droit sur le diagramme, choisissez Tracer une valeur, puis Fonctions, puis Statistique, Un attribut, et double- cliquez sur médiane). La médiane de ce groupe est 167,75 cm.
Pour trouver l’écart-type, répétez les mêmes étapes et choisissez l’écart-type de la population (écartTypePop). En regardant la liste des fonctions statistiques, vous verrez qu’il y a beaucoup d’autres fonctions qu’on peut appliquer à ces données.
Le dernier diagramme que j’aimerais vous montrer en est un qui compare des variables numériques sur chacun des axes. Ce sont les nuages de points. Posons la question : « Est-ce que les grands élèves ont de grands pieds? » ou « Je me demande s’il y a un lien entre la taille et la taille du pied? » en illustrant les données de la taille des élèves et de la taille de leur pied.
Enlevez la moyenne en cliquant du côté droit sur le mot « moyenne » au bas du diagramme et en choisissant Effacer la formule. Refaites-le pour la médiane et l’écart-type.
On a déjà la taille sur l’axe des x. Maintenant glissez la taille du pied sur l’axe des y. Un nuage de point apparaît immédiatement.
Je remarque que les données ne sont pas alignées serrées le long d’une droite, mais qu’il y a une nette tendance vers le haut. On peut demander aux élèves d’ajouter une droite de meilleur ajustement aux données en ajoutant une droite amovible au diagramme.
Cliquez du côté droit de votre souris et choisissez Ajouter une droite ajustable. L’élève peut faire pivoter cette droite en la prenant par un de ses deux bouts jusqu’à ce qu’elle corresponde à l’oeil au meilleur ajustement. Comme vous pouvez voir, l’équation de la droite apparaît dans le coin en bas à gauche du diagramme et elle change lorsque l’élève ajuste la droite.
On enseigne aux élèves que la forme simplifiée de l’équation d’une droite s’écrit y=mx+b. Fathom facilite la compréhension en remplaçant le x et le y par le nom des attributs représentés sur les axes – dans ce cas-ci en remplaçant y par la taille du pied et x par la taille. On voit clairement que l’équation de la taille du pied dépend de la valeur de la taille.
Pour aider les élèves à voir l’ordonnée à l’origine (sur l’axe des y) qui paraît dans la formule, on peut ajuster les axes des x et des y. Cliquez sur la valeur minimum de l’axe des x et glissez-la vers la droite jusqu’à ce que zéro apparaisse à gauche de l’axe. Maintenant, cliquez sur la valeur minimum de l’axe des y et montez-la jusqu’à ce que l’ordonnée à l’origine apparaisse. Maintenant on voit bien la relation entre l’équation et le diagramme.
Une fois que les élèves ont créé leur propre droite de meilleur ajustement, ils peuvent vérifier leur précision en créant une droite des moindres carrés.
Cliquez sur votre diagramme du coté droit de votre souris et choisissez Droite des moindres carrés. La droite s’affiche avec l’équation et la valeur du R-carré qui indique que 29 % de la variation de la taille du pied droit peut être attribuée à la taille.
Alors, en réponse à la question « je me demande s’il y a un lien entre la taille et la taille du pied? » », le diagramme semble indiquer que la taille a de l’influence sur la taille du pied, mais que ce n’est pas toute l’histoire. Il y a certainement des gens plus courts qui ont de grands pieds et de grandes personnes qui ont de petits pieds.
Voilà une introduction au genre d’exploration de données qu’on peut faire avec Fathom avec les données du Recensement à l’école. Pour d’autres idées, vous trouverez de l’aide et des vidéos d’instructions (en anglais seulement) sur le site Fathom de Key Curriculum Press et en cherchant les films Fathom du menu Aide sur l’écran Fathom.
Vous pouvez utiliser Fathom pour analyser l’ensemble de données de votre classe en utilisant les mêmes étapes qu’on a utilisé avec cet ensemble d’élèves canadiens. C’est fascinant de comparer des attributs de votre classe avec des échantillons d’élèves venus d’ailleurs.
J’espère que vos élèves apprendront beaucoup et s’amuseront dans la découverte des données.