Quel est l'effet du type de milieu sur l'abondance des escargots et des limaces ?

Objectif du scénario

Répondre à la question : Le type de milieu a-t-il un effet sur l'abondance des escargots et des limaces ?

Compétence développées :
  • Calcul d'abondance
  • Représentation graphique
  • Test statistiques
Déroulement de l'analye étape par étape
 
1. Poser la question de recherche

Dans cet exemple, nous vous donnons déjà la question de recherche. Vous pouvez noter : "Abondance et type de milieu" comme nom d'analyse par exemple et "Quel est l'effet du type de milieu sur l'abondance des escargots et des limaces ?" dans la partie question de recherche.

2. Importer les données

Afin de répondre à cette question, nous allons avoir besoin des données de Vigie-Nature École relatives à l'observatoire Opération Escargots.

Choisir dans le menu importer des données :

  • Importer des données sur les escargots
  • Données issues de Vigie-Nature École (données protocolées)
  • Importer ces données

Paramètres à utiliser :

Choissez : Données espèces et données zones d'observation

Cliquez sur : Exécuter

3. Manipuler les données

Maintenant que vous avez toutes les données, il va falloir les résumer car il y a plus de 50 000 lignes. Nous allons commencer par calculer l'abondance totale des escargots vus lors de chaque observation. Pour cela, nous allons faire la somme des individus observés en regroupant les données par numéro d'observation (pour ne pas additionner toutes les observations entre elles) et le type de milieu (pour garder cette colonne associée avec nos valeurs et pouvoir répondre à notre question).

Dans le menu Manipuler des données, aller à la catégorie Regrouper des lignes cliquez sur en savoir plus puis l'outil : Résumer des données (vous pouvez aussi le trouver dans la barre de gauche dans la partie Manipuler les données)

Paramètres à utiliser :

Données d'entrée* : Données_VNE_Operation_escargots.csv
Regrouper toutes les lignes selon des catégories contenues dans les colonnes suivantes : numero_observation | type de milieu
en faisant l'opération suivante : Somme
sur la colonne nombre_individus
et stocker l'information dans une nouvelle colonne nommée : Abondance
Voulez-vous faire une autre opération ? non

Enregistrez vos commentaires si vous en avez puis continuez à manipuler les données.

Nous allons maintenant regrouper les données par type de milieu. Cette fois nous allons faire une moyenne pour avoir une valeur qui représente le nombre moyen d'escargots et de limaces par type de milieu.

Dans le menu Manipuler des données, aller à la catégorie Regrouper des lignes cliquez sur en savoir plus puis l'outil : Résumer des données (vous pouvez aussi le trouver dans la barre de gauche dans la partie Manipuler les données)

Paramètres à utiliser :

Données d'entrée : somme sur la colonne 9 en fonction de la colonne 1,10.csv
Regrouper toutes les lignes selon des catégories contenues dans les colonnes suivantes : type de milieu
en faisant l'opération suivante : Moyenne
sur la colonne : Abondance
et stocker l'information dans une nouvelle colonne nommée : Abondance moyenne
Voulez-vous faire une autre opération ? Non

Enregistrez vos commentaires si vous en avez puis sélectionnez visualiser les données.

4. Visualiser les données

Normalement, en regardant votre tableau, vous pouvez déjà voir qu'il existe des différences entre le milieu urbain et les autres types de milieux. Toutefois, afin de mieux voir les différences, on peut réaliser un graphique. Ici, la colonne type de milieu est qualitative (on ne peut pas faire d'opération avec ces valeurs) et la colonne Abondance moyenne est quantitative (on peut faire des opérations avec ses valeurs). Une représentation adaptée est donc le diagramme en barre avec l'type de milieu sur l'axe des X et l'Abondance moyenne sur l'axe des Y.

Choisir l'outil : Visualiser - Représenter les données

Fichier d'entrée : moyenne sur la colonne 3 en fonction de la colonne 2.csv
Axe horizontal (X) : type de milieu
Axe vertical (Y) : Abondance moyenne
Type de représentation graphique : Diagramme en barre
Créer des graphiques différents selon les catégories de la variable : Laisser vide
Changer les couleurs du graphique selon les catégories de la variable : type de milieu
Titre du graphique : Effet du type de milieu sur l'abondance moyenne des escargots et limaces
Titre de l'axe des X : Laisser vide
Titre de l'axe des Y : Laisser vide

Enregistrez vos commentaires si vous en avez puis sélectionnez faire une analyse statistique.

La différence est plus visible encore qu'avec le tableau. Maintenant, il faut savoir si la différence que l'on observe n'est pas que due au hasard.

5. Test statistique

Nous allons donc faire un test statistique afin de voir si le type de milieu explique la différence observée entre le milieu urbain et les deux autres environnement. Comme nous l'avons déjà expliqué plus haut, la colonne environnement est qualitative et la colonne Abondance est quantitative. Il faut donc faire une comparaison de moyenne. Dans cet outil, attention à bien selectionner le jeu de données qui a servi à faire la moyenne (ici il s'agit de "somme sur la colonne 9 en fonction de la colonne 1,10.csv").

Choisir l'outil : Tests statistiques - Faire une comparaison de moyenne

Fichier de données brutes : somme sur la colonne 9 en fonction de la colonne 1,10.csv (attention !!!)
Vérifier si la variable explicative (X) : type de milieu
a un effet sur la variable à expliquer (Y) : Abondance

La variable type de milieu a un effet significatif sur la variable Abondance.

Sélectionnez Enregistrer puis faire une conclusion

6. Conclusion

Je conclue que le type de milieu a bien un effet sur l'abondance. Les escargots et les limaces semblent être moins nombreux en milieu rural.

7. Rapport

Vous pouvez maintenant télécharger votre rapport au format pdf

Pour aller plus loin

Ce scénario peut-être adapté pour se poser d'autres questions.

  • Par exemple il est possible de se poser la même question pour d'autres organismes en changeant l'observatoire sur lequel on travaille il faut juste qu'il y a une colonne environnement et un nombre d'individu.
  • Il est aussi possible de se poser la même question pour une autre colonne comme la distance au bois le plus proche par exemple.
  • Une autre possibilité est encore de calculer la diversité plutôt que l'abondance totale des escargots (en comptant le nombre de lignes par observation).