Quel est l'effet de la période d'observation sur l'abondance des escargots et des limaces ?

Objectif du scénario

Répondre à la question : Quel est l'effet de la période d'observation sur l'abondance des escargots et des limaces ?

Compétence développées :
  • Extraire des éléments d'une date
  • Calcul d'abondance
  • Représentation graphique
  • Test statistiques
Déroulement de l'analye étape par étape
 
1. Poser la question de recherche

Dans cet exemple, nous vous donnons déjà la question de recherche. Vous pouvez, par exemple, noter : "Saison et abondance" comme nom d'analyse et "Quel est l'effet de la période d'observation sur l'abondance des escargots et des limaces ?" dans la partie question de recherche.

2. Importer les données

Afin de répondre à cette question, nous allons avoir besoin des données de Vigie-Nature École relatives à l'observatoire Opération escargots.

Choisir dans le menu importer des données :

  • Importer des données sur les escargots
  • Données issues de Vigie-Nature École (données protocolées)
  • Importer ces données

Paramètres à utiliser :

Choissez : Données espèces et données zones d'observation

Cliquez sur : Exécuter

3. Manipuler les données

Maintenant que vous avez toutes les données, il va falloir les résumer car il y a un grand nombre de lignes. Nous allons commencer par calculer l'abondance totale des escargots et limaces vus lors de chaque observation. Pour cela, nous allons faire la somme des individus observés en regroupant les données par numéro d'observation (pour ne pas additionner toutes les observations entre elles) et la colonne date_observation (pour garder cette colonne associée avec nos valeurs et pouvoir répondre à notre question).

Dans le menu Manipuler des données, aller à la catégorie Regrouper des lignes cliquez sur en savoir plus puis l'outil : Résumer des données (vous pouvez aussi le trouver dans la barre de gauche dans la partie Manipuler les données)

Paramètres à utiliser :

Données d'entrée* : Données_VNE_Operation_escargots.csv
Regrouper toutes les lignes selon des catégories contenues dans les colonnes suivantes : numero_observation | date_observation
en faisant l'opération suivante : Somme
sur la colonne nombre_individus
et stocker l'information dans une nouvelle colonne nommée : Abondance
Voulez-vous faire une autre opération ? non

Enregistrez vos commentaires si vous en avez puis continuez à manipuler les données.

Maintenant que les données sont résumées à l'échelle d'une observation, nous allons transformer la date pour extraire la saison pour chaque valeur.

Dans le menu Manipuler des données, aller à la catégorie Extraire de l'information à partir de colonnes cliquez sur en savoir plus puis l'outil : Convertir des dates(vous pouvez aussi le trouver dans la barre de gauche dans la partie Manipuler les données)

Paramètres à utiliser :

Données d'entrée* : somme sur la colonne 9 en fonction de la colonne 1,2.csv
Convertir la colonne : date_observation
dont le format de données est :AnnéeMoisJour
en : Saison
dans une nouvelle colonne nommée : Saison
Voulez-vous faire une autre opération ? non

Enregistrez vos commentaires si vous en avez puis continuez à manipuler les données.

Une nouvelle colonne contient la saison de l'oservations. Nous allons maintenant regrouper les données selon les valeurs de la colonne Saison. Cette fois nous allons faire une moyenne pour avoir une valeur qui représente le nombre d'escargots et de limaces moyen pour chaque saison.

Dans le menu Manipuler des données, aller à la catégorie Regrouper des lignes cliquez sur en savoir plus puis l'outil : Résumer des données (vous pouvez aussi le trouver dans la barre de gauche dans la partie Manipuler les données)

Paramètres à utiliser :

Données d'entrée : Convertir des dates on data 2
Regrouper toutes les lignes selon des catégories contenues dans les colonnes suivantes : Saison
en faisant l'opération suivante : Moyenne
sur la colonne : Abondance
et stocker l'information dans une nouvelle colonne nommée : Abondance Moyenne
Voulez-vous faire une autre opération ? Oui
et ajouter l'opération suivante : Erreur standard
et stocker l'information dans une nouvelle colonne nommée : Erreur de la moyenne

Enregistrez vos commentaires si vous en avez puis sélectionnez visualiser les données.

4. Visualiser les données

Normalement, en regardant votre tableau, vous pouvez déjà voir qu'il existe des différences entre les saisons. Toutefois, afin de mieux voir les différences, on peut réaliser un graphique. Ici, la colonne Saison est qualitative (on ne peut pas faire d'opération avec ces valeurs) et la colonne Abondance moyenne est quantitative (on peut faire des opérations avec ses valeurs). Une représentation adaptée est donc le diagramme en barre avec la colonne Saison sur l'axe des X et l'Abondance moyenne sur l'axe des Y.

Choisir l'outil : Représenter les données

Fichier d'entrée : moyenne sur la colonne 3 en fonction de la colonne 4.csv
Axe horizontal (X) : saison
Axe vertical (Y) : Abondance moyenne
Type de représentation graphique : Diagramme en barre
Créer des graphiques différents selon les catégories de la variable : Laisser vide
Changer les couleurs du graphique selon les catégories de la variable : Saison
Ajouter des barres d'erreur à partir d'une colonne : (optionnel) : Erreur.de.la.moyenne
Titre du graphique : Effet de la saison sur l'abondance moyenne des escargots et limaces
Titre de l'axe des X : Laisser vide
Titre de l'axe des Y : Laisser vide

Enregistrez vos commentaires si vous en avez puis sélectionnez faire une analyse statistique.

La différence est plus visible encore qu'avec le tableau. Maintenant, il faut savoir si la différence que l'on observe n'est pas que due au hasard.

5. Test statistique

Nous allons donc faire un test statistique afin de voir si la saison explique la différence observée. Comme nous l'avons déjà expliqué plus haut, la colonne saison est qualitative et la colonne Abondance est quantitative. Il faut donc faire une comparaison de moyenne. Dans cet outil, attention à bien selectionner le jeu de données qui a servi à faire la moyenne (ici il s'agit de Convertir des dates on data 2).

Choisir l'outil : Faire une comparaison de moyenne

Fichier de données brutes : Convertir des dates on data 2 (attention !!!)
Vérifier si la variable explicative (X) : Saison
a un effet sur la variable à expliquer (Y) : Abondance

La variable saison a un effet significatif sur la variable Abondance. Attention, il y a très peu de données en hiver, ce qui explique ce point très différents des autres.

Sélectionnez Enregistrer puis faire une conclusion

6. Conclusion

Je conclue que la saison a un effet sur l'abondance : les escargots et limaces semblent plus nombreux au printemps et en été. Ces résultats sont tout de même à prendre avec des pincettes car les données sont très variables (c'est ce que représentent les grandes barres d'erreur).

7. Rapport

Vous pouvez maintenant télécharger votre rapport au format pdf

Pour aller plus loin

Ce scénario peut-être adapté pour se poser d'autres questions comme calculer la diversité plutôt que l'abondance totale des escargots et limaces (en comptant le nombre de cellules non nulles pour chaque observation).