Fonctions > Analyse des données > Valeurs extrêmes et NaN > Exemple : Détection et suppression NaN
  
Exemple : Détection et suppression NaN
La fonction markNaN permet de repérer les valeurs extrêmes comme des NaN (pas un nombre) dans les jeux de données. Utilisez les fonctions IsNaN, matchNaN et filterNaN pour gérer les NaN.
1. Lisez un fichier contenant le nombre de taches solaires répertoriées au cours des trois derniers siècles et tracez les données correspondantes.
Cliquez pour copier cette expression
Cliquez pour copier cette expression
2. Utilisez la fonction ThreeSigma pour trouver les indices des valeurs extrêmes.
Cliquez pour copier cette expression
Celles-ci correspondent au nombre de taches solaires enregistrées au cours des années suivantes :
Cliquez pour copier cette expression
Cliquez pour copier cette expression
3. Utilisez la fonction markNaN pour marquer comme NaN les valeurs extrêmes dans la colonne 1 des données.
Cliquez pour copier cette expression
Cliquez pour copier cette expression
Le remplacement des données par NaN indique qu'une mesure a été effectuée, mais il est possible de filtrer les lignes contenant des NaN avant le traitement.
4. Utilisez la fonction matchNaN pour trouver les indices des points marqués comme NaN.
Cliquez pour copier cette expression
Les données des lignes 257 et 278 ont été remplacées par la constante intégrée NaN :
5. Utilisez la fonction IsNaN pour vérifier si l'année 1957 a été repérée par NaN dans les jeux Data et MarkedData.
Cliquez pour copier cette expression
Cliquez pour copier cette expression
6. Tracez les nouvelles données et comparez-les aux anciennes.
Cliquez pour copier cette expression
Les valeurs extrêmes provenant du jeu d'origine ne sont pas en surbrillance bleue, car le tracé ignore le NaN enregistré dans le jeu MarkedData.
7. Utilisez la fonction filterNaN pour filtrer la matrice MarkedData définie pour supprimer les lignes contenant NaN.
Cliquez pour copier cette expression
8. Utilisez la fonction rows pour calculer le nombre de lignes dans les jeux Data et FilteredData.
Cliquez pour copier cette expression
Cliquez pour copier cette expression
Le nombre de lignes dans FilteredData a diminué de deux.
9. Utilisez la fonction mean pour calculer la moyenne des jeux MarkedData et FilteredData.
Cliquez pour copier cette expression
Cliquez pour copier cette expression
Il est possible d'établir des statistiques pour le jeu FilteredData, mais pas pour le jeu MarkedData.