La fonction markNaN permet de repérer les valeurs extrêmes comme des NaN (pas un nombre) dans les jeux de données. Utilisez les fonctions IsNaN, matchNaN et filterNaN pour gérer les NaN.
1. Lisez un fichier contenant le nombre de taches solaires répertoriées au cours des trois derniers siècles et tracez les données correspondantes.
2. Utilisez la fonction ThreeSigma pour trouver les indices des valeurs extrêmes.
Celles-ci correspondent au nombre de taches solaires enregistrées au cours des années suivantes :
3. Utilisez la fonction markNaN pour marquer comme NaN les valeurs extrêmes dans la colonne 1 des données.
Le remplacement des données par NaN indique qu'une mesure a été effectuée, mais il est possible de filtrer les lignes contenant des NaN avant le traitement.
4. Utilisez la fonction matchNaN pour trouver les indices des points marqués comme NaN.
Les données des lignes 257 et 278 ont été remplacées par la constante intégrée NaN :
5. Utilisez la fonction IsNaN pour vérifier si l'année 1957 a été repérée par NaN dans les jeux Data et MarkedData.
6. Tracez les nouvelles données et comparez-les aux anciennes.
Les valeurs extrêmes provenant du jeu d'origine ne sont pas en surbrillance bleue, car le tracé ignore le NaN enregistré dans le jeu MarkedData.
7. Utilisez la fonction filterNaN pour filtrer la matrice MarkedData définie pour supprimer les lignes contenant NaN.
8. Utilisez la fonction rows pour calculer le nombre de lignes dans les jeux Data et FilteredData.
Le nombre de lignes dans FilteredData a diminué de deux.
9. Utilisez la fonction mean pour calculer la moyenne des jeux MarkedData et FilteredData.
Il est possible d'établir des statistiques pour le jeu FilteredData, mais pas pour le jeu MarkedData.