Utilisez les fonctions Grubbs, GrubbsClassic, ThreeSigma et boxplot pour trouver les valeurs extrêmes en utilisant trois méthodes différentes de détection de ces valeurs.
1. Définissez un vecteur qui décrit le flux thermique.
2. Tracez les données et la moyenne des données.
Les nuages de points permettent de détecter les valeurs extrêmes potentielles. Cependant, si les valeurs extrêmes ne sont pas importantes et peu fréquentes, elles peuvent être difficiles à détecter. Vous pouvez calculer les données quantitatives afin de déterminer les points qui constituent des valeurs extrêmes.
3. Définissez le niveau de signification.
4. Appelez la fonction Grubbs afin d'identifier les valeurs extrêmes dans le jeu de données.
La première colonne fournit l'indice de chaque point identifié comme une valeur extrême (leur statistique de test dépasse la statistique de test de Grubbs).
La deuxième colonne indique la statistique de test de chaque valeur extrême (la distance entre la valeur extrême et la moyenne, en termes absolus).
La troisième colonne donne la distance entre chaque statistique de test de valeur extrême et la statistique de test de Grubbs.
5. Appelez GrubbsClassic afin de trouver le point unique le plus susceptible d'être une valeur extrême.
Le point dont la valeur d'indice est 19 est le susceptible d'être une valeur extrême. Les colonnes ont la même signification que celles de la matrice renvoyées par la fonction Grubbs.
6. Appelez la fonction ThreeSigma pour trouver les points de données compris dans une région de 3 sigmas.
Tout comme avec la fonction Grubbs, la première colonne fournit les indices et la deuxième indique les statistiques de test des valeurs extrêmes.
La statistique de test de chacun de ces points de données est supérieure à 3.
Lorsque ThreeSigma ne détecte pas de valeur extrême, le point le plus susceptible de constituer une valeur extrême est renvoyé.
7. Appelez la fonction boxplot afin de détecter les valeurs extrêmes selon la méthode d'écart interquartile et de créer une boîte à moustaches permettant de visualiser les valeurs extrêmes.
Quatre valeurs extrêmes ont été détectées à l'aide de la méthode d'écart interquartile.
Vous pouvez également détecter les valeurs extrêmes après avoir ajusté les données à une fonction en utilisant l'analyse résiduelle.