Exemple : Covariance et coefficient de corrélation
Utilisez les fonctions cvar et corr pour mesurer la force de la corrélation entre deux variables et pour vérifier si les données ont une relation linéaire.
1. Examinez les données de tension mesurées en deux points d'un circuit électrique.
2. Tracez les données et la ligne du meilleur ajustement.
3. Calculez la covariance des deux variables.
Tout comme la variance mesure l'écart des données par rapport à leur moyenne, la covariance mesure l'écart marqué simultanément par deux jeux de données par rapport à leurs moyennes respectives.
La covariance est liée à la pente de la ligne du meilleur ajustement comme suit :
Coefficient de corrélation de Pearson
1. Calculez le coefficient de corrélation de Pearson.
Le signe du coefficient de corrélation de Pearson indique la direction de la corrélation. Dans ce cas, le signe négatif de r indique que V1 est inversement proportionnel à V2.
r est compris dans l'intervalle [-1, 1]. Si | r | est proche de 1, il existe donc une corrélation significative. En revanche, si | r | est proche de zéro, la corrélation est faible.
La fonction corr effectue le calcul suivant :
2. Calculez le coefficient de détermination.
Le coefficient de détermination fournit un intervalle égal et une mesure du ratio de la pertinence de la corrélation.
Rang de corrélation de Spearman
La corrélation de Spearman utilise la même formule que celle de Pearson. Elle l'applique cependant aux rangs de données dans chaque jeu de données.
1. Classez les deux jeux de données.
2. Vérifiez la corrélation, en comparant le coefficient de rang de corrélation de Spearman avec celui de Pearson.
◦ Spearman
◦ Pearson
Le coefficient de rang de Spearman est utilisé dans la vérification de l'hypothèse non paramétrique. Autrement dit, on vérifie que la corrélation ne dépend pas de la distribution ou de la forme des données. Il repose sur la formule de Pearson et a les mêmes propriétés (-1 à +1). Contrairement à Pearson, le coefficient de Spearman peut être +1 ou -1, sans données reposant sur une ligne droite.